互聯網IDC圈12月8日報道:“無意苦爭春,一任群芳妒”,冬天將至,梅花也將開。在互聯網金融行業即將迎來的一輪“寒冬”中,怎樣的孤梅才可傲雪綻放?才可在群芳中獨立枝頭?
成都創新互聯公司專注于企業成都營銷網站建設、網站重做改版、永靖網站定制設計、自適應品牌網站建設、成都h5網站建設、電子商務商城網站建設、集團公司官網建設、成都外貿網站制作、高端網站制作、響應式網頁設計等建站業務,價格優惠性價比高,為永靖等各大城市提供網站開發制作服務。在寫下這段話時,網易郵箱數據泄露事件成為了新聞排行榜中的最熱門話題,關于用戶信息安全、互聯網企業基本操守的討論再度淪為眾矢之的。而伴隨著這一年頻頻出現的P2P跑路現象,互聯網金融行業的風險問題也被提上國家議程。之于互聯網金融信用風險該如何防范或規避,怎樣建立一套獨立、有效、精準的征信系統,來自現下技術水平的答案或許是“大數據”。那么,大數據在互聯網金融領域該如何更好地應用,具有哪些潛藏價值以及如何發現其價值,本刊為此專訪了普惠金融信息服務(上海)有限公司(下稱“普惠金融”)首席數據科學家李文哲博士,以期捕捉大數據風控背后所蘊含的一些創新之道。
大數據在國內的應用空間很大,
業務需求決定數據“出路”
曾在美國從事機器學習研究的李文哲回到國內后首先發現,中國并不具備較為完備的征信體系,互聯網金融開展的難題多在于P2P公司無法完全憑借外部數據評估并授信交易方,并且缺乏建立精準數據庫以勾勒用戶的真實畫像的出色技術或能力。但同時,中國的大批個人用戶及中小企業用戶卻有著強烈的貸款或理財需求,據預測,中國互聯網金融的總規模有望達到70萬億,其需求總量指數性的增長態勢不像美國的線性增長已趨近于穩定。因此,李文哲相信,未來一段時間內,大數據在國內金融領域,尤其在互聯網金融的應用空間將會比美國更為寬廣。再加上“普惠金融”用技術改造整個互聯網金融的堅定使命和追求,李文哲毅然選擇加入這支隊伍,共同譜寫大數據風控領域的宏壯樂章。
據“普惠金融”此前發布的信審數據庫統計顯示,國內平均每100個拒貸案件中,就有16起涉及不同程度的蓄意造假或欺騙,其中既包括欺詐團伙、虛假個人又包括一批代包裝公司。因而,面對層出不窮的欺詐行為且瞬息萬變的金融環境,互聯網金融公司的核心任務之一就在于運用大數據技術識別并排除這類金融風險,建立并健全風險定價體系,不斷更新并完善反欺詐系統。
成立一年后,“普惠金融”于去年年中正式開始研發基于自身業務的大數據風控技術。李文哲認為,大數據價值的挖掘工作主要是從業務需求出發,但又要跳脫現有的業務層面看得更遠。團隊內部每周一次的 “空談”和不定期地與金融方的溝通合作,既推動其大數據風控技術不斷進步,又促進著“普惠金融”創新業務類型的日增月盛。這是一個良性循環的過程。在互聯網金融行業同樣致力于創新的北京共鳴時代科技有限公司(下稱“共鳴科技”)CEO陸雨泉也持此觀點。他認為,“數據應服務于業務,從業務的需求去開發數據,基于新的業務需求提煉舊有數據中的潛在作用和價值,數據才能與業務共生共榮。”
互聯網金融的大數據有別于其他行業,“去噪音”是關鍵
為了提升企業的風控能力,打造更為安全的交易平臺,互聯網金融公司往往會通過多種渠道收集非常龐雜的各類數據信息。例如,“普惠金融”的數據來源主要分為四大方向:一是用戶直接提供的相對傳統的各類個人基本信息、金融信息或社交信息;二是用戶授權的信息,這類信息有助于技術團隊從個人的行為模式出發構建個人的狀態或模型;三是從第三方征信機構引入的數據;四是通過垂直搜索獲取并歸納的信息,即公共平臺的公共數據。
但是,數據越多越雜并不意味著對風險控制、產品定價、技術創新越有利。李文哲認為,大數據在互聯網金融領域最直觀的一個特征就是“非結構化”。目前,“普惠金融”用于風控的大數據中,90%以上為非結構化數據。無論是從用戶方捕捉到的文本、圖片、音、視頻還是其行為數據等,都需要投入大批技術人才進行深度分析,將其處理為結構化的數據,轉換成能供決策中直接使用的決策變量或具體模型,也就是所謂的“去噪音、降噪化”。因此,互聯網金融的大數據首先要滿足時間維度和質量維度的需要(足夠的存在時長并足夠有效),其次才是規模維度上的訴求。數據越多,其中的噪音就可能越大,提煉降噪后加強各數據之間的連接度才是解決大數據問題的根本。正如“共鳴科技”CEO陸雨泉所說:“基礎技術模塊中除了數據獲取,更重要的是數據處理效率、結構優化,而且在這些方面的要求會遠高于其他行業的IT要求,因此對技術人員的理解能力和邏輯思維能力也提出更嚴格的考驗。”
所以,數據的價值只有在對的時間對的用途被對的方式挖掘出來,才能在互聯網金融的反欺詐、風控、貸后管理、精準營銷等各個環節產生基礎效應。在保證開發效率的前提下,為了使大數據分析工具盡可能地在每個應用層上釋放其大潛能,使其分析結果與業務流程大程度契合,“普惠金融”團隊提倡將國際先進的開源數據工具,與自主研發的大數據商業智能系統和風控系統有機結合,構成基于自身業務特點的高效分析系統。而“共鳴科技”則傾向于采用比較成熟的商業化數據分析工具,從對不同客戶的數據分析出發以類推同一社群用戶的共性,以此提煉、制定相應的解決措施或應用方案。例如,針對違約客戶的分析得出不好的客戶共性且不斷地對模型進行優化,或可避免進一步的欺詐風險。
“艷壓群芳”之力:保證進到自己盤子里的都是優質資產
正是因為大數據的使用,原先的人工審核流程轉而由機器與第三方數據庫進行對應、檢驗并給予用戶實時授信,在審查效率、精準度和風險控制方面都實現了質的飛躍。李文哲認為,除了深度解放人力,提升效率之外,大數據在提升借貸兩端的核心競爭力、促使金融平臺更好地挖掘貸款方優質資產、識別音、視頻客戶信息真實程度等幾個方面,也具有長足推動力。另一方面,隨著互聯網金融市場的“百花齊放”,P2P平臺的獲客成本兩年翻三番,人均已上升至數百元。于是,將自身平臺嵌入到更加多元化的場景之下提供客戶服務,針對潛在用戶群擬定跨界營銷方案,成了互聯網金融“性價比”較高的獲客方式。而這一切的基礎依然是大數據。
在風控方面,“普惠金融”團隊也做了創新性的嘗試, 例如將現有數據源進行系統性整合,從而構建龐大的關系圖譜, 并基于該圖譜實現關系的分析和推理。 該圖譜可以直接應用于反欺詐、貸后催收和智能搜索等系統上。
毋庸置疑,構建越龐大且真實有效的數據庫,對資金端或理財端的客戶都是更安全的一層保障。那么與之相對應,當風控的引流入口縮小,對于優質資產的考評標準提升,用戶借貸款的難度也會有所增加。不過,在“普惠金融”李文哲看來,真正的金融互聯網化其長遠目標就應是追求質量上的優勢,而非規模或業務量上的盲目擴張。只有當自己盤子里的都是優質資產,并能更為謹慎且踏實地發展理財業務,給用戶更為放心的體驗時,才有機會在“百花齊放”的今天“艷壓群芳”。即使是互聯網金融市場的寒冬不期而至,“普惠金融”也能憑借這份真心抵御“冬雪”,甚至獨立枝頭。
當然,大數據的構建工作對企業的條件和素質也提出不小的考驗。在現如今中國金融市場的背景下,企業引入大數據的大障礙就是缺乏頂尖人才。原因之一在于數據分析能力直接決定著最終數據的價值,行業門檻相對較高;之二在于中國高校在這方面的教育目前明顯落后于歐美發達國家。而“普惠金融”在人才招募以及精英團隊組建方面一直做著苦功。除了會去美國金融市場、中國頂尖高校挖掘專家及學者外,由李文哲帶領的技術團隊也一直保持著內部“找靈感”、外部“碰火花”的方式和做法。對他而言,大數據在互聯網金融行業就如同一個開放的謎題,沒有正確答案,只有無止境地創新。因為大家的目標并不為喊口號,而是想把大數據基礎真正應用在“普惠金融”的每個業務環節上,使大數據技術成為企業的領先優勢及大競爭力。
標題名稱:大數據在國內的應用空間很大人才卻很少
網站地址:http://vcdvsql.cn/article30/sohspo.html
成都網站建設公司_創新互聯,為您提供小程序開發、網站策劃、Google、靜態網站、網站設計、外貿建站
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯