國泰金控成為2019臺灣資料工程年會最大合作夥伴。
記者陳建興/台北報導
2019臺灣資料工程年會(Data Conference Taiwan,DataCon.TW)今(6)舉行,國泰金控數位數據暨科技發展中心(簡稱數數發中心)不僅成為最大合作夥伴,且是唯一的金融業者,更罕見地透過科技金融業少有的技術與實作,用真實案例與研發內容與現場逾500名業界人士現場交流。數數發中心資料科學實驗室(Lab)也發表兩篇技術專題,展示國泰金控兼顧場景應用及技術研發,並為廣大資料科學工程與分析人才開闢全新職涯戰場!
國泰金控數數發中心梁明喬協理於2019臺灣資料工程年會發表專題演講,暢談國泰金控三年來的數位轉型歷程。
由臺灣資料工程協會(Taiwan Data Engineering Association,TDEA)主辦的資料工程年會,向來是資料工程、資料架構、資料科學業界年度盛事,提供臺灣大數據相關框架的開發者有更多參與社群以及交流技術的機會,每年都吸引數百名學界與業界人士。年會今年邁入第11年,除了以「開發、營運、應用」三個主題分軌進行專題講座,國泰金控數數發中心協理梁明喬也受邀,暢談國泰金控三年來的數位轉型歷程,如何透過數數發中心發展資料收集、資料工程、數據分析、數據平台等多元面向,建構大數據架構及自動化平台,並透過與子公司密切合作,逐步建立數據文化與共識,並在提升客戶體驗、增進營運效能、協助商業決策、開發新型態商品與商業模式、有效管理風險等面向建立「數據驅動文化」,讓國泰邁大步、破大浪,推動數位轉型。
梁明喬指出,國泰運用關鍵「F.A.S.T.」策略來尋求突破。首先就是國泰建構彈性(Flexibility)數據架構,以全面思維建構適用全集團的數據流與分析應用框架,同時具備可擴充性。接著就是敏捷(Agile)團隊的建立,數數發中心現在已經有超過450位背景多元的同仁,打破職級跟部門藩籬,以任務為導向來推動專案,透過快速驗證、即時回應,並且融入各種場景(Scenario)與業務結合,才更能發揮數據效能。最後則是心態的轉變,藉由日常實踐,具備信任(Trust)數據的思維,擁抱數位浪潮。
國泰金控資料科學實驗室(Lab)也發表兩篇分別為工程營運跟分析應用的技術專題,顯示國泰重視技術研發及創新。國泰自行開發一款便利的ETL工具-MOLE,以解決數據工程師在處理ETL太過複雜、耗費精力的問題,甚至也可以讓傳統工程師或分析人員,在不用學習 Scala 以及 Spark 的情況下,只要熟悉 SQL statement 就可以透過簡單的設定,來進行分散式大數據運算。這個建置於Spark分散式系統基礎上的工具,具備「可以加速開發ETL的時間」,「提供驗證機制做好資料品質控管」、「在多種資料庫中傳導資料」等三大特色,透過模組化方式讓工程師更容易抓取資料,節省寶貴時間。
而在國泰世華銀行「客服進線預測」的專案中,必須優化預測模型,更準確預測客戶進線問題。資料科學實驗室、數據團隊、業務單位共同合作並且大膽創新,採用「客戶歷程資料」作為模型分析的主要資料來源,並運用無時間延遲性的訓練資料集來做模型訓練,將客戶行為的人事時地物串聯成序列,創造客製化變數,最後透過串流資料服務框架以達到即時預測。模型架構上,採用自然語言處理(Natural Language Processing,NLP)的Attention Mechanism來做深度學習模型,從模型評估指價AUC(area under the curve)來看,準確率有顯著提升。
國泰金控數數發中心重視金融與科技人才發揮專業、追求突破的渴望,整合集團資源打造適合跨界新型態人才的環境,國泰金控擁有1,300多萬客戶,讓資料科學及商業分析人才擁有生活化且充足的資料量運用,同時投注相當的資源與人力於資料科學的分析與工程技術研發,隨時追蹤並掌握全球最新的資料科學學術理論與實務技術,利用各種開放原始碼的工具來幫助關鍵技術的創新,確保研發動能,創造更多金融多元應用服務。