金融業需要什么樣的大模型?
導語:通用大模型走向行業大模型的適配之戰。
出品丨數科社
作者丨林木
電影《奧本海默》里有句臺詞:(原子彈)不是一種新武器,而是一個新世界。這句話用來形容過去一年大模型的“爆炸”發展再恰當不過。
自ChatGPT發布以來,大模型成為整個人工智能的新底座,激起了新一波技術革命浪潮。在不到一年的時間里,通用大模型的爆發開始席卷各行各業,金融業作為數字化需求強烈的數據密集型行業,成為大模型率先落地發力的最優場景之一。
這個9月,金融大模型翻涌的海浪上又多了兩個重量級新玩家。
9月8日,螞蟻集團在上海外灘大會發布了工業級金融大模型(AntFinGLM),同時推出了兩個配合模型層的產業應用“支小寶”和“支小助”。12天后,同在上海,華為首發了包括AI for Data、AI for Business、AI for IT三大類10個場景的金融大模型方案。
隨著金融業新世界的大門開啟,金融、科技巨頭們不斷涌入,一場從通用大模型走向行業大模型的適配之戰也隨之打響。
金融業到底需要什么樣的大模型?通用大模型從通識階段走向專識階段,又將面臨著哪些挑戰?
01丨一個認知能力的引擎
近年來,擁抱數字化和新技術一直是金融行業反復強調和推動的重要命題。
某種角度來看,金融是一個特殊的信息處理行業,因而隨之信息技術的快速更迭,金融領域所涉及到的功能、要素、產品和市場也會發生內在潛移默化的改變。
回顧過去十年的行業發展軌跡,互聯網金融的出現,讓辨別式AI在智能營銷、智能風控、智能投研、智能客服等金融領域落地生花。基于機器學習驅動的建模能力不斷賦能金融產業鏈的變革與創新,同時也為人工智能的滲透融入打下根基。
金融業對大模型并不陌生,生成式AI的橫空出世,意味著行業新一輪AI革命浪潮已經到來。
“大模型已經不單單是一個知識的容器,它更成為一個認知能力的引擎。”9月8日,復旦大學教授、博導、上海市數據科學重點實驗室主任肖仰華在外灘大會上,分享了對于通用大模型在適配和優化層面的思考。
肖仰華表示,今天的大模型已經非常擅長解決以前人工智能會碰壁的語言理解等常識類問題,甚至還具備了一定的自識反思能力和泛化組合能力,“我們不僅僅把大模型當做一個某類數據處理的基礎模型,已經把它當作未來適應復雜環境的自治智能體的一個大佬。”
在他看來,這些能力恰恰是行業的認知所需要的,今天一個通用語料訓練出來的大模型,已經成為行業垂語認知的一個重要基座。如金融領域的智能解決方案,過往思路是收集整個行業的數據來構建,整個關注點仍在于行業數據和知識,但大模型卻是顛覆了這一認知。
肖仰華以醫生診斷疾病舉例,一個醫生想勝任他的工作,首先要認知什么是健康,“我們發現其實行業的很多問題恰恰是建立在通用的認知能力基礎上。”因此他認為大模型亦是如此,通用認知的理解非常重要,沒有通識能力,是不可能發展出專業認知能力的。
當下已由感知智能轉換到認知智能的大模型顯然已具備了這一條件。相比以識別能力為主的傳統AI模型,生成式AI的認知智能體現在理解、分析和決策三個維度上。
比如,它可以通過前文來預測下一個詞語,對文本中不同的詞語賦予不同的權重值,能夠在生成文本時綜合考慮到文本中的上下文關系,生成更連貫、合理的文本,賦予了其內容生產能力。這就注定了其會在智能交互環節大放異彩。
此外,生成式AI還可以從已有數據中學習樣本的統計特征,并在此基礎上生成新的數據,這種增強學習的過程,對于金融領域的智能投顧、風險控制等都無異于一種新的驅動力。
數據訓練是大模型提升性能不可或缺的重要一環,OpenAI 團隊所提出的大模型遵循的“伸縮法則”指出,當參數規模增加、數據集規模增加并延長模型訓練時間,大模型的性能就會提升,并且如不受其他兩個因素制約時,大模型性能與每個單獨的因素都呈現冪律關系。
作為數據密集型行業,金融業沉淀了如金融交易數據、客戶信息、市場分析、風控數據等海量數據,又催生出大量高效處理的技術需求。因此,大模型落地金融業,無疑是一場雙向奔赴。
02丨還有“最后一公里”要走
盡管大模型的問世帶給諸多行業巨大的想象空間,但當下對于金融業而言,通用大模型拿來就可用嗎?答案顯示是否定的。
在肖仰華看來,金融領域的本質是一類復雜決策,遠遠比開放閑聊的任務要困難得多,“你會發現通用模型里面的專業知識是遠遠不夠的,通用大模型好比是一個夯實的知識底座,寬廣有余,但縱深不足。”
除了專業力上的欠缺,肖仰華還提到一個非常值得關注的問題,即大模型“幻覺”——指大模型在生產內容的過程中,可能會由于訓練語料及模型的原因,產生事實性的錯誤。
“行業中經常是希望大模型按照給出的規范、制度、文檔回答問題,而不是從通用領域習得的知識回答問題,從技術上是叫Closed QA,而不是Open QA。”他認為,正是因為大模型擅長發揮創造,就很有可能跳出給定的內容去胡編亂造,缺乏領域的忠實度。
當下來看,這種“幻覺”無疑是通用大模型落地部分行業的障礙之一,尤其像數據敏感度較高的金融領域。
為了解決這一問題,OpenAI采取的做法是通過加強遷移學習和對抗訓練,以提高回答的準確性和靠程度,GPT-4的內容準確性比GPT-3.5已增高了40%。而行業中的常見方法是通過對模型進行領域知識的微調,利用更加精確的數據來糾正模型的偏差,也就是構建垂直領域模型。
肖仰華給出的應對思路在于注重大模型和相關技術的協同。他表示,在大模型協助下,行業中很多任務被分成提示、生成、評估三個子任務,大模型主要在生成階段發力,而在提示和評估階段,仍有很多傳統系統發揮價值的余地。
譬如知識圖譜技術,圖譜中的知識往往擅長表達的是專業知識、私密知識,和可理解、可控的符號知識,它和大模型所表達的恰成一種緊密的互補關系。利用知識圖譜做事后評測、驗證以及增強提示,可以進一步改善大模型的“幻覺”問題。
這種應對思路在當前一些重量級金融大模型身上已然被驗證,如螞蟻的金融科技團隊過去幾年在構建金融知識圖譜上做了大量投入。
以支小寶團隊為例,首先基于一些研報、新聞、大V資訊以及高質量權威合作數據源和數據庫,通過合作的專家,對于領域專業知識進行了提煉和萃取,形成了一個標準化基礎知識層。然后算法工程師再在此基礎上做關聯和整合,嘗試建構金融現象之間的因果邏輯,最終匹配金融專業要求的知識圖譜得以形成。
肖仰華表示,要把通用大模型的適配和優化當成一個系統工程,從數據層面、知識層面、架構層面、評估評測層面、生態體系等各個方面去尋找思路解決問題,“我們仍然有漫長的路要走,才能走完這最后的一公里。”
03丨風起云涌的適配之戰
眼下,大模型從通識階段走向專識階段才剛剛邁出一小步,這個落地過程必然少不了金融機構與金融科技巨頭的涌入、實踐和推動。
目前來看,大模型技術發展先行一步的海外市場,從金融垂類大模型的構建,到將如信息管理、智能推薦、 細分領域問答等各個金融場景的應用,已有多個成功落地賦能行業的案例。
作為首個金融垂類大模型,BloombergGPT在3月的發布,為金融大模型的適配之戰打響了第一槍。國際金融服務巨頭Morgan Stanley(摩根士丹利)和 OpenAI 合作推出了一款基于 GPT-4 技術的聊天機器人,并利用該機器人管理其面向客戶的龐大知識庫。
在智能投顧領域, OpenAI 向 ChatGPT Plus 用戶開放的用于投資的第三方插Portfolio Pilot,能幫助用戶更加清晰的了解自己的投資組合,并獲得投資建議。Broadridge 子公司 LTX 推出的 BondGPT,能幫助客戶回答各種與債券相關的問題,還能根據特定數據篩選輸出可視化圖表。
回過頭再來看開啟“千模大戰”的國內市場,在金融大模型的落地腳步同樣響應迅速。半年時間,一眾傳統金融機構、金融科技巨頭和互聯網大廠紛紛躬身入局。相關統計數據顯示,目前國內參數在10億規模以上的大模型數量已有116個,其中金融行業大模型約18個。
從模型訓練的參數量來看,國內不乏一些“千億級”玩家:度小滿開源的軒轅大模型,在1760億參數的Bloom大模型基礎上訓練而來;恒生電子的Light-GPT利用了超過4000億個Token的金融領域數據;螞蟻金融大模型囊括的金融語料更是超過了5000億。
互聯網大廠與金融科技巨頭多深耕人工智能領域已久,在技術落地應用上無疑占據著先發優勢,如自帶“安全基因”的螞蟻和360,在對抗黑灰產和可信AI研究領域有著多年經驗和投入。
奇富科技的大模型奇富GPT剛剛嶄露頭角,已經迅速應用到獲客、運營、風控、貸后服務等業務環節,并已經有兩個獲得數據收效的落地應用:在營銷層面,經過大模型陪練機器人的幫助,奇富科技的電銷系統通話時長提升了15.1%;在營銷內容生成方面,大模型應用在營銷素材方面后,奇富科技的客戶觸達規模提升了21.4%。?
此外,也有像華為、馬上消費、星環科技這種“另辟蹊徑”布局金融領域大模型的玩家。華為依托于盤古大模型,以金融級PaaS解決方案的方式切入金融場景;馬上消費的天鏡大模型則憑借著“三縱三橫”技術布局扎根金融行業全鏈路;數據庫廠商星環科技在自研金融大模型“無涯Infinity”的同時,還提供了一站式的企業自建大語言模型工具鏈,嘗試兩條腿并行。
9月19日,國內首個金融行業大模型標準在南京正式發布。該標準由中國信通院牽頭,聯合騰訊云、奇富科技、科大訊飛等四十多家企業共同編制,不僅涵蓋了金融大模型的關鍵能力要求,還詳細規定了其在數據合規性、可追溯性、私有化部署、風險控制等方面的要求。
不難看出,在政策加持和企業助推之下,金融大模型的適配之路越發明朗,正從一小步變成一大步。
原文標題 : 螞蟻 奇富科技 馬上消費紛紛入局,金融業需要什么樣的大模型?
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
- 1 AI狂歡遇上油價破百,全球股市還能漲多久? | 產聯看全球
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實測:中文穩、細節炸,設計師慌了
- 3 6000億美元估值錨定:字節跳動的“去單一化”突圍與估值重構
- 4 Tesla AI5芯片最新進展總結
- 5 連夜測了一波DeepSeek-V4,我發現它可能只剩“審美”這個短板了
- 6 熱點丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 7 AI界的殺豬盤:9秒刪庫跑路,全員被封號,還繼續扣錢!
- 8 2026,人形機器人只贏了面子
- 9 DeepSeek降價90%:價格屠夫不是身份,是戰略
- 10 AI Infra產業鏈卡在哪里了?


分享













