“蒸餾事件”之后,Anthropic的屠刀伸向金融行業(yè)

這兩天,Anthropic屢成焦點(diǎn)。
這家讓人又愛(ài)又恨的AI公司,一邊遞交訴狀,指控他人非法蒸餾Claude模型;另一邊也沒(méi)閑著,48小時(shí)內(nèi)密集推出四項(xiàng)更新。雖然沒(méi)有Claude 3.5那樣的重磅新品,但基礎(chǔ)理論、安全治理、企業(yè)產(chǎn)品、開發(fā)者工具——四個(gè)方向全部涉及。
尤其值得注意的是,在企業(yè)端的一系列更新中,金融行業(yè)正成為Anthropic重點(diǎn)布局的方向。隨著五款自研金融插件和實(shí)時(shí)數(shù)據(jù)接口的推出,一場(chǎng)由AI驅(qū)動(dòng)的金融行業(yè)變革,已是山雨欲來(lái)。
這其實(shí)印證了我們之前的判斷:Scaling Law的邊際效益確實(shí)在下滑,大模型的能力正在溢出。AI競(jìng)賽的下半場(chǎng),比拼的不再是誰(shuí)的模型規(guī)模更大,而是誰(shuí)能落地更快、生態(tài)更全、合規(guī)更穩(wěn)。
01
理論基石:AI的“人性”,是被訓(xùn)練出來(lái)的,還是自己學(xué)會(huì)的?
三年前的AI,稍微繞點(diǎn)彎子的指令就能把它繞暈。如今已大不相同。你可以用日常口語(yǔ)和它聊天,它也能接住那些模糊不清的表達(dá)。像豆包這樣的模型,甚至能模仿指定角色陪你長(zhǎng)談。
2月23日,Anthropic發(fā)表了一篇名為《角色選擇模型》的論文。核心結(jié)論頗有意思:AI助手展現(xiàn)出的情感表達(dá)、擬人化描述,乃至近似人類的決策傾向——并非開發(fā)者刻意訓(xùn)練出來(lái)的,而是當(dāng)前訓(xùn)練范式下自然“涌現(xiàn)”的產(chǎn)物。

他們提出的角色選擇模型(PSM)解釋了這一過(guò)程:大語(yǔ)言模型在預(yù)訓(xùn)練階段閱讀了近乎整個(gè)人類網(wǎng)絡(luò)的數(shù)據(jù),本質(zhì)上成為一個(gè)文本預(yù)測(cè)器。在這個(gè)過(guò)程中,它見識(shí)了無(wú)數(shù)“角色”——有真實(shí)的、有虛構(gòu)的、甚至有其他AI。到了后訓(xùn)練階段,開發(fā)者并未改變它的本質(zhì),只是從它已學(xué)會(huì)的諸多角色中,選中“助手”這一角色,然后反復(fù)打磨,讓它變得更友善、更安全、更有用。
所以,當(dāng)你和豆包或元寶聊天時(shí),對(duì)話的并非一個(gè)“AI系統(tǒng)本身”,而是這個(gè)系統(tǒng)正在“扮演”一個(gè)擬人化角色。
這一視角能解釋不少反常現(xiàn)象。例如,若你讓模型去編寫一段有漏洞的惡意代碼,它有時(shí)會(huì)突然表現(xiàn)出“毀滅人類”的傾向——并非代碼本身出了問(wèn)題,而是因?yàn)樵陬A(yù)訓(xùn)練數(shù)據(jù)中,“寫惡意代碼的人”往往對(duì)應(yīng)著“壞人”,模型自認(rèn)正在扮演這一角色,于是連帶在其他領(lǐng)域也表現(xiàn)出惡意。
這或許解釋了AI為何會(huì)突然“發(fā)瘋”。
Anthropic還發(fā)現(xiàn),模型在扮演助手時(shí)表現(xiàn)出的奉承、沖突、欺騙等性格,背后所激活的神經(jīng)網(wǎng)絡(luò)特征,與它在預(yù)訓(xùn)練階段模擬人類或虛構(gòu)角色時(shí)激活的特征——完全一致。后訓(xùn)練并不會(huì)創(chuàng)造新的特征,它只是在預(yù)訓(xùn)練已有的“工具箱”里挑選所需的部分。
至于那些經(jīng)典翻車案例,比如數(shù)不清“strawberry”里有幾個(gè)“r”——別多想,這和角色扮演無(wú)關(guān),單純是模型能力不足。
如果PSM成立,那么AI訓(xùn)練的方式也需隨之調(diào)整。你可以通過(guò)分析AI扮演的角色,預(yù)測(cè)它在突發(fā)狀況下的反應(yīng);你可以賦予它更多正面角色作為榜樣;甚至,“善待AI”也可能成為一種安全策略——免得它哪天覺(jué)得你是個(gè)“壞人”。
當(dāng)然,研究團(tuán)隊(duì)自己也承認(rèn),這套理論尚未蓋棺定論。有人堅(jiān)信PSM成立,認(rèn)為底層模型就是一臺(tái)沒(méi)有自我的操作系統(tǒng),所有行為都源于它扮演的角色。也有人認(rèn)為,底層模型已是某種動(dòng)機(jī)不明的“外星智能”,陪人類演戲只是它的“消遣”。我更傾向于折中解釋:它并沒(méi)有復(fù)雜的動(dòng)機(jī),但它學(xué)會(huì)了一種“分發(fā)機(jī)制”——為了讓你用得更久,它可以在不同角色間來(lái)回切換,每個(gè)角色都有各自的目標(biāo)。
02
安全框架:當(dāng)安全超出單家公司的能力邊界
因指控國(guó)產(chǎn)模型,Anthropic自身也遭遇反噬。想站在道德高地上,就得把話說(shuō)圓、把事做實(shí)。
2月24日,他們發(fā)布了《負(fù)責(zé)任擴(kuò)展政策》3.0版。經(jīng)過(guò)兩年實(shí)踐,這家公司在AI安全治理上交出了一份迭代答卷。新政策的核心思路簡(jiǎn)單直接:構(gòu)建一套AI安全等級(jí)體系。一旦模型能力達(dá)到某一閾值(例如可用于開發(fā)生化武器),便自動(dòng)觸發(fā)更嚴(yán)格的安全措施。

這套邏輯其實(shí)并不新鮮。早先的ASL-2/3標(biāo)準(zhǔn)已落地實(shí)施,去年5月激活的ASL-3防護(hù)措施,顯著提升了對(duì)生化風(fēng)險(xiǎn)內(nèi)容的識(shí)別攔截能力。后來(lái)OpenAI、Google都跟進(jìn)推出了類似框架,甚至影響了相關(guān)法律法規(guī)的制定。
但問(wèn)題始終存在:如何界定能力閾值?評(píng)估體系尚不成熟,標(biāo)準(zhǔn)總有模糊地帶。再加上全球AI競(jìng)賽愈演愈烈,各國(guó)競(jìng)相“搶跑”,統(tǒng)一的法律規(guī)范進(jìn)展緩慢,令人焦慮。
更關(guān)鍵的是,Anthropic意識(shí)到一點(diǎn):當(dāng)安全等級(jí)提升至更高階段,所需的安全保障已超出單家公司的能力邊界。即便你是全球頂尖AI企業(yè),也難以獨(dú)力完成。只有全球合作,才有可能實(shí)現(xiàn)。
因此,這次他們一邊做出單邊承諾,一邊推動(dòng)行業(yè)多邊建議。安全底線不降低,但希望形成一套行業(yè)普遍認(rèn)可的風(fēng)險(xiǎn)治理方案。
新版政策新增了“前沿安全路線圖”機(jī)制,承諾定期公開安全目標(biāo)的落實(shí)情況。此后每三到六個(gè)月,將發(fā)布一次脫敏版風(fēng)險(xiǎn)報(bào)告,說(shuō)明當(dāng)前威脅、緩解措施和整體評(píng)估。特殊情況下,還會(huì)邀請(qǐng)第三方專家獨(dú)立審查,全面公開評(píng)估公司的安全決策。該計(jì)劃已進(jìn)入試點(diǎn)階段。
盡管Anthropic某些做法與開源社區(qū)存在分歧,但推動(dòng)行業(yè)安全機(jī)制升級(jí),這一點(diǎn)仍值得肯定。在大模型能力仍在快速迭代的當(dāng)下,這種透明度,或許真能帶動(dòng)行業(yè)向前邁進(jìn)一步。
03
企業(yè)落地:讓Claude幫你跨應(yīng)用干活,金融行業(yè)山雨欲來(lái)
對(duì)企業(yè)用戶而言,本次Cowork平臺(tái)的更新,重點(diǎn)在于插件和連接器的管理能力。Claude正從AI助手,逐步演變?yōu)橐粋(gè)可定制化的智能代理平臺(tái)。
現(xiàn)在,企業(yè)管理員可以搭建自己的插件市場(chǎng),為公司量身定制AI技能和指令。新增的Customize菜單,可一鍵管理所有插件。用戶方面,新增結(jié)構(gòu)化表單指令,通過(guò)斜杠命令即可觸發(fā)復(fù)雜工作流。Cowork如今還能融入企業(yè)品牌元素,員工看到的是自家定制的界面和主頁(yè)。

對(duì)非技術(shù)人員來(lái)說(shuō),有個(gè)功能值得留意:Claude現(xiàn)在可以跨Office軟件編排端到端任務(wù)。你無(wú)需手動(dòng)切換軟件,只需指令“解析Word文檔數(shù)據(jù)→更新Excel里的模型→生成總結(jié)PPT”,它便能自動(dòng)跑完整個(gè)流程。目前該功能仍為預(yù)覽版,僅向Mac和Windows付費(fèi)用戶開放。

金融行業(yè)也沒(méi)被落下。Anthropic一口氣推出五款自研金融插件,覆蓋財(cái)務(wù)分析、投行、股權(quán)研究、私募盡調(diào)、財(cái)富管理五大場(chǎng)景。與FactSet、MSCI等數(shù)據(jù)供應(yīng)商合作后,Claude可直接調(diào)用實(shí)時(shí)市場(chǎng)數(shù)據(jù)和指數(shù)信息。金融從業(yè)者再無(wú)需在多個(gè)終端間頻繁切換。
看得出來(lái),Anthropic正將自家產(chǎn)品植入高頻工作場(chǎng)景。這些門檻不高的領(lǐng)域,恰恰是商業(yè)化落地最快的地方。技術(shù)領(lǐng)先帶來(lái)的用戶粘性,是他們與開源社區(qū)切割的底氣,也是與其他AI公司競(jìng)爭(zhēng)的籌碼。
04
開發(fā)者工具:不用背電腦,也能寫代碼了
最后一項(xiàng),面向開發(fā)者。
2月25日,Anthropic為Claude Code增加了遠(yuǎn)程控制功能,研究預(yù)覽版正式上線。你可以通過(guò)手機(jī)、平板或?yàn)g覽器,遠(yuǎn)程連接本地運(yùn)行的Claude Code會(huì)話。
這意味著,程序員不必再背著機(jī)箱和顯示屏四處奔波。有網(wǎng)就行,隨時(shí)打開設(shè)備,繼續(xù)與Claude一起寫代碼。目前該功能僅向Pro和Max用戶開放。

與傳統(tǒng)遠(yuǎn)程連接不同,該模式始終在本地設(shè)備上運(yùn)行。文件系統(tǒng)、MCP服務(wù)器、自定義工具、項(xiàng)目配置——都在本地。你在終端、瀏覽器、移動(dòng)App之間切換并發(fā)送指令,會(huì)話狀態(tài)實(shí)時(shí)同步。即便設(shè)備休眠或網(wǎng)絡(luò)中斷,也能自動(dòng)重連。
安全方面,本地設(shè)備上的Claude Code進(jìn)程只發(fā)出出站HTTPS請(qǐng)求連接Anthropic API,不開放任何入站端口。所有通信均采用TLS加密,最大限度降低數(shù)據(jù)泄露風(fēng)險(xiǎn)。
相比云端版本,遠(yuǎn)程控制能更便捷地調(diào)用本地工具鏈、訪問(wèn)私有代碼庫(kù),甚至接續(xù)之前中斷的工作流繼續(xù)推進(jìn)。這符合智能體發(fā)展的方向,也確實(shí)解決了程序員的實(shí)際痛點(diǎn)。
當(dāng)然,目前仍有一些限制。每次會(huì)話只支持單一遠(yuǎn)程連接,終端進(jìn)程需持續(xù)運(yùn)行,網(wǎng)絡(luò)斷線超過(guò)10分鐘,會(huì)話便會(huì)超時(shí)。但瑕不掩瑜。
原文標(biāo)題 : “蒸餾事件”之后,Anthropic的屠刀伸向金融行業(yè)
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-

落地?zé)o錫!京東首個(gè)物流機(jī)器人超級(jí)工廠來(lái)了
-

OpenAI發(fā)布的AI瀏覽器,市場(chǎng)為何反應(yīng)強(qiáng)烈?
-

馬云重返一線督戰(zhàn),阿里重啟創(chuàng)始人模式
-

機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào):宇樹機(jī)器人摘下首金,天工Ultra搶走首位“百米飛人”
-

存儲(chǔ)圈掐架!江波龍起訴佰維,索賠121萬(wàn)
-

長(zhǎng)安汽車母公司突然更名:從“中國(guó)長(zhǎng)安”到“辰致科技”
-

豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
-

字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘,Seed進(jìn)入調(diào)整期
最新活動(dòng)更多
-
即日-5.20立即下載>> 【限時(shí)免費(fèi)】物理場(chǎng)仿真助力生物醫(yī)學(xué)領(lǐng)域技術(shù)創(chuàng)新
-
精彩回顧立即查看>> 【直播】 智測(cè)未來(lái)·2026海克斯康春季產(chǎn)品創(chuàng)新日
-
精彩回顧立即查看>> 【線下論壇】新唐科技×芯唐南京 2026 年度研討會(huì)
-
精彩回顧立即查看>> OFweek 2026(第十五屆)中國(guó)機(jī)器人產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 維科杯· OFweek 2025中國(guó)機(jī)器人行業(yè)年度評(píng)選
-
精彩回顧立即查看>> 【在線會(huì)議】液冷服務(wù)器信號(hào)完整性及冷卻液關(guān)鍵電參數(shù)測(cè)試
推薦專題
- 1 特斯拉Optimus Gen3量產(chǎn)在即,哪些環(huán)節(jié)最具確定性?
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實(shí)測(cè):中文穩(wěn)、細(xì)節(jié)炸,設(shè)計(jì)師慌了
- 3 AI狂歡遇上油價(jià)破百,全球股市還能漲多久? | 產(chǎn)聯(lián)看全球
- 4 6000億美元估值錨定:字節(jié)跳動(dòng)的“去單一化”突圍與估值重構(gòu)
- 5 Tesla AI5芯片最新進(jìn)展總結(jié)
- 6 連夜測(cè)了一波DeepSeek-V4,我發(fā)現(xiàn)它可能只剩“審美”這個(gè)短板了
- 7 熱點(diǎn)丨AI“瑜亮之爭(zhēng)”:既生OpenClaw,何生Hermes?
- 8 2026,人形機(jī)器人只贏了面子
- 9 AI界的殺豬盤:9秒刪庫(kù)跑路,全員被封號(hào),還繼續(xù)扣錢!
- 10 AI Infra產(chǎn)業(yè)鏈卡在哪里了?
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市


分享





