誰(shuí)在橢圓形辦公室發(fā)推:機(jī)器學(xué)習(xí)揭露川普推文的真實(shí)作者
一個(gè)小游戲
讓我們玩一個(gè)小游戲。我會(huì)提供一條推特,你來(lái)猜猜作者是誰(shuí)?
別向下滾動(dòng)太多,以免不小心看到答案!現(xiàn)在是第一條;誰(shuí)寫的,川普還是他的一個(gè)助手?
這條比較簡(jiǎn)單。這條推文使用了單詞“via”,明顯指示了這是助手所發(fā)。它包含一個(gè)鏈接,另一個(gè)助手發(fā)推的跡象。它是在一天中午發(fā)布的,它很正式,不帶感情:一切都指向助手。
是的,你猜對(duì)了,這條推是助手所發(fā)!好,再來(lái)一條:
這是川普所發(fā),還是助手所發(fā)?同樣,讓我們綜合一切跡象。這一條推文包含了更多感情,通常這是川普的標(biāo)記。推文里有一個(gè)感嘆號(hào):這是川普的調(diào)調(diào)。記得換算時(shí)間,時(shí)間是6:30pm,工作日差不多結(jié)束了。所以,我們可以自信地猜測(cè)這條推文的作者是……
川普!是的,又猜對(duì)了!
關(guān)于弗林的推文
下面是一條重磅推文,整個(gè)項(xiàng)目就是因這條推文而起:
這條推文發(fā)布于2017年3月26日之后,如果你沒(méi)忘記的話,這意味著這條推文沒(méi)有真正發(fā)布者的標(biāo)簽。只能寄希望于我的模型了。事實(shí)上,這條推文的作者不怎么好猜。它包含“l(fā)ied”、“guilty”、“shame”、“hide”這樣飽含感情的單詞——這可能顯示川普是作者。另一方面,它又比較正式;語(yǔ)法很規(guī)整,同時(shí)包含一些超過(guò)平均長(zhǎng)度的單詞:這些又是助手代筆的跡象。它是在中午時(shí)刻發(fā)布的,又一個(gè)助手代筆的暗示。但它又很個(gè)人化,暗示是川普。那么我們的模型怎么看?
rf [ 0.23884372 0.76115628]ab [ 0.49269671 0.50730329]gb [ 0.1271846 0.8728154]knn [ 0.71428571 0.28571429]nb [ 0.11928973 0.88071027]gnb [ 0.9265792 0.0734208]lr [ 0.35540594 0.64459406]rf [1]ab [1]gb [1]knn [0]nb [1]gnb [0]svc [1]svm [0]lr [1]([1], [ 0.15384615, 0.84615385])
“rf”代表隨機(jī)森林,它預(yù)測(cè)1,也就是川普,概率為76%(前7行顯示概率,第一項(xiàng)為助手,第二項(xiàng)為川普;接下來(lái)9行顯示預(yù)測(cè):0表示助手,1表示川普)。“ab”是AdaBoost,同樣預(yù)測(cè)川普,但是概率是51%對(duì)49%——一點(diǎn)也不自信。梯度提升模型更自信,87%的可能是川普。不過(guò)KNN并不贊同:71%的可能是助手。多項(xiàng)樸素貝葉斯預(yù)測(cè)川普,高斯樸素貝葉斯卻預(yù)測(cè)助手。兩種支持向量機(jī)器模型的意見(jiàn)也不一樣:SVC預(yù)測(cè)川普,SVM預(yù)測(cè)助手(由于這兩個(gè)模型構(gòu)建的方式,它們無(wú)法輸出概率估計(jì),這是上半部分不包括它們的原因)。邏輯回歸比較中庸,64%的可能是川普,36%的可能是助手。也就是說(shuō),6個(gè)模型預(yù)測(cè)川普,3個(gè)模型預(yù)測(cè)助手。
事實(shí)上,在花費(fèi)數(shù)周事件閱讀和分析數(shù)以千計(jì)的川普推文之后,我認(rèn)為這條推文是一個(gè)協(xié)作撰寫的最佳樣本。從主題和情感的角度分析,它是100%的川普式推文。但從風(fēng)格和語(yǔ)法的角度分析,它看起來(lái)又像是來(lái)自一個(gè)助手。在我看來(lái),川普大概和多德一起起草了這條推文。川普告訴多德他想說(shuō)什么,他想怎么說(shuō),然后多德實(shí)際編寫了推文。這是我的最佳猜測(cè)。
這顯示了這些模型并不是完美的,有不少不一致的地方;同時(shí)推文包含的信息對(duì)訓(xùn)練機(jī)器學(xué)習(xí)模型而言太少了。我最終的集成模型,在測(cè)試集上達(dá)到99%精確度的決策樹(shù),給出的最終預(yù)測(cè)是川普,概率為85%(上面的代碼中的最后一行)。所以這就是我們最終的答案:川普。不是約翰·多德,川普的律師。所以他們聲稱是多德而不是川普寫了那條推文,我們只能設(shè)想這是:
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-

落地?zé)o錫!京東首個(gè)物流機(jī)器人超級(jí)工廠來(lái)了
-

OpenAI發(fā)布的AI瀏覽器,市場(chǎng)為何反應(yīng)強(qiáng)烈?
-

馬云重返一線督戰(zhàn),阿里重啟創(chuàng)始人模式
-

機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào):宇樹(shù)機(jī)器人摘下首金,天工Ultra搶走首位“百米飛人”
-

存儲(chǔ)圈掐架!江波龍起訴佰維,索賠121萬(wàn)
-

長(zhǎng)安汽車母公司突然更名:從“中國(guó)長(zhǎng)安”到“辰致科技”
-

豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
-

字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘,Seed進(jìn)入調(diào)整期
最新活動(dòng)更多
-
即日-5.20立即下載>> 【限時(shí)免費(fèi)】物理場(chǎng)仿真助力生物醫(yī)學(xué)領(lǐng)域技術(shù)創(chuàng)新
-
精彩回顧立即查看>> 【直播】 智測(cè)未來(lái)·2026海克斯康春季產(chǎn)品創(chuàng)新日
-
精彩回顧立即查看>> 【線下論壇】新唐科技×芯唐南京 2026 年度研討會(huì)
-
精彩回顧立即查看>> OFweek 2026(第十五屆)中國(guó)機(jī)器人產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 維科杯· OFweek 2025中國(guó)機(jī)器人行業(yè)年度評(píng)選
-
精彩回顧立即查看>> 【在線會(huì)議】液冷服務(wù)器信號(hào)完整性及冷卻液關(guān)鍵電參數(shù)測(cè)試
推薦專題
- 1 AI狂歡遇上油價(jià)破百,全球股市還能漲多久? | 產(chǎn)聯(lián)看全球
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實(shí)測(cè):中文穩(wěn)、細(xì)節(jié)炸,設(shè)計(jì)師慌了
- 3 6000億美元估值錨定:字節(jié)跳動(dòng)的“去單一化”突圍與估值重構(gòu)
- 4 Tesla AI5芯片最新進(jìn)展總結(jié)
- 5 連夜測(cè)了一波DeepSeek-V4,我發(fā)現(xiàn)它可能只剩“審美”這個(gè)短板了
- 6 熱點(diǎn)丨AI“瑜亮之爭(zhēng)”:既生OpenClaw,何生Hermes?
- 7 AI界的殺豬盤:9秒刪庫(kù)跑路,全員被封號(hào),還繼續(xù)扣錢!
- 8 2026,人形機(jī)器人只贏了面子
- 9 DeepSeek降價(jià)90%:價(jià)格屠夫不是身份,是戰(zhàn)略
- 10 AI Infra產(chǎn)業(yè)鏈卡在哪里了?
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市


分享





