詳解AI領域“金發女郎效應”:如何讓應用型AI做到剛剛好?
雖然埃隆·馬斯克(Elon Musk)和馬克·扎克伯格一直在爭論AGI(通用人工智能,又稱強人工智能)的危險,但初創公司只是將人工智能應用于解決特定領域問題,例如提升銷售團隊的績效以及提高生產線的運營效率,這些創企逐漸成長為估值數十億美元的企業。然而,嚴格的定義問題只是找到有價值的人工智能商業應用的第一步。
為找到構建人工智能業務的合適機會,初創公司必須在不同的維度上運用“金發姑娘原則”,以找到“合適”開始的甜蜜點(sweet spot)——在不同維度之間注意平衡,切記不可過分專注一個維度。根據我們從與數千家AI創企合作中學到的知識,以下是一些有抱負的創始人結合自己的人工智能策略尋找甜蜜點的一些方法。
“恰到好處”的預測時間范圍
與市面上其他智能軟件不同,人工智能會響應其運行的環境;算法接收數據并返回一個結果或預測。根據應用程序的不同,可以對近期的情況進行預測,例如明天的天氣,也可預測出未來許多年的結果,比如患者是否會在20年內患上癌癥。算法預測的范圍對其有效性以及是否提供構建防御性的機會而言至關重要。
針對一個較長的時間段進行預測的算法很難做出評估和改進。例如,算法可以使用承包商之前項目的時間表預測某個建筑項目將比計劃落后6個月并超預算20%。在新項目完成之前,算法設計者和最終用戶很難對此預測做出評論,只能判斷預測內容在方向上是否正確——即項目是否延遲完成或成本是否更高。
即使最終的項目編號最終非常接近預測的數字,也很難完成反饋循環并積極地加強算法。許多因素會影響到復雜的程序,如建筑項目,因此很難利用A/B測試預測來梳理未知混雜因素的輸入變量。系統越復雜,算法完成加固循環所需的時間越長,精確訓練算法也就越困難。
雖然很多企業客戶對使用AI解決方案持開放態度,但為了完成銷售,初創公司必須能夠驗證算法的性能。驗證算法最有說服力的方法就是借助客戶的實時數據,但這種方法在試點期間可能很難實現。如果創企可獲權訪問客戶的數據,預測時限應該盡量短一點,以便在試驗期間驗證算法。
對于大多數AI創企而言,較慢的計算速度嚴重限制了應用型人工智能的范圍。
歷史數據(若可用)可以作為訓練算法的權宜之計,并通過回溯測試暫時驗證它。訓練對歷史數據進行長時間范圍預測的算法是有風險的,因為過程和環境更有可能改變你對歷史記錄的了解,從而使得歷史數據集對當前條件的描述性減弱。
其他情況下,雖然描述結果的歷史數據可用于訓練算法,但可能無法捕獲在考慮范圍之內的輸入變量。舉個建筑行業實例,你發現使用藍色安全帽的建筑工地更有可能按時完成項目,但由于帽子的顏色在之前并沒有對管理項目帶來任何幫助,該信息未記錄到存檔文件中。所以必須從頭開始捕獲這些數據,這將再度推遲企業的上市時間。
AI創企應該建立多種算法,以較短的范圍進行更小、更簡單的預測,而不是在長時間范圍內進行單一的“hero”預測。將運行環境分解為更簡單的子系統或在過程中限制數據的數量,使其更容易控制混雜因素。Autodesk的BIM 360項目IQ團隊將這種小型預測方法應用于建筑行業,消除了施工過程中的眾多低效問題,并有助于消除潛在的設計與施工風險。其算法模型可預測安全性,并對供應商和分包商的質量/可靠性進行評估,所有數據都可以項目進行周期中進行測量。
較短的時間范圍便于算法工程師監控其性能變化并采取措施快速改進,而僅限于對歷史數據進行回溯測試。時間范圍越短,算法的反饋回路越短。每個周期做出的反饋逐漸累加,可增強算法的性能,較短的反饋周期更有利于構建防御性。
“恰到好處”的可操作窗口
大多數算法對動態系統進行建模并返回一個預測結果供人類采納。由于系統更改頻繁,算法的輸出很難在長時間內保持有效性:很可能在用戶采取行動之前,預測結果的有效性就大幅度“下降了”。為保證預測結果對最終用戶的有效性,必須設計算法以適機器與人類速度的限制。
在典型的人工智能工作流程中,人類將數據輸入算法中,算法運行、計算輸入數據,并輸出預測結果或建議行動步驟;人類解釋該信息以決定行動方案,然后采取行動。算法計算結果所花費的時間以及人類對輸出內容進行操作所花費的時間是此工作流程中最大的兩個瓶頸。
對于大多數AI創企而言,較慢的計算速度嚴重限制了應用型人工智能的應用范圍。算法的預測取決于輸入數據,輸入數據代表記錄過程的瞬時數據。如果數據描述的環境變化快于算法計算輸入數據的時間,則在算法完成其計算并返回預測時,預測結果僅適用于過去的某個時刻,并且將不可操作。例如,音樂程序Shazam后臺的算法在首次“聽到”歌曲到識別這首歌,期間可能需要花費好幾個小時,且需借助Windows 95系統的計算能力。
云計算的興起以及專為人工智能計算而優化的硬件開發極大地拓寬了應用型人工智能可行且可負擔的領域。雖然宏觀技術的進步極大地推進了應用型人工智能,但算法并不完全受制于當前的計算限制;通過訓練加強也可以改善算法的響應時間。算法遇到的相同示例越多,就能越快地跳過計算過程得出預測結果。由于計算的加強與改善,如今Shazam僅用不到15秒的時間便可識別一首歌。
自動化決策和操作還可以幫助用戶利用因過快失效而等不及人類做出回應的預測。Opsani就是這樣一家企業,它運用人工智能來做出數量龐大、快速變化的決策,以便人類有效采用。與人類DevOps(DevOps,即Development和Operations,是一組過程、方法與系統的統稱,用于促進開發應用程序/軟件工程、技術運營和質量保障部門之間的溝通、協作與整合)不同,人類DevOps只是根據算法的建議快速地優化性能,Opsani則是應用人工智能來識別和自動改進應用程序和云設施的操作,以便用戶享受到更好的性能。
然而,并非所有人工智能應用都可以完全自動化,如果感知風險對于最終用戶來說太高而無法接受,或者法規要求必須有人類來批準該決策等情況下,人工智能應用便無法完全自動化。
“恰到好處”的性能最低限度
就像軟件創企會選擇在開發了最小可行產品(MVP)以便從初始客戶中收集可采取措施的反饋時進入市場,AI初創公司應該在達到早期用戶所需的最低算法性能(MAP)時正式進入時市場,在市場的大環境下,算法可以接受更多樣化和新鮮數據集的培訓,也可避免過度訓練變成數據集。
大多數應用程序并不需要達到100%準確,也會有一定價值。例如,欺詐檢測算法可能只會在發生故障后的24小時內立即捕獲5%的欺詐案例,但詐騙調查人員經過一個月的分析也僅能捕獲15%的案例。在這種情況下,MAP為0,因為欺詐檢測算法可以用作第一過濾器,以減少調查人員必須經手的案例數量。該創企可立即進入市場,以確保訪問用于培訓其算法的大量欺詐數據。長此以往,算法的準確性必將能提高并減輕調查人員的負擔,使其能專注于更復雜的案例。
為0或較低的MAP應用程序構建算法的初創公司將能快速進入市場,但若是算法達到高水平性能之前出現這些副本,則可能需要不斷調查跟風抄襲的企業。
將算法從研究實驗室轉向市場并沒有通用的方法。
專攻較低MAP問題的初創公司也應注意那些可通過非常小的訓練集以近100%準確度解決的問題,其中建模的問題相對簡單,跟蹤的維度少,結果可能出現的變動也比較少。
基于AI的合同處理是算法性能迅速提升的應用一個很好的例子。合同類型數以千計,但大多數的關鍵板塊都是類似的:涉及的各方、交換價值的項目、時間框架等。抵押貸款申請或租賃協議等特定文件類型是高度標準化的,以符合監管。在多個初創公司中,我們發現自動處理這些文檔的算法在其他示例未幫助改進之前,只需要幾百個示例就可訓練到可接受的準確度,從而使后來者更容易將現有企業和早期算法性能進行匹配。
針對勞動力低廉且能夠輕松達到高精度的應用領域而設計的人工智能需要在找到早期用戶之前達到更高的MAP。例如,需要精細運動技能的任務尚未被機器人接替,人類的表現需要了非常高的MAP來克服。拾取物體時,為機器人手提供動力的人工智能必須以高精度測量物體的硬度和重量,否則機器人手會損壞被處理的物體。而對人類而言,無需任何訓練,也能非常準確地測量這些尺寸。攻擊高MAP問題的創企必須投入更多時間和資金來獲取足夠的數據,才能達到MAP并正式進入市場。
克服困難
在研究實驗室中,限制領域人工智能(Narrow AI)可以在廣泛的應用中取得了重大進展。此外,圍繞Narrow AI的應用程序建立業務需要新的算法集。此過程很大程度上取決于所有維度的特定用例,算法的性能只是一個起點。將算法從研究實驗室轉移到市場并沒有通用的方案,還得具體問題具體分析,但希望這些想法能夠為你提供一個擁有的藍圖。
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
- 1 AI狂歡遇上油價破百,全球股市還能漲多久? | 產聯看全球
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實測:中文穩、細節炸,設計師慌了
- 3 6000億美元估值錨定:字節跳動的“去單一化”突圍與估值重構
- 4 Tesla AI5芯片最新進展總結
- 5 連夜測了一波DeepSeek-V4,我發現它可能只剩“審美”這個短板了
- 6 熱點丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 7 AI界的殺豬盤:9秒刪庫跑路,全員被封號,還繼續扣錢!
- 8 2026,人形機器人只贏了面子
- 9 DeepSeek降價90%:價格屠夫不是身份,是戰略
- 10 AI Infra產業鏈卡在哪里了?


分享













