百度谷歌相繼用AI布局的“聽新聞”到底是什么?
“AI主播”真正落地,還有離不開的“三大件”
通過信息流的看聽模式,“AI主播”現在有了更快、更廣泛的落地方式,但要真正讓用戶認可,并不是簡單上線一個功能這么簡單,它還有三個方面的門檻。
1、技術:以自然化的表達拒絕“噱頭”
生硬、冷冰冰的語音播報是之前不少“聽新聞”APP或工具下,用戶的主要感覺,這顯然無法獲得長期認同,只能“圖個新鮮”。
百度、Google等巨頭的加入,改變了這一情況。
實測,在百度APP的看聽模式中,除了朗讀節奏流暢、與真人說話幾乎無異,用戶還可以基于自己的喜好選擇不同音色,成熟、磁性、深情、活力、可愛……

而這種擬真化,來自于百度打造的世界上第一個能在云端提供大規模并行WaveRNN等實時語音合成技術的解決方案,簡單說,即能成句、成片合成音節,而不是像傳統技術那樣單個音頻點拼湊起來(所以顯得生硬、冷冰冰)。
它的背后,是AI技術的深度積累和海量數據資源優勢,通過分析新聞的詞匯、句法、人物和事件等信息,完成高度擬人、流暢自然的語音合成。
2、內容:優質內容支撐才能讓AI技術更有發揮余地
沒有優質內容支撐的看聽模式是無緣之木。
即便有一天AI語音播報可以實現央視播音員的水平(這并非沒有可能),如果內容本身質量不佳,所謂“聽新聞”其實還是偽命題。
百度看聽模式,一定只能是其長期內容耕耘的結果,在信息流層面,百度多年來持續優化創作者環境,尤其是不斷加大力度引入包括人民日報在內的優質內容源,已經使得百度信息流成為權威新聞的發布平臺之一,某種程度上并不輸各種新聞APP。
在這個基礎上進行的看聽模式,就有了深厚的根基。
更進一步看,以信息和知識為主要傳播對象的百度移動生態,“聽新聞”轉化到“聽知識”(例如醫學權威健康知識的碎片化學習),也不是不可能,過去的積累其實為百度移動生態埋下了更多商業可能。
3、認知:“秘書式”服務更能體現“聽”的價值
從產品的角度看,“聽新聞”有點像為用戶定制了一個“秘書”,把有需要的新聞“念”給用戶聽,用戶以一種舒適的心態完成APP上的新聞資訊獲取。
在這個背景下,百度APP看聽模式的一個亮點功能——朗讀時用戶可以選擇通篇朗讀或者提取資訊中的核心進行播報——就更好理解了。
在用戶選擇后,看聽模式可以對每一篇資訊的要點進行抓取并生成摘要,AI只會將摘要部分朗讀出來,而不會全篇閱讀,這很像“秘書”般的簡報服務。
這種能力,來源于NLP技術的深耕,使得AI具有某種對新聞的認知能力,會分析文章里的詞匯、句法、人物和事件等信息,自動識別關鍵部分,最終形成方便閱讀或傾聽的簡訊內容讓AI播報出來。
毫無疑問,這將更大程度滿足快節奏生活的需要,而多樣化的選擇本身也是贏得客戶好感的過程,只不過這種多樣化十分依賴AI技術來完成,不是只有一個idea就行。
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
- 1 AI狂歡遇上油價破百,全球股市還能漲多久? | 產聯看全球
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實測:中文穩、細節炸,設計師慌了
- 3 6000億美元估值錨定:字節跳動的“去單一化”突圍與估值重構
- 4 Tesla AI5芯片最新進展總結
- 5 連夜測了一波DeepSeek-V4,我發現它可能只剩“審美”這個短板了
- 6 熱點丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 7 AI界的殺豬盤:9秒刪庫跑路,全員被封號,還繼續扣錢!
- 8 2026,人形機器人只贏了面子
- 9 DeepSeek降價90%:價格屠夫不是身份,是戰略
- 10 AI Infra產業鏈卡在哪里了?


分享













