AI機器學習與智能硬件融合,小度智能音箱如何做到與天貓精靈并駕齊驅?
3月8日,阿里宣布自家的智能音箱銷量已經超過千萬,成為中國第一,全球第三的智能手機廠商。
從Strategy Analytics最新發布的研究報告指出,智能音箱是的確是2018年最熱門的消費電子產品。
2018年第四季度,全球智能音箱出貨量增長了95%,達到3850萬臺。超過2017年的全年總出貨量,這種增長率堪比2012年前后的智能手機。
從市場份額看,國外的亞馬遜與谷歌還有明顯優勢,2018年四季度,亞馬遜的銷量是1350萬,谷歌的銷量是1150萬,而中國的阿里、百度、小米銷量都在200萬左右。
有意思的是,如果我們把中國三家廠商每季度的銷量分開來看,就會發現中國智能音箱增長最快的并不是阿里,而是百度。
百度是全球前五中入場最晚的廠商,到了2018年二季度才開始發力,但是在短短幾個月,百度就成為智能音箱的世界級巨頭,這種增長速度是爆炸性的。
智能音箱這款產品始于2014年亞馬遜的Echo,國內廠商紛紛仿效,經過數年優勝劣汰,阿里和小米到了2018年初已經傲視所有國內廠商。
百度真正發力智能音箱是在2018年中,“小度在家“這款全球首款帶屏智能音箱在2018年4月份才公開招募內測。
而短短幾個月,百度的智能音箱就如核彈爆炸一般急速增長,到了2018年底,已經是三巨頭之一,而且銷量幾乎與阿里和小米持平。
2019年一季度有春晚的加成,百度拿下一季度銷量第一應該不是問題。
百度成立已經很多年了,但是它最基本不做硬件,從互聯網跨界智能硬件,百度在幾個月內就從“青銅“一躍成為“王者“,這個奇跡是如何創造出來的呢?
一、 厚積而薄發
智能硬件看似是一個硬件產品,而實際上它的核心技術并不是硬件,而是AI的語音識別與搜索。
語音識別技術已經存在很久了,但是要讓智能音箱有優秀的體驗,不僅僅是正確識別語音就夠了,而是要判別說話者的意圖,給予正確的回應。
國內很多所謂的智能音箱,只是買了科大訊飛的語音識別技術,而百度的智能音箱核心技術是自己研發的。
百度對AI的研發,可以追溯到多年之前。
人工智能科技發展很早,但是一度遇到瓶頸,難以突破。互聯網發展起來之后,人們發現人工智能科技中深度學習技術,可以依靠互聯網的大數據不斷進步,同時硬件的發展,特別是GPU通用計算的發展,讓計算能力不再是瓶頸,AI有了進一步發展的可能。
于是,百度在硅谷等地成立實驗室,投入重金,招募全球最好的AI專家,搭建百度大腦,開始AI的深度研發。
早在2014年(亞馬遜推出Echo之前),百度的研發團隊,就利用深度學習技術,研發出Deep Speech系統。
到了2016年,百度的Deep Speech系統已經進化到第三代。
傳統上,對語音識別的人工智能技術是RNN(循環神經網絡)。RNN是在DNN(深度神經網絡)的基礎上發展出時間戳,發展出長短時記憶單元,可以有解決時間序列的應用。語音識別是有時間序列的,所以業界對RNN用于語音識別的研究比較多。
而百度將深層卷積神經網絡技術(Deep CNN)應用于語音識別聲學建模中,將其與基于長短時記憶單元(LSTM)和連接時序分類(CTC)的端對端語音識別技術相結合,大幅度提升語音識別產品性能。這項技術借鑒了圖像識別在近些年的成果,以及語音與圖像在利用 CNN 模型訓練的共通性,在語音識別技術上取得了革命性的進展。
《麻省理工科技評論》(MIT Technology Review)雜志在2016年度十大突破技術的榜單中把百度語音識別技術列為十大突破技術。
實際上早在2016年,百度已經有了頂尖的語音識別技術。李彥宏在百度科技大會的上發言可以由AI同聲傳譯。李彥宏在Tech World大會上展示了AI與人的多輪對話。這些展示,遠遠超過市面上在售的智能音箱所擁有的水平,百度只是缺少一款轉化的產品。
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
- 1 AI狂歡遇上油價破百,全球股市還能漲多久? | 產聯看全球
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實測:中文穩、細節炸,設計師慌了
- 3 6000億美元估值錨定:字節跳動的“去單一化”突圍與估值重構
- 4 Tesla AI5芯片最新進展總結
- 5 連夜測了一波DeepSeek-V4,我發現它可能只剩“審美”這個短板了
- 6 熱點丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 7 AI界的殺豬盤:9秒刪庫跑路,全員被封號,還繼續扣錢!
- 8 2026,人形機器人只贏了面子
- 9 DeepSeek降價90%:價格屠夫不是身份,是戰略
- 10 AI Infra產業鏈卡在哪里了?


分享













