百度大腦遠場語音開發套件評測—快速上手,超贊語音交互體驗
二、開發測試
本次測試環境為Ubuntu 16.04 64ibt 虛擬機,開發平臺是RK3308。
登陸開發板后,可以進入/oem 目錄,里面有開發相關說明以及一些測試示例。
(一)連接設備
1、安置在 adb 環境:sudo apt install adb
snow@snow-machine:~$ sudo apt install adb
正在讀取軟件包列表... 完成
正在分析軟件包的依賴關系樹
正在讀取狀態信息... 完成
下列軟件包是自動安裝的并且現在不需要了:
snapd-login-service xdg-desktop-portal xdg-desktop-portal-gtk
使用'sudo apt autoremove'來卸載它(它們)。
將會同時安裝下列軟件:
android-libadb android-libbase android-libcutils android-liblog
下列【新】軟件包將被安裝:
adb android-libadb android-libbase android-libcutils android-liblog
升級了 0 個軟件包,新安裝了 5 個軟件包,要卸載 0 個軟件包,有 6 個軟件包未被升級。
需要下載 141 kB 的歸檔。
解壓縮后會消耗 428 kB 的額外空間。
您希望繼續執行嗎? [Y/n] y

已下載 141 kB,耗時 2秒 (48.3 kB/s)
正在選中未選擇的軟件包 android-liblog。
(正在讀取數據庫 ... 系統當前共安裝有 215288 個文件和目錄。)
正準備解包 .../android-liblog_1%3a6.0.1+r16-3_amd64.deb ...
正在解包 android-liblog (1:6.0.1+r16-3) ...
正在選中未選擇的軟件包 android-libbase。
正準備解包 .../android-libbase_1%3a6.0.1+r16-3_amd64.deb ...
正在解包 android-libbase (1:6.0.1+r16-3) ...
正在選中未選擇的軟件包 android-libcutils。
正準備解包 .../android-libcutils_1%3a6.0.1+r16-3_amd64.deb ...
正在解包 android-libcutils (1:6.0.1+r16-3) ...
正在選中未選擇的軟件包 android-libadb。
正準備解包 .../android-libadb_1%3a6.0.1+r16-3_amd64.deb ...
正在解包 android-libadb (1:6.0.1+r16-3) ...
正在選中未選擇的軟件包 adb。
正準備解包 .../adb_1%3a6.0.1+r16-3_amd64.deb ...
正在解包 adb (1:6.0.1+r16-3) ...
正在處理用于 libc-bin (2.23-0ubuntu11) 的觸發器 ...
正在處理用于 man-db (2.7.5-1) 的觸發器 ...
正在設置 android-liblog (1:6.0.1+r16-3) ...
正在設置 android-libbase (1:6.0.1+r16-3) ...
正在設置 android-libcutils (1:6.0.1+r16-3) ...
正在設置 android-libadb (1:6.0.1+r16-3) ...
正在設置 adb (1:6.0.1+r16-3) ...
正在處理用于 libc-bin (2.23-0ubuntu11) 的觸發器 ...
2、查看安裝結果:adb version
3、查看硬件是否連接:adb devices
4、連接硬件:adb shell
(二)WIFI連接
1、進入/data/cfg 進行wifi配置:cd /data/cfg
使用 vi 編輯 wpa_supplicant.conf:vi wpa_supplicant.conf
在設置好 wpa_supplicant.conf 后,可以通過如下命令來重新聯網
注意:第一次操作,調用 wpa_cli reconfigure 命令出錯
切換聯網命令:wpa_supplicant -B -i wlan0 -c
雖然顯示操作成功,但是查看網絡連接,發現還是未成功連接(可以看到wlan0并未顯示IP地址):


重啟系統(如果一次不行,可以進行多次重啟),最后成功了(可以看到wlan0顯示了分配的IP地址-192.168.1.110)
(三)運行語音識別示例
進入/oem目錄,查看語音能力相關文件: cd oem
查看文檔說明:cat readme.txt
根據文檔,相關文件應該在data目錄下,但是實際操作發現,相關文件在oem目錄下,故進入oem目錄,執行操作:
主要是運行以下四個命令(該命令是修改權限,啟動 alsa_audio_main_service服務,根據說明書,使用語音識別功能需要先啟動alsa服務):

執行上述命令后,可使用ps命令檢測alsa服務是否正確啟動:ps –A|grep alsa

根據說明書,BDSpeechSDK 目錄下的sample目錄中包含語音識別示例,由于語音識別運行時依賴lib、resources、extern目錄中的庫及資源文件,所以我們需要在啟動時共享庫。
進入目錄,運行語音識別示例:


喊“小度小度,今天天氣怎么樣”的識別結果:

可以發現,本開發套件采用了流式識別,附帶中間結果!
(四)語音識別效果測試
通過距離遠近,語速快慢,中間是否有隔離物(隔離物為電腦桌,顯示屏)等方式,對本開發套件進行了一次粗略的測試:
一米處:
有隔離:“一米一次喚醒測試”

有隔離,語速較快:“一米二次喚醒測試”

有隔離,語速較快:“今天天氣怎么樣”

無隔離,正常語速:“一米三次喚醒測試”

無隔離,語速較快:“今天天氣怎么樣”

2米處:(無隔離,正常語速)
“兩米一次喚醒測試"

“兩米二次喚醒測試”

“天天氣比較涼爽”

3米處:(無隔離,正常語速)
“三米一次喚醒測試”

“三米二次喚醒測試”

“聽說明天有臺風”

5米處:(無隔離,正常語速)
“五米一次喚醒”

“五米二次喚醒”

“臺風來了怎么辦”

6米處:(無隔離,正常語速)
注:首先需要較大聲喚醒小度,喚醒后,可識別正常音量的聲音:
“六米一次喚醒”

“六米二次喚醒”

“今天天氣好晴朗”

測試結果:
經過上述的語音識別測試,可以發現,本套件在5米內可以達到比較良好的喚醒、識別效果,超過5米后,喚醒、識別效果下降比較明顯。
另外,對于一般性的用語,識別相當準確(即使達到6米,也能比較準確的識別),但是對于讀音相近的詞語(“一米”-“玉米”,“兩米”-“楊冪”等),識別準確性就有點差了(也可能跟發音有關)。
發音源跟套件之間是否有隔離物(非完全隔離),對識別的影響不是很大(沒有讀音的影響大)。
語速不是很快的情況下,一般也能正常識別。
總體而言,對識別結果影響較大的,除了距離外,就是讀音相近的詞語(發音)了。
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
- 1 AI狂歡遇上油價破百,全球股市還能漲多久? | 產聯看全球
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實測:中文穩、細節炸,設計師慌了
- 3 6000億美元估值錨定:字節跳動的“去單一化”突圍與估值重構
- 4 Tesla AI5芯片最新進展總結
- 5 連夜測了一波DeepSeek-V4,我發現它可能只剩“審美”這個短板了
- 6 熱點丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 7 AI界的殺豬盤:9秒刪庫跑路,全員被封號,還繼續扣錢!
- 8 2026,人形機器人只贏了面子
- 9 DeepSeek降價90%:價格屠夫不是身份,是戰略
- 10 AI Infra產業鏈卡在哪里了?


分享













