跑贏業內大盤,日活逆勢大漲的百度翻譯有什么魔力?

百度翻譯日活迎來新一輪逆勢增長:2020年Q1日活較上一季度環比增長10%,較去年Q1同比增長40%,這還是在在業內大盤增長整體放緩的前提下。
同時,百度翻譯目前可支持語種擴充到200個,翻譯方向近4萬個,每天來自世界各地的翻譯請求字符量超過千億,相當于2000部大英百科全書,平均每秒鐘就要翻譯超過1百萬字符。
百度翻譯日活的增長,我們或可將歸結為疫情的推動。
一方面是學生們在家學習、在線學習,有了更多時間通過手機和電腦使用百度翻譯(在校學習期間K12學生不能使用手機);另一方面,疫情背景下,跨過的多語言溝通變得更加重要,跨語言的信息分享變得緊迫,百度翻譯正好滿足了突然集中爆發的市場需求。
當然,這并不是百度布局翻譯方向十年以來能持續保持增長的全部,在翻譯之外,百度翻譯還藏著更多“秘密”。
好的翻譯產品,從來不只是“翻得準確”
在過去很長一段時間內,“準確率”是評判一款翻譯產品是否優秀的唯一標準,因而所有的翻譯產品都在準確率上“做文章”,從各個維度的“成績”來說明自己在這方面有多厲害,但事實上,隨著越來越多AI技術融入到翻譯產品,其體驗好壞的評判維度變得多元起來。
首先,在翻譯的廣度和速度方面,要不斷擴充與突破。
前者不應只局限在主流語言的互通上,而應尋求更大范圍內的多語言互譯,做到真正意義上的“與世界對話”;后者的最高境界是同聲傳譯。
道理大家都懂,但做起來才知道為什么這兩項能力不是每家都有,其原因就在于太難了。
翻譯廣度牽涉到小語種語言的訓練資源,全球5000多種語言,有一半的語言使用者不到萬人,很大一部分小語種語言的訓練數據只有幾萬條甚至幾千條,難以邁過翻譯的門檻。
翻譯速度牽涉到時間延遲和翻譯質量難以平衡的難題,導致很多翻譯產品的同聲傳譯體驗很難盡人所意。
百度翻譯通過模型上的創新,比如在多語言翻譯技術上,提出基于多任務學習的翻譯模型、多智能體聯合學習模型等,使多個語言可以共享模型表示,再經過回譯技術進行數據增強,使得1個季度之內,翻譯語種擴充了近7倍,目前支持200種語言互譯,是全球支持語種數量最多的翻譯系統。
在同聲傳譯領域上,百度翻譯又相繼提出了可控時延的翻譯模型、語義單元驅動的上下文感知翻譯模型等,在技術獲得了突破,不但開放了全球首個面向真實場景的中英文同傳數據集,還舉辦了首屆同傳評測,促進本領域技術發展。
還有一個值得一說的案例,由前沿科技領域頂級科學家參與的iCANX Talks(全球前沿科技直播)主辦方之前嘗試了多款翻譯產品,對翻譯效果都不甚滿意,直到近期才更換為百度翻譯。
其次,翻譯產品的使用場景不應只局限在原始的文本或語音輸入場景中,還應更加豐富和多元。
在技術不斷強化的今天,用戶追求的產品體驗變得更加全面和多樣,如果只有“結果”而沒有細節豐滿的過程,哪怕有100%的準確率,也因為一個字一個字地輸入而產生干澀的使用感受,市場不會買賬,用戶也不會買單。
百度翻譯除了文本和語音這兩種常規的輸入翻譯功能之外,其PC文檔翻譯功能支持word、pdf、ppt、excel等多種格式,支持中英、中日、中韓互譯,一鍵上傳,實現不限字數快速翻譯,保留文檔樣式排版,原文譯文對照查看,并支持免費導出,提升文檔翻譯效率。
視頻翻譯領域,百度翻譯攜手人人譯視界聯合推出了百度視頻翻譯平臺,只需上傳視頻文件并填寫必要信息,即可一站式獲取AI和人工視頻翻譯結果。
除此之外,百度翻譯在拍照翻譯、實景AR翻譯、對話翻譯等場景中通過AI技術的融合持續在對體驗細節進行改善。
可以預料的是,來源于百度的AI技術基底,百度翻譯在幫助用戶更好地完成翻譯這件事上,未來或將增加更多創新性的技術體驗。
最后,要從“語言轉換”的狹隘產品認知中跳出。
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
- 1 AI狂歡遇上油價破百,全球股市還能漲多久? | 產聯看全球
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實測:中文穩、細節炸,設計師慌了
- 3 6000億美元估值錨定:字節跳動的“去單一化”突圍與估值重構
- 4 Tesla AI5芯片最新進展總結
- 5 連夜測了一波DeepSeek-V4,我發現它可能只剩“審美”這個短板了
- 6 熱點丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 7 AI界的殺豬盤:9秒刪庫跑路,全員被封號,還繼續扣錢!
- 8 2026,人形機器人只贏了面子
- 9 DeepSeek降價90%:價格屠夫不是身份,是戰略
- 10 AI Infra產業鏈卡在哪里了?


分享













