紀念劉倬先生:中國機器翻譯開山鼻祖、NLP先行者
前言:
機器翻譯,本質上屬于自然語言處理技術,技術進步需要產業界和學術界不斷研究攻關。
而中國的先行者們很早就提出:機器翻譯的問題是語言的問題,而不是單獨算法的問題。
作者 | 方文
圖片來源 | 網 絡

“機器翻譯的問題是語言的問題”
機器翻譯,又稱自動翻譯,是用計算機將一種自然語言(源語言)轉換為另一種自然語言(目標語言)的過程。
語音翻譯和文本翻譯雖然也有各自關注的技術難點,但共同面對的核心難題都是自然語言理解。
這是一個很高、甚至是終極的目標,所以許多研究者喜歡用另外一個詞,即自然語言處理(NLP)來描述這一學科,強調過程而不是目的。
從方法上,他們希望迅速找到語言規則,就像找到密碼的編碼規則就很容易破譯密碼一樣,如果找到語言規則,就能夠理解自然語言,機器翻譯難題就解決了。
機器翻譯的問題是語言的問題,而不是單獨算法的問題。
這種獨到的見解,對今天的機器翻譯依然有重要的參考作用。
盡管今天的計算技術,硬件水平,大數據、語料庫等等的發展已經很靠前了,但機器翻譯的本質問題還是語言本身。
紀念國內機器翻譯先行者劉倬先生
劉倬先生因病醫治無效,于2022年9月12日在北京逝世,享年89歲。
1953年4月調到中央高等教育部綜合大學司工作。
1954年4月至1960年10月在北京俄語學院做講師。
從這時起他與中國科學院語言研究所劉涌泉先生等合作,開啟了我國首次機器翻譯的研究。
1960年11月劉倬先生調入語言研究所,專職從事機器翻譯的研究工作直到1995年離休。
1956年,機器翻譯就被列入了中國國家科學工作的發展規劃,課題名稱為[機器翻譯、自然語言翻譯規則的建立和自然語言的數學理論]。
在這個國家規劃之下,劉倬先生與劉涌泉先生高祖舜先生一起,從1957年開始研制機器翻譯系統;
1959年成功地進行了俄漢機器翻譯系統的實驗,這是世界上第一個跨語系的、以漢語為翻譯目標語言的系統。
1964年出版了我國第一本機器翻譯學術著作《機器翻譯淺說》,詳細論述外譯漢機器翻譯系統的研制方法。
這個階段后來被學界公認為我國機器翻譯研究的開創期,作為當時的學術帶頭人,劉倬先生是中國機器翻譯事業的開創者之一。
1975年經過十年停滯后科研全面恢復,劉倬先生開始主持研制JFY系列英漢翻譯系統。
他的創新方法成就了如今的發展
他的研究始終注重國內外的語言理論,注重語言工程實踐,結合漢語的特點,提出了多種語言分析和生成的方法:
在喬姆斯基單層句法解析的基礎上采用了多層策略;拓展了傳統有限狀態文法的邊界;
提出了詞典的規則化表達和規則的函數化運算;以及在句法解析中隱式代入包含常識的本體知識;
尤其是他根據自然語言處理和機器翻譯的需要,設計并實現了一整套符號計算語言學的專用算法語言和平臺。
包括專用語言的句法定義、解釋執行、作為符號模型的數據結構以及多層解析的控制流程,并配備了質量控制和追蹤糾錯的功能。
以謂語為軸心、語法和語義同步分析的句素分析法;
個性規則與共性規則相結合的語言分析生成策略;
轉換、遞歸、回溯、動態上下文等語句分析算法;
語義制約與句法模式的轉換機制,規則與算法分離的開放式系統架構等。
這些方法對我國基于規則的機器翻譯研究和開發起到了奠基的作用,在相應的歷史時期代表了國內的主流研究方向。

翻譯被賦予了新的歷史使命
隨著中國[走出去]和[一帶一路]戰略和政策的深入,對多語言信息轉換的需求也將相應擴大。
新時代的語言服務業正在走向高質量、高生產力的階段。智能化、自動化和數字化是新翻譯時代的特征。
完成整個商業業態的重構,真正帶來效率的突破和場景化的實現,是新譯的使命。
據統計,世界上至少有5000種語言,其中使用頻率最高的是漢語、英語和西班牙語。
多語制一方面增加了文化特色,另一方面給跨國交流帶來諸多不便,從而催生并加速了翻譯市場的需求。
2021年,全球以語言服務為主營業務的企業總產值預計首次突破500億美元。
中國含有語言服務業務的企業423547家,以語言服務為主營業務的企業達9656,企業全年總產值為554.48億元,相較2019年年均增長11.1%。
人工智能技術不斷創新,機器翻譯在行業的應用越來越廣泛,具有機器翻譯與人工智能業務的企業達252家。
同時,我國機器翻譯市場需求與日俱增,主要集中于企業用戶,涉及石化、機電、交通運輸、金融、旅游等多個垂直領域。
市面上的神經機器翻譯系統越來越多,國內的阿里巴巴、騰訊、百度、科大訊飛、搜狗,國外的谷歌、臉書、微軟等都在布局,這使相關技術發生質變。

結尾:
如今,機器翻譯技術不斷迭代、創新,但劉倬先生所留下的諸多重要核心思想將經久不衰。
回頭望去,我們更加體會到劉倬先生的研究理念和設計方法體現了經典符號人工智能的精髓,其意義是深遠的。
部分資料參考:雷鋒網:《中國機器翻譯開山鼻祖、NLP 先行者劉倬逝世》
原文標題 : AI芯天下丨深度丨紀念劉倬先生:中國機器翻譯開山鼻祖、NLP先行者
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
- 1 特斯拉Optimus Gen3量產在即,哪些環節最具確定性?
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實測:中文穩、細節炸,設計師慌了
- 3 AI狂歡遇上油價破百,全球股市還能漲多久? | 產聯看全球
- 4 6000億美元估值錨定:字節跳動的“去單一化”突圍與估值重構
- 5 Tesla AI5芯片最新進展總結
- 6 連夜測了一波DeepSeek-V4,我發現它可能只剩“審美”這個短板了
- 7 熱點丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 8 2026,人形機器人只贏了面子
- 9 AI界的殺豬盤:9秒刪庫跑路,全員被封號,還繼續扣錢!
- 10 AI Infra產業鏈卡在哪里了?


分享













