2013年底我和搭檔魏勇鵬創辦公司的時候,他說了兩件事:一是,谷歌機器翻譯幾乎不再聘請語言學專家了,由懂得統計、計算的計算機專家主理開發。二是,谷歌有世界上最豐富的多語言語料數據,但對這種基于數據統計訓練而成的翻譯引擎來說現狀有點尷尬,更多語料能帶來效果不再明顯了,盡管谷歌的語料、用戶量和使用量都在日益增多。
在我們運營公司的兩年多時間里,遇到了很多客戶和投資人,他們問的第一句話是:“你們機器翻譯能達到什么樣的準確度?”這個問題意味深長,我一般只能回答說:“在某些垂直領域,我們比谷歌翻譯要好。”這句帶有挑釁意味的話讓聽者將信將疑卻無從反駁,因為Ta從未得到過無瑕的機器翻譯體驗——像科幻影視文學、類似《星際迷航》里展現的,那邊阿凡達星語說出來,這邊火星人聽進去,毫無停頓卡帶的痕跡。
行內人用專業尺度評價機器翻譯的現實是這樣:美國商務部下屬的國家標準與技術研究所NIST舉辦的一項機器翻譯研究水平評測,采用BLEU(Bilingual Evaluation Understudy)標準。 其原理是比較機譯結果和人譯結果的相似度,完全一致得分為1(當然不同的人的翻譯很難“完全一致”,所以得分1為理想值)。2008年NIST的英文-中文的機器翻譯評測結果,谷歌翻譯得分0.4142,微軟亞洲研究院提交的測評是0.4099,廈門大學得分0.2502;谷歌和微軟亞洲的中文-英文機翻得分分別是0.2999和0.2901,中科院自動化所的得分是0.2407。
您已閱讀14%(626字),剩余86%(3975字)包含更多重要信息,訂閱以繼續探索完整內容,并享受更多專屬服務。