(原標題:殺死那個人類同傳)
2018年9月20日,知乎上一篇圖文并茂的文章,將人們對“機器翻譯”的質疑,再次置于放大鏡下。
文章作者Bell Wang,一名同聲傳譯工作者,指責著名的人工智能公司——科大訊飛在一場由他擔任同傳的會議上,沒打招呼,就直接把他和搭檔口譯的內容語音識別成了文字并打到大屏幕上。而屏幕上顯眼的“訊飛聽見”logo,給了現(xiàn)場觀眾很大的誤導,讓人以為這中文字幕是機器翻譯軟件直接翻譯得出的。
這篇文章迅速發(fā)酵,作為上市公司的科大訊飛不得不出面回應,強調自己“從沒有說過要取代人類”,沒有主觀惡意。在連續(xù)的幾場發(fā)布會和新聞稿中,高深莫測的“人機耦合”概念再次被科大訊飛拿出來,用于解釋他們的機器翻譯理念。
機器翻譯是為了幫助人類翻譯的,科大訊飛說。
盡管如此,同傳界對科大訊飛的負面觀感,并未因此減退。
PingWest品玩采訪了多位同傳從業(yè)者,他們普遍對科大訊飛缺乏正面印象。這并是不來自“機器翻譯搶走人類飯碗”的擔憂,而是源于包括科大訊飛在內的一眾“機器翻譯公司”,對同傳從業(yè)者“缺乏起碼的尊重“。
在這種糟糕的互動關系背后,自人類有文明交流以來便出現(xiàn)的語言翻譯,正在走向兩個分岔路。
公然羞辱
2017年底,美國前總統(tǒng)奧巴馬來到中國參加了一場企業(yè)峰會。這場會議后來因大量流出的“微商握手奧巴馬”圖片而走紅。不過在這場走穴現(xiàn)場,真正的主角是科大訊飛。
入行5年的同傳譯員喬亞(化名)是當天會議的同傳之一。會議即將開始前,現(xiàn)場一片混亂,一名主辦方工作人員匆匆找到正在做最后準備的喬亞和她的搭檔,說“科大訊飛也會來”。主辦方告訴她們,科大訊飛在會上會把她們的同傳用語音識別技術展示在大屏幕上,提醒她們翻譯時要“小心一些”。
在當天這場”寸時寸金“的活動上,主辦方安排了多場路演,但由于時間把握的問題,幾個講者在演講末尾不得不提高語速,最終快到同傳無法及時翻譯?!八砸粋€直接結果就是,當時屏幕出現(xiàn)長時間空白,不一會兒科大那邊就直接把屏幕關了。”
活動結束時喬亞一度擔心自己的翻譯完成度,擔心客戶會不滿意。但接下來的一幕卻讓她更加憤怒:
活動全部結束后,科大訊飛的一名高層突然蹦到臺上,對奧巴馬驕傲地說到:“今天我們在屏幕上看到的實時字幕,都是科大訊飛的翻譯技術做的同傳。”
而在當天的活動全程中,科大訊飛自始至終沒有和譯員有過任何接觸。
這樣的做法與Bell Wang在知乎熱文里吐槽的行為如出一轍,而PingWest品玩采訪的多名同傳都表示,自己也受到過相似的待遇。
張偉是一名從事同傳8年的譯員,他記得在至少兩次他同傳的活動中,現(xiàn)場嘉賓在發(fā)言中突然脫稿說,如果他當天帶來了自己公司的翻譯產品,就不需要今天的同傳了。而更加諷刺的是,作為現(xiàn)場的同傳,他還需要把這些言論翻譯成英文告訴老外觀眾。
“第一次遇到這種場景的時候我特別氣憤,但作為譯員我們要保持客觀,我還是給他翻了。當時我和搭檔互相看了一眼,兩人滿臉的抵觸?!?/p>
如今國際化的科技大會越來越多,那些擁有翻譯技術的科技公司嘉賓,總是喜歡拿就在現(xiàn)場的人類同傳說事,并且對這種近乎公然羞辱的行為自我感覺良好。
在接受采訪的多名同傳的描述中,這些機器與人共存的場合,沒有協(xié)同工作,也沒有同場競技,有的只是荒謬的鬧劇, Bell Wang吐槽的這一次與他們經歷的并沒有什么區(qū)別。唯一的不同只是,這一次事情“鬧大了”,不再只局限于同傳圈子。
“業(yè)內的朋友們也開始在我身上寄托很多期望,希望維護合理的權利和訴求?!?Bell Wang 在自己帖子引發(fā)巨大反響后這樣說到。
“從業(yè)者越來越浮躁”
中國人對科技的熱衷,讓“AI取代人類”成了所有人掛在嘴邊的話題。說的多了,許多”震驚體“的標題,也開始被所有人嚴肅對待。
如今你時不時就會在網上看到“AI取代同傳”樣式的標題,在張偉印象中,同傳圈第一次集體因此憤怒是2013年,當時中國移動的前董事長王建宙在央視接受采訪,他強調4G帶來傳輸速度的飛躍將大大提升機器翻譯的速度,進而替代人類同傳。
“如果4G讓做同聲傳譯的失業(yè)了,那我們這個行業(yè)就太高興了。” 王建宙隨口一說,同傳們焦慮許久。
小L是一名入行不到4年的年輕同傳,她的生活節(jié)奏代表了最典型的同傳譯員。我在她上下午兩場活動的間隙見到她:一身嶄新西裝、腳踏高跟鞋,但依舊走路生風。雖然過往一周每天都在“接會”(擔任會議的同傳),但在她化著淡妝的臉上卻看不到絲毫疲態(tài)。對這種快節(jié)奏的生活,她早已習慣?!斑@是做同傳的常態(tài)。”她說。
在大部分時間里,她都保持著職業(yè)的微笑,只是當談及AI翻譯的話題時,她皺起了眉。
在此次科大訊飛的風波之前,機器翻譯就曾在主流輿論中引發(fā)過一次熱議。今年4月的博鰲亞洲論壇上,騰訊的機器同傳產品“翻譯君”高調亮相。
小L記得,在博鰲論壇開幕前,她以前合作過的一個客戶給她轉來一篇文章,內容是騰訊為”翻譯君“亮相而發(fā)布的新聞稿,但題目則被多家自媒體改作“AI即將取代同傳”。
“他什么意思?以后不需要和我合作了?”小L心里想,當時感到有點慌。不過之后的進展讓她松了口氣。
在那個熱鬧的大會上,“翻譯君”僅用幾天時間就從“業(yè)界首個完整AI同傳服務”,迅速淪為一個錯誤百出的蹩腳翻譯,諸如“我們需要一張臉,一張新的臉”的翻譯讓人哭笑不得,整體聽下來也是磕磕絆絆,基本無法通過它弄清楚現(xiàn)場在討論些什么。
小L覺得可笑,但緊跟而來的則是憤怒。
“同傳這個行業(yè)向來是靠實力說話,你的翻譯水平、你的情商,都很重要?!毙說?!暗F(xiàn)在突然間機器翻譯來了,誰都還沒看過它們真的翻出什么成果,或者真的證明比我們人類優(yōu)秀,但是一瞬間我們所有人類同傳就是多余的了,連比較一下都不用。這感覺很不爽?!?/p>
小L2014年讀研期間開始跟著老師參加會議的同傳,正式入行。但畢業(yè)后的前2到3年,做為新人,每個月最差時可能就只有2到3場會,天天都很著急?!懊恳粋€機會都要十分珍惜,如何讓客戶滿意,跟翻譯公司維護好關系,讓他們在下一次有會的時候能想起你。然后自己還要強迫自己每天都練習聽力和翻譯??傊Σ蝗菀??!毙回憶說。
但同傳是翻譯行業(yè)的塔尖,而且同傳本身也是一個金字塔型的行業(yè),進入頂端才有機會,因此小L削尖了腦袋也要擠進去?!拔覐牟慌潞屯瑢W、前輩競爭,有機會總是會觀察其他譯者,甚至是我的搭檔,從她們的長處學習,同時也知道他們的毛病在哪。”
而這一切到了機器翻譯那,卻可以不戰(zhàn)而勝。越來越多科技公司在宣傳時都把“同傳”當成自己機器翻譯技術的靶子。
“很多時候機器犯的錯誤對人類同傳來說就是災難,比如我看到過機器翻譯在一家公司年會現(xiàn)場把人家公司名稱翻錯,在國際論壇把地名翻錯,再比如博鰲這次,連一帶一路這樣的詞語也敢翻錯。”小L說。
她覺得,這與同傳整體的低調有關:與坐在臺前和講者肩并肩的交傳不同,同傳往往“躲”在現(xiàn)場的某個角落,同時同傳譯員大多是自由職業(yè)者的工作狀態(tài),獨來獨往,競爭激烈,沒有什么抱團的習慣,也不太集體發(fā)聲。
“也許因為我們總坐在角落的箱子里,他們不知道我們的態(tài)度吧。所以這些公司總是把同傳做為宣傳中瞄準的對象。但這些動輒’替代同傳’的言論,其實是一種缺少尊重的表現(xiàn)?!毙說。
“機器翻譯水平這么差,但還把同傳做靶子,也是因為同傳是最高水平,而且也算是一個高薪的工作,說用機器取代我們會更有噱頭,有利于他們吸引關注。而且對于那些上市公司,還有利于抬升股價。”喬亞認為。
而張偉則感到困惑,他從行業(yè)估值角度估算了一筆賬,認為就算機器真能取代人類同傳,同傳這點市場也不值得科技公司花費如此巨大的投入。
“我算了一下,同傳市場按照2000名譯員、每名譯員每年150場會,每場按照現(xiàn)在平均水平,譯員5000元、翻譯公司拿另外的5000元,那這樣就是30個億。再加上同傳設備的租賃費大約50個億,這已經是很高的估計,但也才多少?!睆垈フJ為,就算把他估計的數(shù)字乘以10,也根本不值得這些科技公司大張旗鼓地做。
“我看,同傳這個概念算是被這些科技公司做市場營銷的給‘綁架’了?!毙憤憤地說。然而,盡管看不上機器翻譯現(xiàn)在的水平,但小L承認,她也不確定未來10年機器翻譯會發(fā)生怎樣的變化。
這種鋪天蓋地的宣傳已經開始影響同傳行業(yè)里的每一個人。
喬亞目前還在一所高校兼職教授同傳課程,她記得在給一個研究生班上的第一節(jié)課上,這些未來的同傳主力軍關心的最多的話題也是“AI這么強大,我們還需要學習同傳么?要不要趁早改行”。這讓她哭笑不得。
而張偉認為這很容易理解?!鞍凑宅F(xiàn)在這樣的發(fā)展,未來10年真的不好說。而這些20多歲的學生,10年后正進入事業(yè)黃金期,誰都不想在那時候被機器取代,丟掉飯碗?!?/p>
一方面親眼看著如今機器翻譯的糟糕水準,但另一方面卻又停不住的感到擔憂,如此糾結往復成了同傳們生活的一部分,給本就壓力不小的生活平添更多煩惱。
小L發(fā)現(xiàn),這幾年關于AI取代人類同傳的討論已經取代了所有與業(yè)務相關的討論,成為行業(yè)內唯一持久的熱議話題。
“以前還安安靜靜討論討論接會和做翻譯的業(yè)務經驗,現(xiàn)在網上和群里就都是討論AI又干了什么?!毙說?!疤焯煜脒@個,讓從業(yè)者都顯得越來越浮躁了?!?/p>
人類和機器互不理解
在瞄準同傳這一行業(yè)的同時,這些機器翻譯技術的研發(fā)者們對同傳的理解卻與擁有百余年發(fā)展史的同傳這一工種有很大不同。
在被問及科技界對常常提到的“機器同傳”的定義,微軟首席語音科學家黃學東對PingWest品玩表示,他們的理解更多是指語音識別與機器翻譯的結合。他表示,如今在語音識別上由于抗噪的能力還有所限,這一點比人類是要差點。但機器翻譯方面,它的速度絕對是人類比不上的。
小L就認為,同傳不是機械地翻譯,而是要保證溝通,達到交流的目的?!斑@些AI翻譯公司所說的同傳,和我們從事的同傳,完全就是兩個事情?!毙說。
科大訊飛在此次風波過后的回應中提到“人機耦合”的獨創(chuàng)概念。“人機耦合翻譯模式,由機器提供語音轉寫和翻譯結果給同傳參考,輔助同傳降低工作強度并提升效率,文字展示區(qū)Logo顯示為‘訊飛聽見’?!?/p>
但這種服務同傳譯員的說法,看起來卻基本是一廂情愿。
根據(jù)業(yè)界的定義,同聲傳譯是指譯者用一種語言把另外一種語言所表達的內容,以與發(fā)言人幾乎相同的速度,用口頭形式準確表達出來的一種口譯方式 。
“同傳需要很強的聽力,正確判斷講者的停頓,需要做順句驅動,也就是和講者同時開口并隨時調整邏輯確?;就角覝蚀_?!睆垈ソ榻B?!岸鴻C器現(xiàn)在就只是譯一句喘一兩分鐘,這是假同傳?!?/p>
“同傳已經成功運行百來年,不須要這樣的支持。有些翻譯軟件其實就挺好用,利用人工智能把資料用兩分鐘譯好,關鍵詞譯的也非常準,這種人工譯員確實可以利用?!睆垈フf?!暗藱C耦合就是個偽命題,因為同傳工作路徑與訊飛的工作路徑平行,這怎么耦合?好比兩列齊頭并進的火車,同傳譯員邊聽邊譯,人工智能識別采用的信號起始點與譯員的起始點一模一樣。你不比我們快,你的車頭不可能站我們前邊拉火車。而站我們后面,我們又不需要你了?!?/p>
而且,無論是科大訊飛還是騰訊的翻譯君,在這幾次會議同傳中,都沒有任何輔助人類同傳的行為。
一位曾在博鰲大會與騰訊翻譯君“一同”為觀眾提供同傳的譯員,曾對PingWest品玩回憶當時的工作場景:“會場內有一塊屏幕,會出AI同傳字幕,而人類同傳譯員照例坐在會議室后面角落的同傳間里,根本看不到。工作時不可能再分心去關注它,也更沒有‘共同工作’的情況。可以比喻成兩套班子同時工作。我們也是從社交媒體上看到有關報道才知道有騰訊的產品在現(xiàn)場的?!?/p>
而在科大訊飛此次的風波中,訊飛聽見系統(tǒng)只是把同傳的聲音轉為文字,不僅提不上幫助,而且更多是在依賴人類同傳。而且這種語音轉字幕功能在同傳場景下更顯的奇怪,炫技的成分多于解決實際需求的作用。
“現(xiàn)在很多所謂AI同傳在會場的實現(xiàn)方式都是打字幕,這樣的設計明顯是反人類的,可能更適合聽障人士。因為人們通過聽力可以獲取更多信息,而且還能邊聽邊把眼睛用在別的地方,比如看看PPT,或者看著本子記筆記等等,用來看字幕就太奇怪了。”
“從我的觀察來看,這些機器翻譯技術公司里,應該是沒有哪怕一個懂同傳的人來幫他們提供建議。”張偉說。
PingWest品玩采訪的多名不同背景的同傳都表示,沒有聽說有翻譯、同傳等專業(yè)背景的人進入科技公司參加機器翻譯研發(fā)的工作,而他們也都沒有和研究機器翻譯的人員有過什么直接交流。
科大訊飛翻譯業(yè)務的負責人翟吉博曾對PingWest品玩介紹,他們的團隊中也有翻譯出身的人,但具體的職責僅僅是測試,對系統(tǒng)進行評估,制訂些標準。也就是并不會參加到最核心的討論中。據(jù)PingWest品玩了解,微軟、搜狗等公司情況也類似,翻譯技術團隊多以機器學習、大數(shù)據(jù)等專業(yè)背景的專家為主,很少有傳統(tǒng)英語學科背景的人加入。
但事實上,雙方的這種”絕緣“并非一直如此。
最早在上世紀70年代,基于規(guī)則的機器翻譯理論最早被提出,也被稱作傳統(tǒng)的自然語義方法,它屬于最初的AI研究流派之一:“symbolic AI”。這種方法實現(xiàn)翻譯的方式是,把所有英語和中文語法規(guī)則和一整本英語詞典及一整本中文詞典編碼進機器,之后輸入英語句子后,機器就對應地得出一句中文。
這其實是嘗試模仿人類對語言的理解。“傳統(tǒng)的自然語義方法是按照人類的理解來理解?!秉S學東對PingWest品玩表示。當時最初的機器翻譯研究者,經常需要向語言學專業(yè)的專家請教,共同研發(fā)。
但之后,到了90年代,基于統(tǒng)計的方法被應用到機器翻譯領域,并給翻譯效果帶來巨大的躍升。研發(fā)者也紛紛轉向基于統(tǒng)計的機器翻譯方法。這種方法更像是純粹的計算機方法,已經與傳統(tǒng)自然語義方法有很大不同,也不再對研究翻譯和語言學等學科的人們有太多依賴。
而進入最近5年,深度學習再次推動機器翻譯的進步。2011年谷歌開始研發(fā)和使用的“神經網絡”模仿人類大腦由神經元構成的結構,每一層神經網絡都會對數(shù)據(jù)進行分析以找到其中存在的規(guī)則,多層的神經網絡則類似現(xiàn)在流行的深度學習概念,可以發(fā)尋更多的范式。2016年,谷歌將神經網絡用于其翻譯產品上,再次大大提升了翻譯質量,逐漸成為現(xiàn)在各家科技公司機器翻譯技術的主流。
至此,機器翻譯的邏輯與人類進行翻譯的方法分別走向兩條岔路。
不確定的未來
“機器翻譯的算法和人類思維很不同。”黃學東說。“簡單形象地描述,機器翻譯是把一種人類語言投射到一個數(shù)字化的高維空間,然后在此進行解碼,解碼成另外一個語言。這個空間高維到人類不可想象?!?/p>
“機器翻譯和人類翻譯的邏輯很不一樣,其實對于我們來說,也沒必要去研究人類同傳或翻譯的邏輯,關鍵的是算力和數(shù)據(jù)?!币幻趪鴥瓤萍计髽I(yè)負責機器翻譯團隊的產品經理對PingWest品玩表示。
黃學東也表示,提升機器學習的質量,要靠高質量的數(shù)據(jù)、不同的算法模型以及性能完善的軟件系統(tǒng)。他表示,今年3月微軟的機器翻譯系統(tǒng)在一個中-英新聞測試集上,達到了可與人工翻譯媲美的水平。此次突破主要依靠的就是機器學習組新研發(fā)的對偶學習、推敲網絡等模型,其中不少都是受人類工作模式的啟發(fā)。
但是,雖然每個模型的原理都能說清楚,靈感也可能是在模仿人類,然而融合了這些模型的端對端系統(tǒng)則是一個超大的神經網絡黑箱。它會自己把機器翻譯的模型學習出來,外部很難弄清楚里面發(fā)生了什么。這樣的方式也讓機器翻譯存在著不可解釋性。
在此前博鰲論壇出洋相后,騰訊就對其中出現(xiàn)亂碼的情況進行分析,最終給出的解釋便是:“出現(xiàn)這種情況主要是包括神經網絡機器翻譯在內的深度學習算法,在原理上或多或少都有一定不確定性,在特定的情況下有一定的概率引發(fā)翻譯偏差。”
而這些在機器翻譯研究者眼中已經習慣的“特性”,對于普通人來說則可能帶來擔憂。小L就對機器翻譯領域大量的晦澀術語十分反感。“我對機器翻譯只有很簡單了解過,我看不懂那些復雜的算法和技術?!毙說?!暗俏液芊锤羞@些公司在犯錯的時候拿什么不確定性或者其他聽起來很嚇人的AI高級術語來搪塞。”
小L形容,每每聽到科技公司不斷宣傳“只要數(shù)據(jù)足夠多,就能訓練出與人一樣水平的翻譯”時,就好像聽到猴子足夠多就能寫出莎士比亞全集一樣,初聽荒謬可笑,細想?yún)s感到嚇人:“如果失控了怎么辦?”
除此之外,一些以翻譯為終生事業(yè)的人們還在思考,人類與機器在對待語言和翻譯這件事上的不同,會帶來什么后果?
人類學習外語時,以理解這門語言為目的,但機器看起來則僅僅是完成了從輸入到輸出的任務,在不少語言學者的眼里,它似乎永遠不能算是“懂得”了一門語言。
“這是個非常好的問題,有各種各樣不同的觀點。”黃學東表示,機器翻譯過程中,就是從低維空間到高維空間的投射過程,從計算機角度講,它就是理解了這個語言。反過來說,機器在高維空間非常得心應手,但對于我們人類又是不可理解的?!?/p>
“人類的語言和機器的語言是不一樣的,而我們現(xiàn)在用了一種機器可以理解的方案,來完成人類語言的翻譯,它的效果遠比基于人類知識結構方法來設計的機器翻譯,要好很多?!秉S學東說?!斑@就是理想與現(xiàn)實的差距。”
其實我們人類還不是也一樣,誰也說不清到底人腦是怎么運行,但我們不是一樣在依賴它?那如果有一天我們訓練的機器可以穩(wěn)定輸出,媲美人類,那為什么不能依賴機器呢?”上述產品經理對PingWest品玩說。
就這樣,AI繼續(xù)吃進大量的數(shù)據(jù)、補充各種新鮮的模型,從而自我進化,然后參加機器翻譯的比賽,用科技界自己設立的標準來衡量著進步程度;另一邊,人類同傳則繼續(xù)提升自己對語言的理解,磨練自己的翻譯技巧,像傳統(tǒng)的手藝人一樣把這種工匠技藝傳承下去。而且,兩者并不怎么溝通。
人類自有文明交流以來便伴隨出現(xiàn)的語言翻譯這件事,正走入兩個分岔路。兩者就像在兩個平行宇宙運行,何時會重合?還是會帶來沖突?
目前沒人知道。