原标题:《集异璧》作者侯世达疯狂吐槽谷歌翻译:AI让译者失业?还早着呢

原标题:在我的私人硬盘里,这片被打开过50次

原标题:男人好色,女人拜金?| 真实择偶中的性别差异

机器能在完全不理解语言的情况下拿出高品质的翻译作品吗?本文来自微信公众号:神经现实(ID:neureality),作者:侯世达(DOUGLAS
HOFSTADTER,美国著名认知科学家、比较文学家、翻译家,印第安纳大学认知科学和比较文学教授、著有《哥德尔、艾舍尔、巴赫:集异璧之大成》,该书获得普利策奖和美国国家图书奖),原文发表于《
THE ATLANTIC》。

这些年,我们已经习惯于将好莱坞大片和超级英雄、奇幻特效挂钩,一谈好莱坞就要谈特效、大制作;

大学堂

(salsa
sessions),我的朋友弗兰克带了一个丹麦朋友来。我知道弗兰克的丹麦语讲得很好,因为他的母亲是丹麦人,他小时候曾在丹麦生活过。而他带来的那个朋友,跟所有斯堪的纳维亚人一样,能讲一口流利的英语。然而,令我惊讶的是,在晚上闲聊的过程中,他们居然习惯性地用“谷歌翻译”交换信息。弗兰克用英文写下文字,然后用“谷歌翻译”转译成丹麦语;而他的朋友则用丹麦语写下文字,然后用“谷歌翻译”转译成英语。

但却忘了,好莱坞称霸全球的王牌,正是一个个妙趣横生而又不乏思考的故事。

这太奇怪了!为什么会讲对方语言的两个聪明人要用这种方式沟通呢?我对机器翻译的体验总是让我对它不够信任。但这两个朋友显然没有我的那种疑虑。实际上,很多受过良好教育的人对于机器翻译都抱有相当大的热情,很少对它产生质疑。这让我颇感困惑。

有太多美式经典电影值得我们反复回味,下面这部就被我刷过50遍——

作为一个语言爱好者和翻译热爱者,作为一个认知科学家和一个人类精妙心智的终身敬畏者,几十年来我一直在关注机器翻译的进展。当我最初在1970年代对它产生兴趣时,我读过一封信,是数学家、机器翻译早期倡议者沃伦·韦弗(Warren
Weaver)于1947年写给控制论专家诺伯特·维纳(Norbert
Wiener)的。在信中,韦弗写了一句很有意思的话,今天仍为众人所熟知:

《幸福终点站》

几年后,他表达了不同的看法:“没有一个理性的人会认为,机器翻译能够做到‘信、雅、达’。普希金不需要为此感到担忧。”
哈!我曾用了我人生中整整一年的时间,将亚历山大·普希金的著名诗体小说《叶甫盖尼·奥涅金》翻译成我的母语(也即是,把这一伟大的俄罗斯文学作品重新翻译成英文诗体小说),这真是一段令我难忘的经历。我发现维纳的新观点揭示了语言朴素的本质,更接近于语言的真相。尽管如此,他在1947年提出的“翻译即解码”的观点还是成为了机器翻译领域的一种信仰。

The Terminal

女朋友这么漂亮,他应该很有钱吧?

从那以后,“翻译机器”逐渐有了发展。直到最近,对所谓“深度神经网络”的使用,让有些观察家(参见纪德·刘易斯-克劳斯(Gideon
Lewis-Kraus)在《纽约时报杂志》上发表的《The Great AI
Awakening》,以及雷恩·格林(Lane Greene)在《经济学人》上发表的《Machine
Translation: Beyond
Babel》)宣称,人类译者将成为濒危物种。照此发展下去,用不了几年,人类译者要做的事情就不是创造新的文本了,而是对文本进行修修补补和质量控制。

图片 1

无论是相差19岁的刘强东和章泽天步入婚姻殿堂,还是年龄差30岁的杨采钰和陈金飞公开恋情,网络上总有人议论纷纷,“老牛吃嫩草”、“拜金”、“傍大款”……虽然听起来有些吃不到葡萄说葡萄酸的味道,但也算是生动形象地描绘了传统上以为的择偶偏好——男性(相较于女性)更喜欢身体有吸引力的女性,女性(相较于男性)更倾心于有良好收入前景的男性。

果真如此的话,这将对我的精神生活造成巨大的冲击。虽然我完全理解人们对机器翻译的痴迷,但我肯定属于最不希望人类译者被无情的机器所取代的那类人。事实上,机器翻译令我感到恐惧和厌恶。在我看来,翻译是一种难以置信的精妙艺术,它需要译者有丰富的人生阅历和创造性的想象力。

这部由斯皮尔伯格执导,汤姆·汉克斯主演的电影,位列豆瓣TOP250,评分高达8.7

《进化心理学》一书作者David
Buss所说,“男人都好色,女人都拜金。“这句话也不无道理,从进化心理学的角度而言,男人喜欢拥有健康、迷人身体特征的女性,可能由于她们更高的繁殖潜能。同样,从进化的角度而言,女性更喜欢能为其后代提供保障的男性,也就是物质基础丰厚的男性。

每当我读到文章宣称,人类译者作为一个群体将很快向新技术的快刀利剑俯首称臣时,我总有一种想要亲自检验这种判断的冲动,这一方面是因为,我感到技术替代的魔魇可能近在眼前;另一方面是因为,我由衷希望自己能够确证,危险并非迫在眉睫;最后,出于我一贯的信念,我想要挑战那些夸大其词的人工智能威胁论。

图片 2

有无数不同的实验都证明了这一说法十分可靠。比如社会学家Reuben
Hill要求参与者对自己看重异性若干品质的程度进行评价,发现女性参与者更看重男性的经济收入而男性更看重女性的好看程度;进化心理学家Buss跨越了37个文化,调查了10,047人,也出类似的结论——在择偶偏好中存在性别差异。

人工神经网络并不是一项新奇的技术。最近,在谷歌内部被称为“谷歌大脑”(Google
Brain)的部门采用了这项技术,同时,又用“深度学习”增强了它的能力。我阅读了相关文献,了解了被称为革命性翻译机器的软件机理,然后,我决定亲自测试最新版本的“谷歌翻译”。它真的是一个颠覆者吗,就像“深蓝”和“AlphaGo”之于象棋和围棋那样?

当年这部影片曾被引进中国内地放映,可惜票房结果却并不理想。那时候的票房,好故事已经让位给了肾上腺素。

但是,这些理论大多来源于实验室实验,是一种对异性的“虚拟选择“。也就是说,这是人们在完全理性的情况下做出的选择。实际上,走出实验室后,人们真的会按照他们所表现的那样在选择伴侣方面出现性别差异吗?

我发现,虽然“谷歌翻译”的老版本可以处理多种语言,但新的深度学习版本目前只能处理9种语言。(最新情况是,它可以处理96种了。)其中,我只打算测试英语、法语、德语和中文。

图片 3

图片 4

在展现测试结果之前,我应当指出,“深度”这一形容词的含义是模糊不清的。当人们听说谷歌买了一家名叫DeepMind的公司,其产品使用了用“深度学习”技术增强的“深度神经网络”时,下意识中会将“深度”一词理解为“深刻”,进而理解为“强大”、“颖悟”、“聪明”。然而,这里的“深度”仅仅是指这样一个事实:新的神经网络比老的神经网络拥有更多的层次,比如说,前者有12层,后者只有2、3层。那么,这种层级数量的差异是否意味着,神经网络必然会更聪明呢?并非如此,这不过是语义上的误解。

男主角维克多·纳沃斯基乘坐飞机抵达美国,就在他刚刚落地准备办理入境时却被告知一个不幸消息:

我们真的约会了

“谷歌翻译”的宣传声势浩大,但我对它却持有谨慎态度。尽管对它并无好感,但我也意识到它的确带来了一些惊喜。它对地球上的每个人都是免费的,能够将差不多100种语言转译成任何一种其他语言。这真是一件了不起的成就。如果我可以骄傲地称自己是“三种全会”(pi-lingual)的话[1](如果有人问我“你会说几种语言”,我会很愉快地回答,大概会3种语言),那么“谷歌翻译”得有多骄傲啊,毕竟,它可以把自己称为“百种全会”(bai-lingual)(“百”在中文里是指数字“100”)。对于只会3种语言的人来讲,会100种语言简直难以想象。并且,如果我将一张语言A的文字复制粘贴,放进“谷歌翻译”,不消几秒钟,它就能被翻译成语言B。在数种语言之间自由转换,这种效果在任何地方任何屏幕上都能实现。

他的祖国,一个虚构的东欧国家,在他飞行途中爆发了政变

来自西北大学的心理学家Eastwick和Finkel对此感到非常好奇,于是招了一群单身狗学生,来了一场大型·真人·线下·快速·交友活动,即“快速约会(speed-dating)范式“。

“谷歌翻译”和相关技术的实用性是毋庸置疑的,总体而言也是很好的工具。但它在技术方法上还是极度欠缺一种东西,一言以蔽之:理解力。机器翻译绝对做不到理解语言。相反,它的方法只是试图去“解码”——而不去考虑究竟什么是理解和意义。那么,是否不需要理解就能做好翻译呢?某种事物——人类或机器——能在完全不理解语言的情况下拿出高品质的翻译作品吗?为了回答这个问题,现在我要谈及我所做过的几个实验。

图片 5

在激动人心的见面之前,这些学生需要提供自己的基本信息和交友倾向,包括是否看重理想型(即理想的异性伴侣)的身体特征、收入前景和性格等问题——这是“声称择偶偏好”。

01

由于政权状态不明,外交关系中断,他的护照、银行卡等证件都被判无效。用政府官员的话来说,他现在等同于没有国籍

盼星星盼月亮,单身贵族终于盼到了面基约会的那一天。快速约会在一个隐蔽的画廊举行,每位前来的贵族都会获得一个姓名牌(写上数字或字母+名字),一支笔和一系列互动记录问卷。之后,贵族需要拍摄一张(直到满意为止)的照片。

In their house, everything comes in pairs. There’s his car and her
car, his towels and her towels, and his library and hers.

图片 6

等到所有实验参与者就位后,正式的快速约会开始了。约会一共有7轮,其中3轮男性坐在座位上,女性在男性中自由选择交谈对象,剩余4轮则女性就座,男性选择女性进行谈话。在每一轮对话结束后,参与者被要求在写下之前的约会记录,包括对对方的吸引力、收入前景和个性进行打分。每名参与者会与所有在场异性约会,因每场到场人数有差异,每个人的约会对象有9-13名不等。

在他们的房间里,每样东西都是成对出现的。有他的车,就有她的车;有他的毛巾,就有她的毛巾;有他的书房,就有她的书房。

回家的航班被无限期延后,近在咫尺的美国也无法入境,他被迫滞留在机场航站楼内等候处理。

快速约会后的第一天,参与者在相关网站表明他们是否希望和约会过的对象再次见面。网站上会呈现照片和姓名牌,参与者可以选择“是”或“否”来决定是否继续约会。如果双方都选择“是”,说明他们匹配成功,能获得对方的联系方式;若只有一方选择了“是”,则选择“否”的一方有权利变更自己的选择以便进行深入了解;若双方都选择“否”,就说明他们缘分未到,不能继续约会。

(以及在其他拉丁语系中),“他”和“她”这样的性别词汇不是由事物的所有者来界定的,而是由事物本身来界定的[2]。于是,“谷歌翻译”呈现给我们的结果就是:

这一等,就是九个月

快速约会后的第二天到一个月内,每隔72小时研究参与者都需要完成一份后续问卷,再次对异性的吸引力、收入前景和个性进行评价。此外,他们还需要对这段新关系进行全面评价。

Dans leur maison, tout vient en paires. Il y a sa voiture et sa
voiture, ses serviettes et ses serviettes, sa bibliothèque et les
siennes.

图片 7

图片 8

在他们的房间里,每样东西都是成对出现的。有他的车,就有他的车;有她的毛巾,就有她的毛巾;有他的书房,就有他们。

试想,一个没有护照又没有钱的人,在机场航站楼里能做些什么?那里除了一堆奢侈品牌免税店,就是高于市价的机场快餐。

我们都是言行不一的人

这样的结果在我预料之中。它没能意识到,我的这段话描述的是一对夫妻,强调了丈夫(他)拥有的每一样东西,他的妻子(她)也拥有。例如,深度学习引擎用了“sa”(他的)这个词来表示“他的车”和“她的车”,因此,你无法知道车主的性别。类似地,它还用了无性别的复数词“ses”来表示“他的毛巾”和“她的毛巾”。至于最后提到的两个书房(他的和她的),它则干脆省掉了“hers”中的“s”,认为“s”在这里表示复数,意指“他们”(“les
siennes”)[3]

为了生存下去,维克多做了很多令人啼笑皆非的事情:

从各类问卷反馈的数据中,Esatwick和Finkel再次验证了人们在未遇见真实约会对象时的择偶倾向存在性别差异,意味着通常认为“男人好色,女人拜金”在“虚拟选择”中是存在的。但是,这个研究最有意思的发现在于——虽然身体吸引力、收入前景和性格在实际的交友过程中,都有很重要的作用,但是不同性别之间并没有差异。也就是说,“男人好色,女人拜金”在真实的择偶过程中是不成立的。也可以这么说,男人女人都好色,男人女人都拜金。

Chez eux, ils ont tout en double. Il y a sa voiture à elle et sa
voiture à lui, ses serviettes à elle et ses serviettes à lui, sa
bibliothèque à elle et sa bibliothèque à lui.[4]

睡的问题比较好解决,两排椅子并并拢就是一张床,凑合睡还是没问题的。

另外,“声称择偶偏好”也和实际择偶情况相去甚远。打个比方,A声称自己在恋爱对象的选择上特别在意对方身体吸引力,而B认为自己不在意恋爱对象的身体吸引力。在面对他们觉得有身体吸引力的人的时候,与B相比,A并不会更喜欢或更容易感到化学反应。

“sa voiture à elle”表示“她的车”,而“sa voiture à
lui”只能被理解为“他的车”。这时,我猜想“谷歌翻译”应该很容易把我的法文版本准确翻回到英文,但我完全想错了。下面是它呈现给我的结果:

图片 9

图片 10

At home, they have everything in double. There is his own car and his
own car, his own towels and his own towels, his own library and his
own library.

洗漱甚至洗澡问题,只要脸皮厚,在机场厕所也都能完成。

那么,什么原因可能导致参与者“虚拟选择”中的性别差异消失呢?又是什么让我们的“声称择偶偏好”和实际择偶情况大相径庭呢?或许有以下三种解释。

这都什么鬼啊?!即便输入的语句专门强调了物主的性别,翻译机器还是忽略了这一点,把所有性别都翻成了男性。

图片 11

第一,我们根本不知道自己喜欢或讨厌一个东西的原因。比如Nisbett和Bellows曾让两组参与者观看一部电影并进行评价,其中一组增加了额外的噪音。增加了噪音的一组观众表示这部电影不好看,理由是噪音影响了观影体验。有趣的是,没有噪音的那一组观众同样认为这部电影不好,他们的评分与前一组的分数无差异。同样的,我们在评估自己喜欢那个TA而不是其他人的原因时,可能过于看重或看轻一个表面的原因,而没有真正的自省。也就是说,有时候我们不是真正清楚自己为什么喜欢或讨厌某件事、某个人。

我们人类都知道,什么是夫妻、房屋、个人物品、骄傲、竞争、嫉妒、隐私,以及很多其他似乎难以理解的怪癖,比如,结了婚的夫妻,各自的毛巾也要分别刺上“他的”和“她的”字样。而“谷歌翻译”却不明就里,或者准确地说,它暂时还不明就里。它只熟悉由字母所组成的字符串,只知道以超快的速度处理一段段文字,而不知道如何思考、想象、记忆和理解这些文字。它甚至不知道文字指涉了事物。我可以毫不犹豫地说,理论上讲,计算机程序本可以理解语言的用途,可以拥有思想、记忆和经验,可以应用它们。

最大的难题就是吃饭,没钱就只能饿肚子。

第二,我们有“共情鸿沟(empathy
gap)”。参与者在见到约会对象之前进行的汇报是冷静而理性的,他们可能忘了考虑浪漫关系过程中情感的影响。

(one swallow does not thirst quench.)

一开始,维克多充分利用机场里的免费餐饮自制酱料饼干三明治

第三,“快速约会范式”带来的误差。由于实验参与者见到的异性数量受到快速约会的限制,参与者可能只是在其中选择最好的异性,而不是按照理想的择偶标准进行选择。

事实上,“one swallow does not thirst quench”[也意指“一燕不成夏”(one
swallow does not a summer
make)]这句话是我生造的,我忍不住想要试试,“谷歌翻译”会怎么翻呢?反馈给我的结果如下:

图片 12

图片 13

“Une hirondelle n’aspire pas la soif.”

但想象一下那味道,就知道这不是长久之计。

只有一个愿望——变美变帅变有钱

这是一个符合语法的法文句子,但它的意思很费解。首先,它提到了一种鸟(“une
hirondelle”——一种燕子)(n’aspire
pas),最终的意思就是说,这种既不吸气又不吮吸的东西口渴了(la
soif)。显然,“谷歌翻译”没有理解我的意思,它只是生成了一堆胡言乱语。“Il
sortait simplement avec un tas de taureau.”“He just went out with a pile
of bulls.”(他只是说了一堆胡话。)“Il vient de sortir avec un tas de
taureaux.”[5]

后来,维克多注意到行李手推车回归原位就能退回1枚硬币,就像我们平时在超市里那样,只是机场里的大多数乘客往往赶时间不会在意这点零钱。

打破了传统观念的研究结果不仅让学堂君深思。我们想象中自己喜欢的类型和自己真正择偶的类型或许不是那么一致,那么所谓填写了一大堆择偶倾向的相亲网站是否靠谱?如果男女在择偶偏好上没有差异,是否意味着所有人都应该同时重视自己的收入前景和外表?

02

图片 14

有趣的灵魂千里挑一,好看的皮囊也是。

(Karl Sigmund)写的《Sie nannten sich der Wiener
Kreis》(人们把他们称为“维也纳学派”)一书。它讲述了维也纳的一群理想主义知识分子在1920年代和1930年代的故事,这群人对20世纪的哲学和科学产生了巨大影响。我选择了书中的一小段文字来考验“谷歌翻译”。我将先呈现德语原文,然后给出我自己的翻译版本,最后给出“谷歌翻译”的版本。(顺便提一句,有两个母语是德语的人核对了我的翻译,包括卡尔·西格蒙德,因此,我认为你大可相信我的翻译是准确的。)

于是,维克多开始每天在机场里「回收」手推车,三枚硬币就能换一个汉堡,管饱肚子不成问题。

这是京师心理学堂第n次发文表示:两个集体的差异远没有一对双胞胎之间的差异大。

西格蒙德:

图片 15

而常言有道:“爱美之心人皆有之”。渊博和忠厚、美色与金钱,这都是“美”,但为何社会氛围偏看低“好色”和“拜金”呢?学堂君猜想:可能在生存和繁衍的本能里,美色过于“无用”,金钱过于“有用”。所以爱色成了肤浅,爱金成了贪图捷径。

Nach dem verlorenen Krieg sahen es viele deutschnationale Professoren,
inzwischen die Mehrheit in der Fakultät, gewissermaßen als ihre
Pflicht an, die Hochschulen vor den “Ungeraden” zu bewahren; am
schutzlosesten waren junge Wissenschaftler vor ihrer Habilitation. Und
Wissenschaftlerinnen kamen sowieso nicht in frage; über wenig war man
sich einiger.

图片 16

着眼于现实,或许我们早就该把对美和钱的合理追求正常化,把两者放回到等同其他美好的事物的地位当中。

侯世达:

知情的警卫们每天就在楼上看着他满机场乱窜,乐得就跟看综艺现场直播似的;

参考文献:

After the defeat, many professors with Pan-Germanistic leanings, who
by that time constituted the majority of the faculty, considered it
pretty much their duty to protect the institutions of higher learning
from “undesirables.” The most likely to be dismissed were young
scholars who had not yet earned the right to teach university classes.
As for female scholars, well, they had no place in the system at all;
nothing was clearer than that.

战败之后,泛德国主义在当时的教职员工中是主流倾向,很多持有这种倾向的教授认为,自己完全有责任让高等教育机构免受“政治上不受欢迎的人”的影响。最有可能被开除的是青年学者,他们还没有获得在大学授课的教职。对于女性学者而言,她们在大学里更是没有立足之地,这是再明显不过的事实了。

After the lost war, many German-National professors, meanwhile the
majority in the faculty, saw themselves as their duty to keep the
universities from the “odd”; Young scientists were most vulnerable
before their habilitation. And scientists did not question anyway;
There were few of them.

战败之后,很多德国籍的教授,同时也是教职员工中的多数派,认为自己有责任让大学避免“奇数”;在获得资格之前,青年科学家是最容易受到影响的。总之,科学家没有产生质疑,几乎没有了。

图片 17

[1] Eastwick, P. W., & Finkel, E. J.
(2008). Sex differences in mate preferences revisited: do people know
what they initially desire in a romantic partner?. Journal of
Personality & Social Psychology,94(2),
245-64.

首先,我注意到了“odd”这个词。它对应了德文中的“die
‘ungeraden’”,意思是“政治上不受欢迎的人”。然而,“谷歌翻译”有理由——出于非常简单的统计学上的理由——选择“odd”这个词。也即是说,在其上百种语言的数据库中,“ungerade”这个词总是被译作“奇数”(odd)。尽管机器本身并不知道为什么会这么翻,但我可以告诉你原因何在。

但机场管理员不开心了。

[2] Hill, R. (1945). Campus values in
mate-selection. Journal of Home Economics,37,554–558.

这是因为“ungerade”的意思——字面意思是“不平的”或“不均匀的”——几乎总是意指“不能被2除尽”。而我的翻译版本有意选择了“undesirables”一词,从而使得对“Ungeraden”一词的翻译与统计概率无关,而是来自于我对语境的理解——来自于我注意到文字中没有被清晰表达出来的含义,而且“ungerade”的这种含义绝不可能在我自己的德语词典中找到。

图片 18

[3] Buss, D. M. (1989).Sex differences
in human mate preferences: Evolutionary hypotheses tested in 37
cultures. Behavioral and Brain Sciences,12,1–49.

让我们再来看看“Habilitation”这个德语词汇,它意指大学的教职,相当于终身教授。英文里也有同样词根的词“habilitation”,不过它很少被使用,自然也不会让人联想到终身教授或者类似的事物。所以,我需要简单解释而不只是引用这个含义模糊的词。机器翻译不可能真正理解以英文为母语的读者,“谷歌翻译”当然也做不到这一点,因为它不能模仿读者的知识。

对他来说,维克多是一个大麻烦,如果想升职加薪,就得尽早把这烫手山芋从自己手上甩掉。

[4] Nisbett, R. E., & Bellows, N.
(1977). Verbal reports about causal influences on social judgments:
private access versus public theories. Journal of Personality &
Social Psychology,35(9), 613-624.

不过,最后两句话才真正表明了,为什么理解对于翻译而言至关重要。德语名词“Wissenschaftler”由15个字母组成,意思是“科学家”或“学者”。(我选择了后者,因为在文中的语境下,它意指一般意义上的知识分子,而“谷歌翻译”则没能理解这一细微之处。)另一个与此相关的词“Wissenschaftlerin”由17个字母组成,我们可以在最后一句话中看到其复数形式“Wissenschaftlerinnen”,它是一个指代了性别的德语名词。单数名词在语法上指代男性,意指男性学者,复数名词指代女性,只适用于女性学者。我自己的翻译版本用了“女性学者”(female
scholar)来理解这层意思。而“谷歌翻译”并没有理解增加了“in”这个后缀的阴性词是最后这句话的核心意义所在。由于它没能意识到“女性”这层意思,就只能再次使用“科学家”这个词,因此没有理解整句话的意思。就像前面的法语例子一样,“谷歌翻译”完全不理解,这段德文的中心意思是要比较男性学者和女性学者的不同境况。

他自以为机智就想出了一招「钓鱼执法」——

作者 | Leena

除开这个错误,最后一句话的余下部分也是翻得一塌糊涂。先看前半部分。“总之,科学家没有产生质疑”(scientists
did not question anyway)(Wissenschaftlerinnen kamen sowieso nicht in
frage)的正确翻译吗?显然,它没能呈现出原文的意思——甚至完全挨不上边。它只是随意地将德语词汇翻成了英语词汇。这样的结果可以被贴上“翻译”的标签吗?

先怂恿维克托逃跑,然后再以强行入境的罪名将其抓捕,就能名正言顺地将其交移其他有关部门处理,成功脱手,耳根清净。

编辑 | J16

这个句子的后半部分同样是错译的。最后6个德语词汇的字面意思是,“没有更多的共识了”,或者更直白一点,“这就是人们达成的最大共识了”。然而,“谷歌翻译”却将这句意思很明确的话翻成了“几乎没有了”。作为人类的我们可能会问“几乎没有什么了?”但翻译机器是不会关心这个问题的。“谷歌翻译”对于语境完全不理解,因此它甚至不能回答看上去很简单的问题。翻译引擎不能想象数量的大小或者事物的数量。

图片 19

(本文由京师心理大学堂原创,欢迎转发至朋友圈,如需转载请联系后台,征得作者同意后方可转载)返回搜狐,查看更多

03

图片 20

责任编辑:

人类有着丰富的人生阅历,也能赋予语言以意义,因此很难察觉到“谷歌翻译”呈现在屏幕上的文字是漏洞百出的。人们几乎会不假思索地认为,一款能如此流畅地翻译语言的软件一定能够理解文字的含义。这种典型的幻觉与人工智能有关,被称为“伊莉莎效应”(ELIZA
effect),它迷幻了人们的双眼,让人们误以为机器可以理解英语。
时光回到1960年代,研究人员设计了一个被称为“伊莉莎”的虚假的语言机器人,并把它假扮成了一个精神治疗师。“伊莉莎”让每一个与它打过交道的人产生了一种奇怪的感觉:它能够深刻理解人们心灵深处的感受。

维克托虽然看起来傻,但不蠢,而且内心正直,逃跑这种下三滥的招数他是绝对不会做的。

几十年来,颇有见识的人们——甚至一些人工智能的研究人员——也陷入了“伊莉莎效应”。为了确保我的读者避开这一陷阱,让我从前面的段落中引用一些词组——也即是,“‘谷歌翻译’没有理解能力”,“它不能意识到”,“‘谷歌翻译’没有最起码的想法”。然而悖论之处在于,这些词组一直在说“谷歌翻译”欠缺理解力,而这同时又意味着,它至少在有些时候应该具备理解一个单词、一个词组或一句话的含义或所指事物的能力。但事实并非如此。“谷歌翻译”绕开或回避了对语言的理解。

钓鱼执法失败,维克托继续滞留在机场。

对我而言,“翻译”这个词散发着神秘而振奋的光芒。它代表了一种深刻的人类艺术形式,能够优雅地将用语言A表达的清晰思想转化成用语言B表达的清晰思想。而这种转化的桥梁不仅仅要确保清晰性,还要呈现出原作者的品味、癖好和写作风格。

图片 21

不消说,这些光环大多是无意识的。只有当这种光环在我脑海中被成功激发出来时,我才会试图去用另一种语言将它表达出来——让它“喷薄而出”。我希望能用语言B将那种光环表达出来。

《幸福终点站》上映于2004年,而早在1993年,一部法国电影《从天而降》也讲述了相同的故事:

简而言之,我并不是简单地将语言A中的单词和词组转化成语言B中的单词和词组,而是要在无意识中将图像、场景、思想呈现出来,发掘出我自己的人生经历(或者读过的书籍、看过的电影、朋友的教诲)

男主角因为在机场丢失护照而被滞留在机场,从而经历了一系列荒诞而有趣的故事。

事实上,跟“谷歌翻译”2、3秒就能翻出一个页面的速度相比,情况的确如此——但这正是严肃的人类译者应该做的事情。每当我听到那个令人亢奋的术语“深度心智”(deep
mind)时,我所想到的正是上述场景。

图片 22

04

这两部影片其实都基于同一个真实事件改编而成:

现在,我要转向对中文翻译的测试,这对深度学习软件的挑战比前两种欧洲语言要大得多。我的测试材料来自令人温暖的回忆录《我们仨》,作者是中国剧作家和翻译家杨绛,她刚去世没几年,享年104岁。该书讲述了她、她的丈夫钱钟书(也是一个小说家和翻译家)(已经过母语为中文的人的审校):

1988年,伊朗政治难民梅安•纳塞瑞(Merhan
Nasseri)从比利时去往英国的途中,在法国被偷走了难民身份证明。

杨绛:

图片 23

After Zhongshu had worked at Tsinghua University for a year, he was
transferred to the committee that was translating selected works of
Chairman Mao. He lived in the city, but each weekend he would return
to school. He also was still supervising his graduate students.

The leader of the translation committee of Mao’s works was Comrade Xu
Yongying, and the person who had arranged for Zhongshu to do this work
was his old Tsinghua schoolmate, Comrade Qiao Guanhua.

On the day this appointment was decided, after dinner, an old friend
specially hired a rickshaw and came all the way from the city just to
congratulate Zhongshu. After our guest had left, Zhongshu turned to me
uneasily and said:

“He thought I was going to become a ‘South Study special aide.’ This
kind of work is not easy. You can’t hope for glory; all you can hope
for is to do it without errors.”

没有盖章文件,他无法入境英国;比利时拒绝已经离开的难民二次入境;法国因无法证明其身份也不允许他留下来。

谷歌翻译:

三方僵局之下,纳塞瑞被滞留在法国戴高乐机场,足足待了16年

After a year of work at Tsinghua, he was transferred to the Mao
Translating Committee to live in the city and back to school on
weekends. He is still a graduate student.

The leadership of the Mao Tse Translation Committee is Comrade Xu
Yongjian. Introduction to the book to do this work is Tsinghua
students Qiao Guanhua comrades.

On the day of the event, after dinner, an old friend hired a rickshaw
from the city to congratulate. Guest to go, the book of fear in the
book said to me:

He thought I had to do “South study walking.” This is not a good thing
to do, not for meritorious service, but for nothing.

图片 24

我将简要指出一些谬误之处。

有趣的是,1996年和1999年,比利时和法国都已经分别同意接收其为本国居民,但纳塞瑞却坚称想居住英国而拒绝离开。

首先,“谷歌翻译”完全没有提到“钟书”这个名字,而它在原文中出现过3次。翻译机器首先用了代词“他”,然后又用了“这本书”(the
book)(the book of fear in the book)

换句话说,只要英国当局一天不开绿灯,他就一天不离开法国机场。

第四处谬误是,“永煐”这个名字被译成了“Yongjian”。

(法国当局:我还能怎么办?!)

第六处谬误是,最后一句话完全不知所云。好吧,这六处错误已经能让“谷歌翻译”够喝一壶的了,不过我们完全可以不用在意这些错误。现在,我将集中探讨一个令人费解的词组——最后一段话中由5个单词组成的、用引号标注的词组(“南书房行走”)。如果逐字翻译,这个词组可以被译作“south
book room go
walk”,但这种大杂烩显然是难以理解的,尤其是考虑到文中的语境,它肯定是一个名词。“谷歌翻译”给出的结果是“South
study walking”,但仍然词不达意。

据说,他坚持要去英国是为了寻找自己的母亲。

我得承认,刚开始我也不知道这个中文词组是什么意思。尽管从字面上看它的意思似乎是,在某栋建筑的南边学习的时候移动自己的脚步。我知道,这种理解肯定是错的,不符合语境。为了翻译它,我不得不去了解我并不太熟悉的中国文化。我该寻求谁的帮助呢?谷歌啊!(但不是“谷歌翻译”。)我将这几个中文单词连同引号输入谷歌搜索框,然后让引擎自己去搜索。很快,一堆中文网页跳了出来,我痛苦地在前两个网页呈现的中文语句中搜寻,想要搞明白这个词组究竟是什么意思。

图片 25

(1644~1911年)(在皇宫的南书房)起草漂亮的官方文件。“行走”这个词实际上意指“辅助”。因此,根据谷歌搜索提供的信息,我把这个词组翻译成了“South
Study special
aide”。显然,“谷歌翻译”没能像我一样好好利用谷歌搜索,这真是太糟糕不过了,不是吗?尽管“谷歌翻译”能在瞬间翻出这个词组,但它不能理解网页里的中文内容。我把我查看的中文网页信息输入“谷歌翻译”,它很快就呈现了如下结果:

史蒂文·斯皮尔伯格听闻这个传奇故事后产生了极大的兴趣,于是买下改编权,拍摄了这部《幸福终点站》。

“South study walking” is not an official position, before the Qing era
this is just a “messenger,” generally by the then imperial
intellectuals Hanlin to serve as. South study in the Hanlin officials
in the “select chencai only goods and excellent” into the value,
called “South study walking.” Because of the close to the emperor, the
emperor’s decision to have a certain influence. Yongzheng later set up
“military aircraft,” the Minister of the military machine, full-time,
although the study is still Hanlin into the value, but has no
participation in government affairs. Scholars in the Qing Dynasty into
the value of the South study proud. Many scholars and scholars in the
early Qing Dynasty into the south through the study.

The nan-shufang-xingzou(“South Study special aide”) was not an
official position, but in the early Qing Dynasty it was a special role
generally filled by whoever was the emperor’s current intellectual
academician. The group of academicians who worked in the imperial
palace’s south study would choose, among themselves, someone of great
talent and good character to serve as ghostwriter for the emperor, and
always to be at the emperor’s beck and call; that is why this role was
called “South Study special aide.” The South Study aide, being so
close to the emperor, was clearly in a position to influence the
latter’s policy decisions. However, after Emperor Yongzheng
established an official military ministry with a minister and various
lower positions, the South Study aide, despite still being in the
service of the emperor, no longer played a major role in governmental
decision-making. Nonetheless, Qing Dynasty scholars were eager for the
glory of working in the emperor’s south study, and during the early
part of that dynasty, quite a few famous scholars served the emperor
as South Study special aides.

机场是一个国家最能体现国际化和开放性的场所,在影片中我们可以真切感受到美国作为「文化大熔炉」的盛况,各种民族、各种语言都在这一方航站楼内被多样地呈现出来。

(尽管与原文的意思仍有偏差或者完全误解了原文)。一两段翻得不错的完整语句可能会让人产生幻觉:“谷歌翻译”知道自己在做什么,能够理解它所“阅读”的文字。在这种情况下,它似乎给人留下了深刻的印象——它几乎能达到人类的水平!

图片 26

这样的赞美当然要归功于它的发明者和他们艰苦的工作。但与此同时,不要忘了,“谷歌翻译”是如何翻译前面那两段中文内容的,以及更前面的法语和德语段落的。要理解它为什么是失败的项目,人们需要牢记“伊莉莎效应”。百种语言引擎并没有在阅读任何东西——至少不是人类意义上“阅读”。它只是在机械处理文字。它所处理的符号与我们对这个世界的体验无关。它没有记忆可供提取,它能够快速处理文字,但这些文字对它而言没有图像、没有理解、没有意义。

由于机场安保严格无法拍摄,剧组搭建了一个1:1全尺寸的航站楼,几乎所有的拍摄都在此进行。

05

而片中大量的品牌店铺及其店员也都是真实的。在片方的邀请下,有35家公司来这个「模拟机场」开店,有些商家甚至调来了自家员工真的做起了临时生意。

一个朋友问我,“谷歌翻译”的局限是否只是大数据资源不足造成的。他认为,如果你能大幅增加数据资源,比如,数百万或数十亿个数据库,最终它就能满足你所有的翻译需求,并且还能翻得很完美。但我不这么认为。拥有更多的“大数据”不会让你更接近于获得理解力,因为理解力涉及到拥有思想,缺乏思想是今天机器学习面临的最根本的问题。因此,我敢说,更大的数据库——甚至巨大的数据库——也不能解决这个问题。

图片 27

另一个问题:“谷歌翻译”对神经网络——一种试图模拟大脑的技术——的使用能让机器对语言产生理解吗?初看起来,似乎是可行的。

这个故事可以被处理为一个政治讽刺片,揭露各方部门如何扯皮、推卸责任;但斯皮尔伯格却选择把它讲成一个温情的治愈故事

但“谷歌翻译”对语言的处理仍然没能超越单词和词组这样的初级层面。在庞大数据库中,所有类型的统计数据都可以被用于神经网络,但这些统计数据只是用某些词语去联接另一些词语,而不是去联接思想。它没有试图创造一种内部结构,这种结构可以被视作思想、图像、记忆、体验。这些缥缈的心智内容仍然难以用算法来创生,因此,作为一种替代品,谷歌使用了成熟而具有效率的语词聚类统计算法。然而,这种技术的效果无法等同于思想,而思想是人们在阅读、理解、创造、修改、评判作品的过程中产生的。

就像《阿甘正传》和《当幸福来敲门》一样,让一个原本看似弱小的平民,以极其坚韧的意志化不可能为可能

尽管我的看法是偏负面的,但人们对于“谷歌翻译”提供的服务还是给予了很高评价:它虽然不能很准确地把语言A翻成语言B,但的确可以在交流过程中发挥应急作用。只要被翻成语言B的文字大体上可以被理解,很多人就会对它十分满意。如果人们能明白一段外语的“基本意思”,他们就会觉得很开心。然而,在我看来,这显然不是“翻译”这个词的本义,但对有些人来说,“谷歌翻译”无疑是一个伟大的产品,它所做的工作就是翻译。

维克多这个角色也或多或少有着一点阿甘的影子,憨厚老实,甚至带着点傻气。汤姆·汉克斯精湛的演技把一个口音极重、举止老土的东欧人演得活灵活现。

好吧,我明白这些人的需求,也理解他们的那种开心。对他们而言,这的确是一种幸运。最近,我看到有技术狂热分子制作了柱状图,号称可以比较人工翻译和机器翻译的“质量”,这些图形表明,最新版本的翻译引擎已经很接近人工翻译水平了。但是,在我看来,这是一种对无法量化的事物进行量化的伪科学,或者,你也可以认为,是一群技术呆子试图将无形的、微妙的、艺术的事物进行量化。

图片 28

在我眼里,今天的“谷歌翻译”,其水准既有优秀的一面,也有搞笑的一面,而我是无法把我对它的感受进行量化的。回想一下前面提到的第一个翻译例子吧,里面涉及到“他的”和“她的”物品,没有理解能力的翻译机器几乎把这些物品都翻对了。尽管取得了这样小小的成功,但它还是没能理解整段话的意思。在这种情况下,人们应该如何量化它的工作质量呢?

刚到美国的时候,维克多完全语言不通,严重的语言障碍让他无法与他人沟通。别人不管说什么,他都只能尴尬而不失礼貌地说YES:

让我回到人类译者的悲观图景:他们很快将被机器超越和淘汰,逐渐变得无所事事,从而成为翻译质量的检验者和文字的修补者。这种看法充其量只适用于平庸的译者。一个严肃艺术家的工作绝不是从对低俗破烂作品的修修补补开始的,这些破烂不可能被打造成高雅艺术。艺术不是这个样子,而翻译无疑是一门艺术。

—你在美国有认识的人吗?

(硅)但我也不想让读者对我留下这样一种印象:我相信计算机永远不可能拥有智力和理解力。如果我的这篇文章传递了这样一种意思,那是因为我提到的技术没有触及到人类智力的核心之处,前面所举的那些例子很清晰地表明了机器翻译的局限性。

—Yes.

在我看来,没有根本的理由认为,原则上机器不会在某一天学会思考、创造、搞怪、怀旧、兴奋、恐惧、高兴、沉默、期盼。进而言之,机器可以真正学会在不同语言之间进行翻译。没有根本的理由认为,机器不会在某一天成功翻译笑话、双关语、剧本、小说、诗歌,当然,还有像本文这样的文章。但是,所有这一切只有在机器拥有了类似人类的思想、情绪和体验的基础上才能实现,而这绝非近在咫尺的事情。实际上,我相信我们还有相当长的路要走。至少,这是一个一辈子对人类心智之深邃充满敬畏的人所热切希望的。

—谁啊?

注释:

—Yes.

[1] Pi在这里是π的谐音,代表略大于3的数字。

—你是说,你认识的人,是谁,在哪儿?

[2]
比如,汽车通常被认为是属于男性的物品,因此,法语就只会说“他的汽车”,而不会说“她的汽车”。毛巾通常被认为是属于女性的物品,因此,法语就只会说“她的毛巾”,而不会说“他的毛巾”。

—Yes,yes!

[3] hers本来意指“她的书房”,但它没把这个意思翻出来,而是翻成了“他们”。

图片 29

[4] 中文意思与原文翻成的中文大致相同。

所以在保证温饱的基础上,他首要解决的问题就是语言

[5] 这句法文是谷歌翻译的,作者认为它是词不达意的。

他非常聪明地找了两本旅游手册,一本母语,一本英语,然后一个词一个词地对照着理解词义。

本文来自微信公众号:神经现实(ID:neureality),作者:侯世达(DOUGLAS
HOFSTADTER,美国著名认知科学家、比较文学家、翻译家,印第安纳大学认知科学和比较文学教授、著有《哥德尔、艾舍尔、巴赫:集异璧之大成》,该书获得普利策奖和美国国家图书奖),原文发表于《
THE ATLANTIC》。

图片 30

*文章为作者独立观点,不代表虎嗅网立场

几个月下来,他便融入了新的生活。

本文由 神经现实© 授权 虎嗅网
发表,并经虎嗅网编辑。转载此文请于文首标明作者姓名,保持文章完整性(包括虎嗅注及其余作者身份信息),并请附上出处(虎嗅网)及本页链接。原文链接:

在任何的社会环境中,学习与适应从来都是第一位的。

未按照规范转载者,虎嗅保留追究相应责任的权利返回搜狐,查看更多

慢慢地,越来越多的人开始注意到维克多,并开始与他结交朋友:

责任编辑:

傲娇的印度扫地大爷,他每天最大的乐趣就是看过路人在地板上滑倒的糗样。

图片 31

他说,美国人从来都不知道看警示牌。

图片 32

热情的机场送餐小哥,他一直暗恋着签证办事处的审核员,但迟迟羞于开口。

图片 33

他和维克多达成协议,用心仪姑娘的信息来换盒饭。于是维克多每天都去签证处找小姑娘唠嗑,从兴趣爱好到婚恋状况,直到帮人求婚成功。

图片 34

而这个漂亮的小姑娘,正是已经被灭霸献祭的「卡魔拉」佐伊·索尔达娜

图片 35

图片 36

凭借着自己的真诚和善良,维克多赢得了整个机场的人心,还得到了一份薪资还不错的工作。

这让机场管理员更生气了,因为维克多的时薪居然比他的还高!

图片 37

最厉害的是,在如此落魄的情况下,维克多还追到了一个空姐

图片 38

而她正是曾凭借《芝加哥》获得奥斯卡最佳女配角的大美人凯瑟琳·泽塔-琼斯

图片 39

说实在的,对于维克多软硬不吃坚持在机场里滞留了九个月的行为,鱼叔差点要以为这男人是个傻子。

但看到后来才明白,维克多虽然看起来老实巴交,甚至有些实诚得有些可笑,但他却非常清楚自己要的是什么——

踏出航站楼的大门,去纽约实现父亲生前未了的夙愿,哪怕他需要为此等待九个月。

图片 40

影片的故事虽然集中在机场,但主角所经历的人情世故却是通用于整个社会的。

浅看,这是一个倒霉男人在机场求生存的故事;深想,这是个体如何适应社会并最终实现自我价值的过程。

图片 41

从学习英语、结交朋友,到寻找工作、追求爱人,维克多的每一个行动都是有着明确自我认知和目标规划。

他其实一点也不傻。

「等待」是这部影片的主题,Life is waiting

维克多在等待签证,扫地大爷在等待回家,送餐小哥在等待爱情,空姐在等待一位有妇之夫……所有人都有所等待,正如所有人都有所追求

图片 42

其实在社会上和职场中,每个人都在等待属于自己的那一刻。等待自我价值的实现,等待升职加薪的机会。

但等待不是茫然无措,而是像维克多一样积极进取,在漫长的等待中积蓄力量,化被动为主动,最终赢得所有人的支持。

原地踏步的人永远就只能留在原地,眼光长久、迈开步子的人才能走在前面。

图片 43

如果你想呆在舒适区,每天按部就班,那十年后的的你与现在也毫无差别;梦想再大,不去奋斗,也只能停留在嘴边。

如果你想掌控自己的人生,就应该从现在开始有所行动。

语言是交流的基础,在今天的社会,学好英语是刚需。根据调查显示,英语熟练者的年薪比一般人高出30%

但步入职场的我们,早已经没有学生时代充沛的时间,所以鱼叔推荐这个行而有效的纯外教在线英语学习平台——

TutorABC(原vipabc)。

科学安排学习计划,每天只需学够
45分钟,就能达到明显的学习效果。

我们总是想得太多,做的太少,空喊着口号却不以各种理由不去行动。但在TutorABC,只要你想学,任何时候都有老师在线等着你。

因为Tutorabc拥有全球 20000+ 的具有专业英语教学资格的外籍顾问,真正做到全年
365 天、24小时外教随时随地学英语

而且采用独家单向视频,让你可以看到外教,外教看不到你,避免了学习过程中的尴尬。

鱼叔为鱼友争取到一个专属福利,点击阅读原文或,就可以免费领取专业的英语水平测试+外教课程

改变自己,从现在开始。

图片 44

阅读原文免费领取外教课程,努力无论从什么时候开始都不嫌晚。返回搜狐,查看更多

责任编辑:

发表评论

电子邮件地址不会被公开。 必填项已用*标注

相关文章