巴顿声控开关怎么样,贝佐斯是世界首富吗
第1章 最高产品经理
亚马逊在2010年将公司迁入新兴的西雅图联合湖南部地区,那十几座低层建筑看上去毫无特别之处。从建筑学上来看,它们也平淡无奇。这位CEO坚持,楼内外不加任何明显的标牌,来炫耀这就是那家年销售额将近350亿美元的著名互联网公司。杰夫·贝佐斯曾对他的同事说,那种明显的自我标榜不会带来任何好处,与公司有业务往来的人自然知道亚马逊的总部在哪儿。
虽然聚集在特里北大街和哈里森街交叉口周围的这些办公楼大多没有标识物,但它们的内部却到处都是体现其独特企业文化的各种符号。员工的脖子上戴着的工牌,用不同的颜色区分他们在公司的资历(蓝色代表在职时间5年,黄色代表10年,红色则专属在这里工作长达15年的员工),办公室和电梯间的装饰海报上,印着贝佐斯那十四项神谕般的领导力原则。
身居其间的46岁的贝佐斯本人,常常用身体力行来强调这些独特的经营理念。例如,CEO详细地向员工展示第十条原则——节俭:用更少的投入实现更多的成果。克制可以带来智慧、自给和发明。没有必要增加员工编制、预算规模或固定支出。大多数情况下,他的妻子麦肯齐驾驶本田旅行轿车送他上班,当他与同事乘坐达索猎鹰900EX私人飞机出差时,他会经常说,是他而不是公司出钱支付这趟旅程的。
如果问哪一条是贝佐斯最看重的(也是将要定义亚马逊下一个五年的)原则,那就是第八条——大胆思考:不要只满足于实现个人成就。领导者创造并宣扬大方向来鼓励众人行动。他们打破常规,想尽一切办法来服务客户。2010年,亚马逊已经是很成功的在线零售商,也引领了云计算服务和数字阅读市场的发展,但是贝佐斯想得更远。那一年,他在致股东的信中盛赞人工智能和机器学习等深奥的计算机科学,这些领域,亚马逊也是刚刚涉足。信的开头,就用了一系列晦涩难懂的术语,如贝叶斯估计、流言算法和数据分片。贝佐斯写道:“发明是我们的基因,技术是我们用来发展和改善全方位客户体验的基本工具。”
贝佐斯不仅想象这些技术的可能性,还试图让亚马逊的下一代产品直接应用这些最前沿的技术。大约在这段时间里,他开始与亚马逊在硅谷的研发部门Lab126的工程师密切合作,后者开发了亚马逊首个电子产品Kindle。在一系列头脑风暴会议中,他发起了几个项目来补充Kindle和后来的Kindle Fire平板。当时,这在亚马逊内部被称为A计划。
B计划(后来失败的亚马逊Fire Phone)将使用前置摄像头和红外灯来配置看似三维的智能手机显示屏。C计划或称“微光”,是一种台灯形的设备,旨在将类似全息图的显示屏投影到桌子或天花板上。结果显示它的成本贵到无法接受,所以从未被发布。
贝佐斯对客户如何与这些设备进行交互有独特的想法。研发第三版Kindle的工程师在试图去掉计划用于该设备的麦克风时发现了这一点,因为不存在现实的使用场景,但是CEO坚持保留麦克风。当时的Kindle硬件主管山姆·鲍文说:“我得到的答案是,杰夫认为未来人们会与设备对话。这感觉就像《星际迷航》一样不现实。”
设计师说服贝佐斯在之后的Kindle版本中去掉了麦克风,但他坚信语音对话的必然性以及人工智能技术在实现这种应用方面的潜力。这种人机对话存在于他所有喜爱的科幻作品中,从电视剧《星际迷航》到阿瑟·克拉克、艾萨克·阿西莫夫和罗伯特·海因莱因等人的小说,这些书和其他大量的书一起摆在他位于西雅图湖滨区的家中。别人读这些经典著作时,也许只是想象一下另一种可能的世界,但贝佐斯似乎是将这些看作现实的蓝图,描画着激动人心的未来。在接下来的十年里,他的这种想法在亚马逊对产品的定义方面,被发挥到了极致:圆柱形音箱引发了一大波模仿,挑战了隐私相关标准,并改变了人们对亚马逊的看法——不仅是电子商务巨头,也是一家不断拓展计算机科学边界的创新型科技公司。
该计划最初在Lab126内部被称为D计划,后来改名为亚马逊Echo,他们还为其虚拟助手起了个名字——Alexa。
亚马逊Echo的起源
与亚马逊的其他几个项目一样,D计划的起源可以追溯到贝佐斯和他的“技术顾问”或所谓TA之间的讨论,后者常常由前途光明的高层管理人员担任,是特意来学习和辅助CEO的。TA的职责之一是在会议上做笔记,撰写年度致股东信函的初稿,以及与CEO密切互动至少一年来学习。2009—2011年,扮演这个角色的高管是格雷格·哈特,他对该公司最早的零售(如图书、音乐、DVD和视频游戏等品类)业务驾轻就熟。哈特来自西雅图,曾就读于马萨诸塞州西部的威廉姆斯学院,短暂从事广告行业之后,在西雅图的垃圾摇滚时代行将没落时,回到了家乡,留着山羊胡子,偏爱法兰绒衬衫。追随贝佐斯之后,剃掉胡子的哈特成了亚马逊冉冉升起的新星。哈特回忆自己担任贝佐斯TA时的情景说:“那感觉就像是仰望着约翰·伍登的助理教练,你知道,伍登可能是有史以来最伟大的篮球教练。”
哈特还记得2010年底的某一天在西雅图的蓝月亮汉堡店与贝佐斯聊语音识别。吃完午餐,哈特展示了他对安卓手机上搭载的谷歌语音搜索的着迷,他对着屏幕说“我附近的比萨店”,随后,屏幕上就弹出了附近的比萨店的链接列表。哈特回忆说:“杰夫对在手机上使用它有些怀疑,因为他认为这样做会带来社交尴尬。”但是他们认为该技术在听写和搜索方面确实已经做得很好了。
当时,贝佐斯对亚马逊不断发展的云业务也感到兴奋,他问所有高管:“你正在做哪些事情来帮助AWS?”受到与哈特等人关于语音计算的讨论的启发,他在2011年1月4日发了一封电子邮件给哈特和硬件设备副总裁伊恩·弗里德、高级副总裁史蒂夫·凯塞尔,将两件事联系在一起:“我们应该想办法打造一款20美元的设备,它的处理器在云端,却可以完全由你的声音来操控。”老板又有了个新想法,而且似乎对这个想法满怀信心。
接下来的几天,贝佐斯和他的员工通过电子邮件探讨这个想法,但是没有采取进一步的行动,这件事可能就此结束了。几周后,哈特在亚马逊总部6楼“北第1日”会议室与贝佐斯见面,讨论他的职业选择。他作为TA的任期结束了,因此他们讨论了几个负责亚马逊新项目的机会,也包括在亚马逊视频流和广告部门的职位。贝佐斯在白板上写下这些选择,并补充了自己的一些想法,然后开始运用他通常的标准展开评估:“如果这些新想法可行,它们能做大吗?如果公司现在不积极实施这些想法,会错过机会吗?”最终,贝佐斯和哈特划掉了清单上几乎所有的项目,只留下一个——落地贝佐斯关于声控云计算机的点子。
哈特回忆自己说道:“杰夫,我没有任何硬件经验,而我领导过的最大软件团队只有大约40人。”
“你能做好的。”贝佐斯回答。
哈特感谢他的信任,并说:“好吧,如果我们搞砸了,你要记得这句话。”
他们分开之前,贝佐斯在白板上展示了他对智能音箱的想法。至此,对Alexa设备的首次描述仅仅有:扬声器、麦克风和静音按钮。他们还确定了设备将使用无线网络,但如何让它接收语音命令,这是需要进一步解决的难题。哈特用手机拍下了白板上的草图。
贝佐斯密切参与该项目,每隔一天就与团队开会,做出详细的产品决策,并授权在首款Echo发布之前对该项目进行数亿美元的投资。亚马逊员工借用德语单词über(最高级),称他为亚马逊“über product manager”(最高产品经理)。
但是真正管理团队的人是格雷格·哈特,他的办公室位于Kindle部门所在的菲奥纳大楼,和贝佐斯的办公室一街之隔。在接下来的几个月中,哈特从公司内外招兵买马来搭建团队,他发邮件给看上的人,标题是“加入我的使命”,提出“你将如何为盲人设计Kindle”之类的问题。和他的上司一样喜欢保持神秘,他拒绝向他们透露要做的产品到底是什么。一个面试者回忆,他当时猜是传闻中的亚马逊智能手机,但哈特回答说,“手机有别的团队在做,我们要做的产品更有意思”。
亚马逊工程师艾尔·林赛是最早加入的成员之一。他在上一份工作中曾为联邦西部电信公司的语音激活目录服务编写了一些原始代码。在他自己的加拿大度假屋里,林赛用三个星期写了六页报告,设想外部开发人员如何编写可在设备上运行的语音应用程序。另一位成员是从内部招聘的亚马逊经理约翰·蒂姆森,他被任命为工程总监,并为D计划起了一个正式的代号——多普勒。蒂姆森告诉我:“说实话,开始时没人真的指望它能成功,但是因为哈特,我们都成了信徒。”
在老板的催促下,早期的Alexa团队工作充满紧迫感。贝佐斯不切实际地想在6到12月内发布该产品。他有充分的理由。2011年10月4日,就在多普勒团队完成组建之时,苹果在iPhone 4S中加入了Siri虚拟助手,这是苹果联合创始人史蒂夫·乔布斯倾注激情投入的最后一个作品,第二天,他因癌症去世。东山再起的苹果对语音个人助理产品同样看好,这件事让哈特和他的团队既兴奋又沮丧,因为作为第一个面世的语音助理产品,Siri收到的市场反馈毁誉参半。他们努力让自己相信,亚马逊的产品是独一无二的,因为它与智能手机无关。也许更重要的区别是,不幸的Siri没了乔布斯的积极支持,而Alexa将会得到贝佐斯的赞助和全公司的支持。
为了加快开发并完成贝佐斯的目标,哈特和他的团队开始物色可以收购的初创公司。多年来,这是一项艰巨的挑战,因为总部位于波士顿的语音巨头Nuance(苹果公司Siri的技术授权方)就是通过大量收购**顶级语音公司而发展起来的。多普勒项目的高管试图通过询问潜在收购目标,为Kindle电子书目录开发语音功能,并研究它们的方法和结果,以此了解剩下的初创公司哪些值得买。之后的两年里,亚马逊进行了多次火速收购,最终完成了Alexa中心处理器的设计,甚至为其打造了特别的音色。
亚马逊收购的第一家公司Yap是一家20人的创业企业。其总部位于北卡罗来纳州的夏洛特,该公司的技术能自动将语音邮件之类的人类语音转换为文本,而无须依靠低工资国家的那些神秘的人类转录员。尽管Yap的许多技术都将被丢弃,但它的工程师却可以帮助开发一项技术,将客户对多普勒所说的内容转换为计算机可读格式。在谈判期间,亚马逊高管拒绝透露他们将要开发的内容,这让Yap高管备受折磨。甚至在交易达成一周后,艾尔·林赛和Yap的工程师一起参加在意大利佛罗伦萨举行的一次行业会议时,他坚持让Yap的工程师假装不认识自己,这样就没人能猜到亚马逊对语音技术的新兴趣。
在以大约2500万美元的价格完成收购之后,亚马逊解雇了该公司的创始人,但将其位于马萨诸塞州剑桥市的语音科学小组保留了下来,成为其位于麻省理工学院附近肯德尔广场的新研发部门的种子团队。Yap工程师飞到西雅图,走进菲奥纳一楼的一间房门紧闭、窗帘全被拉上的会议室。拥有20年经验的语音行业专家、Yap的研究副总裁杰夫·亚当斯回忆说:“格雷格·哈特终于开口向我们描述了这种只有可乐罐大小的小巧设备,‘你可以把它放在桌子上用自然语言提问,它会是一个聪明的助手’。我的团队中有一半人听完就翻着白眼说,‘天,我们给自己挖了一个什么坑’。”
会议结束后,亚当斯巧妙地告诉哈特和林赛,他们的目标是不现实的。大多数专家认为真正的“远场语音识别”(存在串扰和背景噪声的情况下,在32英尺[1]距离内理解人类语音)超出了当前计算机科学所能实现的范围,因为声音会被墙壁和天花板等表面反弹回来,产生使计算机困惑的回声。亚马逊高管通过传达贝佐斯的决心做出回应。“他们基本上是告诉我,‘我们不在乎,雇更多人,花时间解决问题’,”亚当斯回忆道,“他们坚定不移。”
多普勒拼图的另一块
收购Yap几个月后,格雷格·哈特和他的同事又得到了多普勒拼图的另一块:和Yap的技术——将语音转换为文本——相反,波兰的创业公司Ivona生成计算机合成的语音来模拟人类声音。
Ivona由格但斯克工业大学计算机科学专业的学生卢卡斯·奥索沃斯基在2001年创立。奥索沃斯基的想法是用所谓的文字转语音(TTS)技术,让自然声音大声朗读数字化文本,来帮助波兰的视力障碍者阅读。他与同学米克·卡苏克一起,录下演员声音和文字段(称为双音素),然后以不同的组合将它们混合或“连接”在一起,模拟自然语言造出的演员根本没有读过的单词或句子。
Ivona的创始人很早就了解到他们的技术有多强大。在上学期间,他们就付钱给波兰著名演员亚采克·拉比亚克录制大量语音,创建声音数据库。他们的第一个产品Spiker迅速成为波兰最畅销的计算机语音产品。在接下来的几年中,它被广泛用于地铁、电梯和机器人电话广告。拉比亚克开始在各处听到自己的声音,并接到自己声音打来的电话,提醒他为选举投票。恶作剧者还用他的声音制作不雅内容发布到网上,被他的孩子们听到。他愤怒地要求从Spiker软件中删除自己的声音,导致Ivona的创始人不得不和他重新签订合同(今天,“亚采克”仍然是AWS波兰语服务所使用的语音库之一)。[2]
2006年,Ivona开始参加并多次赢得由卡内基·梅隆大学组织的年度暴雪挑战赛,该赛事比拼的是最自然的计算机语言。到2012年,Ivona已扩展到其他20种语言,并拥有40多种声音。在了解了这家初创公司之后,格雷格·哈特和艾尔·林赛在前往欧洲寻找收购目标的旅程中改道,去了格但斯克。林赛说:“走进他们办公室的那一刻起,我们就意识到他们的文化非常适合我们收购。”他说,Ivona所在领域的研究人员经常被精深的学术研究吸引。“这种邋遢风格使他们能够将目光投向纯粹的学术界之外,而不会被纯科学蒙蔽。”
这项收购价格约为3000万美元,于2012年完成,但保密了一年。亚马逊为其新的格但斯克研发中心招募了更多的语音工程师,Ivona团队和这些工程师一起,负责制作多普勒的声音。该计划事无巨细由贝佐斯亲自管理,满足了CEO一直以来的好奇心和奇思妙想。
一开始,贝佐斯说他希望设备可以发出数十种不同的声音,每种声音都与不同的目标或任务相关,例如,听音乐或预订航班。当事实证明这是不切实际的时,团队认为可以在一个人格上体现诸如值得信任、富有同理心和温暖感的性格特征,而这些特征通常更适合用女性声音来实现。
格雷格·哈特及其同事花了几个月的时间检查语音公司GM Voices录制的声音,并把最好的推荐给贝佐斯听。他们对声音进行排名,要求提供更多样品,最后做出选择。贝佐斯在协议上签了字。
亚马逊保持了它一贯的神秘作风,从未公开Alexa背后的语音艺术家的名字。在接触了专业配音社区后,我发现了她的身份:居住在博尔德的歌手兼配音演员尼娜·罗尔。她的职业网站上有一些传统收音机广告的链接,这些广告包含Mott苹果汁和大众帕萨特汽车之类的产品,而Alexa的温暖音质是属于她的,绝对不会错。2021年2月,我打电话给她,她说,自己被要求不可以与我交谈。当我和亚马逊提出要求和她谈谈时,他们也拒绝了。
当多普勒团队在各处招兵买马并收购初创公司时,亚马逊西雅图办公室和硅谷Lab126则在该产品的各个方面进行激烈辩论。在最早的一次会议上,格雷格·哈特确定了语音命令播放音乐应该是最重要的选框功能之一。哈特说,贝佐斯“同意这一框架,但他强调音乐可能占51%,但其他49%也很重要”。
在随后的几个月中,这种友好的共识演变成哈特和他的工程师之间漫长的拉锯战,后者认为播放音乐是一种实用且好卖的功能,而贝佐斯则想得更多。他开始谈论“星际迷航计算机”,这种人工智能可以处理任何问题并充当个人助理。团队内部用“全权代表”一词来描述他想要的东西:一位无所不能的助理,可以代表用户采取行动,例如,叫出租车或下订单。作为科幻小说迷,贝佐斯强迫他的团队大胆想象,突破既有技术的界限。但是在面对实际产品交付的压力时,哈特则提倡采用一套他所谓“神奇而平凡”的功能,着力突出那些更基本和可靠的功能,如为用户提供天气信息、设置时间和闹钟等。
这场争辩体现在一张冗长的“公关常见问题解答”草稿中,这是一种长达六页的亚马逊式说明文——新项目启动初期,为应对各种市场反应而准备的新闻稿。作为亚马逊关于创新的各种繁文缛节的重要部分,它要求对新产品能给客户创造的价值进行充分讨论。编写、演示、辩论、执着、重写和放弃,多普勒新闻稿常见问题解答先后写了几十个版本。只要新闻稿中强调音乐播放,“杰夫就会非常生气,他根本不喜欢这样”,一位早期的产品经理说。
另一位多普勒早期员工后来推测,贝佐斯缺乏细腻的音乐品位是出了名的,这可能是他会做出如此反应的重要原因。例如,当贝佐斯测试早期的多普勒设备时,要求它播放他最喜欢的一首歌曲——经典电视剧《太空堡垒卡拉狄加》的主题歌。[3]格雷格·哈特的上司伊恩·弗里德说:“杰夫非常努力地确保这种产品不仅仅和音乐有关,他坚持要把它变成一台更通用的计算机。”
另一个有关的讨论围绕是否使用“唤醒”(wake)一词而展开,即当多普勒“听”到这个词时,就会结束被动等待模式,而切换到主动监听用户语音,通过互联网连接和发送用户要求到亚马逊的服务器,并发回相应结果。语音科学团队希望用一些特殊词来代替“唤醒”,并且至少为三个音节,这样正常对话就不会触发该设备。它也必须非常独特(如Siri),方便推向公众。哈特和他的团队为贝佐斯准备了数百个卡片,一张卡片一个词,在那些无休止的讨论中,他就把这些卡片铺在会议室的桌子上。
贝佐斯说,他希望这个词听起来要悦耳动听,而他母亲的名字杰奎琳听上去“太刺耳了”。他快速否定了“芬奇”(杰夫·万德米尔的一部奇幻侦探小说)、“星期五”(《鲁滨孙漂流记》中的人物角色),还有《家有仙妻》中无所不能的女巫“萨曼莎”。有一阵子,他还相信这个词应该是“亚马逊”,这样,未来产品收获的任何好感都将如数共享给公司。
多普勒的高管们反驳说,人们不会希望在家里与一家公司交谈,这导致了另一场持续的争论。贝佐斯还提出了Alexa,以致敬“知识之都”亚历山大古图书馆。这也是20世纪90年代亚马逊收购的一家和它没什么业务关联的公司的名字,该公司出售网络流量数据,今天仍继续独立运营。经过无休止的辩论和实验室测试,“Alexa”和“Amazon”成为最终候选,2013年初,设备被放到亚马逊员工家中进行有限试用。
员工收到的设备和亚马逊不到两年后推出的第一版Echo的外观基本一致。Lab126的工业设计师将其称为“薯片桶”,他们用一个拉长的圆柱体,把顶部的7个全向麦克风和底部的喇叭分开,并在桶壁上打出1400个孔来排出空气和发出声音。该设备的顶部有一个LED(发光二极管)灯环,这也是贝佐斯的点子,它会朝着讲话者的方向点亮,就像某人正与你交谈时看着你那样。虽然看起来不是很好看,但贝佐斯对设计师说功能决定外观。
在数百名亚马逊员工的家中进行测试的多普勒设备非常不好用,所用人都知道,它们运行缓慢且笨拙。一位名为尼尔·艾克曼的亚马逊经理签署了内部测试协议,在2013年初拿回家一台。他和妻子都必须签署几份保密协议,承诺如果有客人来,就要关闭设备并把它藏起来。他们每周都必须填写电子表格,回答问题,并列出他们对设备提出的要求以及设备的回应情况。艾克曼的妻子称它为“那个东西”。
他说:“我们都不太相信它能成功。它几乎不可能给我正确答案,播放音乐也不连贯,也不是我们所喜欢的音乐。”莫名其妙的是,它倒似乎最能理解他们有语言障碍的儿子。
其他参与早期测试的人员也没给好评。最早参与FireTV的工程师帕拉格·加格领了一台测试设备,他说:“屁用都没有,扔了我都不会觉得可惜。当时我想,这玩意儿肯定会失败。”亚马逊Fire电话部门的一位经理回忆说,他喜欢设备的外观,“但我想象不出它有什么用。我觉得它是一个愚蠢的产品”。
两名多普勒工程师记得一条更令人难受的评论来自贝佐斯本人。这位CEO显然是在西雅图的家中亲自测试了产品,被它糟糕的理解能力搞得非常沮丧。他对着Alexa喊:“你去死吧。”一个工程师在审核与测试设备交互情况时听到了这句话,“我们都认为,项目可能到此就结束了,或者至少是我们几个人可以收拾东西走人了”。
Alexa的变革
很明显,Alexa需要进行一个大脑移植手术。亚马逊让产品更智能的努力,在多普勒团队内部引发了一场“教义之争”,并导致其面临有史以来的一个最大挑战。
第一步是整合收购的第三家初创公司的技术,这是一家位于英格兰剑桥的人工智能公司,名为Evi,由英国创业者威廉·塔恩斯塔尔·佩多埃在2005年创立,最初只是一款名为“True Knowledge”的问答工具。佩多埃在上大学时就已经创建了多个像“变位词天才”(Anagram Genius)这样的网站,能够自动重新排列单词中的字母来产生另一个单词或短语。小说家丹·布朗后来使用这个网站在《达·芬奇密码》中创作字谜。
2012年,受首次亮相的Siri启发,佩多埃改变方向,在苹果和安卓应用商店中发布了Evi应用软件。用户可以通过键入或讲话来提问。Evi并不是像Siri那样在网络上搜索答案,或者像谷歌的语音搜索那样返回一组链接,而是评估问题并尝试直接回答。该应用在第一周就被下载了25万次,几乎让公司的服务器崩溃。[4]苹果扬言要将其踢出iOS应用商店,因为它与Siri看上去“相似到难以分辨”,但在粉丝们提出反对后选择妥协。得益于所有这些关注,到2012年下半年亚马逊以传闻中的2600万美元成功收购它时,Evi至少已经收到过至少两家公司的收购要约,以及来自风险投资者的投资许诺。[5]
Evi使用了一种叫作知识图谱或大型本体数据库的编程技术,该技术将相关领域中的概念和类别联系在一起。例如,如果某个用户问Evi:“克利夫兰的人口是多少?”该软件会分析这个问题,并且知道转向相关的人口统计数据来源寻求答案。《连线》杂志将这项技术描述为与有用事实进行逻辑连接的“巨型树状结构”。[6]
将Evi的知识库放入Alexa有助于进行非正式,但文化上常见的闲聊对话。如果用户对设备说:“Alexa,早上好,今天感觉怎么样?” Alexa可以建立正确的连接并做出回应。佩多埃说,他需要说服其**同事接受让Alexa回应社交对话这种奇怪的想法,他回忆说:“给机器编程来响应‘你好’,这样的想法让人们感到不舒服。”
集成Evi的技术有助于Alexa回答事实查询,例如,太阳系某些行星的名字,这样的问题会让人觉得Alexa很聪明。但事实上,支持用深度学习来实现自然语言理解的人认为,Evi的知识图谱无法为Alexa提供真正的智能,来实现贝佐斯的梦想,即一个可以与用户交谈并回答任何问题的多功能助手。
深度学习向机器提供大量有关人们如何交流、如何提供令人满意的响应的数据,然后对它们进行编程来训练自己预测最佳答案。这种方法的主要支持者是印度裔工程师罗希特·普拉萨德。工程总监约翰·蒂姆森说:“他是项目的关键人员,该项目的成功大部分归功于他组建的团队以及他们在远场语音识别方面所做的研究。”
普拉萨德在印度东部贾坎德邦州首府兰契长大。他出身工程师家庭,很小就迷上了《星际迷航》。当时,个人计算机在印度并不常见,但他从小就在父亲工作的冶金和工程咨询公司学习在PC(个人计算机)上编程。受到不良电信基础设施和高长途电话率的影响,印度的通信非常不好。于是,普拉萨德去**读研究生时决定研究如何压缩通过无线网络传输的语音。
在20世纪90年代末毕业后,普拉萨德目睹了互联网泡沫,并为位于马萨诸塞州剑桥的国防承包商BBN科技公司(后来被雷神公司收购)工作,从事一些最早的语音识别和自然语言系统开发工作。在BBN,他为通信公司开发了第一代车载语音识别系统和自动电话簿辅助服务系统。2000年,他开发了另一个自动转录法庭诉讼过程的系统。它可以准确识别和记录来自法庭周围多个麦克风的对话录音,使他认识到了远场语音识别的挑战。他说,在项目开始时每100个字中有80个是不正确的,但不到一年,他们就将这个数字减少到33。
多年后,当多普勒团队正在努力提高Alexa的理解能力时,负责亚马逊波士顿公司的比尔·巴顿把普拉萨德介绍给格雷格·哈特。普拉萨德对亚马逊一无所知(太不应该),也不知道亚马逊的十四项领导力原则是何物(更不应该),穿上西装,打好领带,参加了西雅图的面试。他对加入一家大型的科技公司有点犹豫,但是当他回到酒店房间时,哈特已经给他发了一封电子邮件跟进此事。邮件说:“我们本质上是一家初创公司。即使作为一家大公司的一部分,我们的方式也不像一家大公司。”
在被说服之后,普拉萨德加入了亚马逊,专注远场语音识别问题的研究,并最终成为深度学习模型的拥趸。Evi的知识图谱过于严谨,无法成为Alexa的基础反应模型。普拉萨德举例说,如果用户说“播放一首斯丁的音乐”(Play music by Sting),系统可能会认为他在向艺术家说“再见”(bye),而被搞糊涂。而通过使用深度学习的统计训练方法,如果用户说这句话,系统会快速知道,来一首《你的每一次呼吸》肯定不会错。
但是Evi的佩多埃认为,知识图谱才是更实际的解决方案,并且对深度学习方法非常不信任。他认为这样很容易出错,需要无休止地训练数据以塑造Alexa的学习模型。他解释说:“机器学习科学家永远不会承认失败,因为他们的所有问题都可以用更多的数据来解决。”话里话外透露出一丝遗憾,因为对于亚马逊的“最高产品经理”贝佐斯本人而言,毫无疑问,时间的箭头已经指好方向——机器学习和深度神经网络。凭借其庞大而复杂的AWS数据中心,亚马逊能够利用大量高性能的计算机处理器来训练其语音模型,而几乎没有竞争对手具备同样的云计算能力。[7]被击败的佩多埃最终于2016年离开亚马逊。
虽然深度学习方法胜出了,但普拉萨德和他的盟友仍然要解决所有开发人工智能的公司所面临的悖论:他们不想发布一个笨拙的、用户不想使用的系统,而没人使用就不会产生足够的数据来改善服务。但是亚马逊需要这些数据来训练系统以使其更智能。
谷歌和苹果通过从Nuance获得技术许可来解决这一悖论,利用其结果来训练自己的语音模型,再将其甩掉。多年以来,谷歌还从免费电话咨询服务热线800-Goog-411收集语音数据。亚马逊没有可以用来挖掘数据的此类服务,格雷格·哈特反对使用外部技术授权。他认为,从长远来看,这将影响该公司的自主性。但是与员工一起进行的早期测试所提供的培训数据很少,只有数百名白领,而且通常是在早晚嘈杂的家庭房间中来回走动时的对话。数据质量很糟糕,数量也不够。
与此同时,贝佐斯已经变得不耐烦了。“我们甚至不知道这个产品什么时候能做好?”他在2013年初一直在问。哈特、普拉萨德和他们的团队创建了图表,预测随着数据的持续收集,Alexa将会如何改善。数学表明,他们需要将数据收集工作的规模扩大一倍左右,才能使Alexa的准确程度以3%的速度持续提升。
那年春天,罗希特·普拉萨德加入公司仅几周后,他们用六页报告向贝佐斯说明了这些事实,并提议将语音科学团队的规模扩大一倍,并计划将产品正式发布日期从夏天推迟到秋天。会议在贝佐斯的会议室举行,进展非常不顺利。
贝佐斯在读到推迟发布的内容后说:“你们的做法是错的。首先,你们应该告诉我一款神奇的产品是什么样的。其次,你们应该告诉我如何把它做出来。”
随后,贝佐斯当时的“技术顾问”迪利普·库玛尔问公司是否有足够的数据。被从剑桥叫回来参会的普拉萨德回答说,他们需要成千上万小时的远场复杂语音指令。据一位在座的高管说,贝佐斯显然是在考虑增加语音科学家的人数,并于几秒钟内在大脑中完成了计算。“直接点,你是说这个产品要成功,我们只需要花20年,而不是40年?”
普拉萨德试图绕过这个问题:“杰夫,我们不会那样算。”
“告诉我,我哪里算错了?”贝佐斯问。
哈特赶紧插话说:“好的,杰夫,我们听到你的话了,我们明白了。”
普拉萨德和其他亚马逊高管不会忘记这次会议,以及Alexa开发期间他们与贝佐斯进行的其他艰难互动。但是据当时在场的高管说,CEO站起来说:“你们并没有认真地开发这个产品。”会议戛然而止。
手机计划的败北
在位于加利福尼亚州西雅图桑尼维尔的同一座建筑里,在多普勒团队努力让Alexa变聪明的同时,亚马逊的智能手机打造计划正在快速冲向失败。
几年前,苹果、谷歌和三星已经基本分食了蓬勃发展的智能手机市场,但人们仍然认为,对于创新的产品,机会还是有的。通常,杰夫·贝佐斯不会将数字化经济的关键战略地位让给其他公司,尤其考虑到创新的途径在这个领域非常有效。在一次头脑风暴会议上,他提出发明一个可以帮忙找到随便乱扔的手机,并将它拖到无线充电器上的机器人(有些员工以为他是在开玩笑,但是后来亚马逊为这个想法注册了专利)。[8]还有一次,他提出开发一种具有高级3D显示屏的手机,该手机不仅能响应触屏操作,还能够响应空中手势。这种产品和亚马逊货架上的那些都不一样。贝佐斯所坚持的这个想法,成了Fire Phone项目的起点。
最初的设计师在手机面板的四个角上安装了四个红外摄像头,以追踪用户视线并呈现3D图像的视觉效果,第五个摄像头安装在手机背面[这样的手机两面都能“看”,所以项目代号采用了一种猫头鹰的名字“Tyto”(草鸮)]。当时手机用的日本产相机价格为5美元一个,但贝佐斯想要为他的高端亚马逊手机定制一款顶级照相组件。
三年里,贝佐斯每隔几天就会与草鸮团队开会,与此同时,他也经常会见Alexa团队。他满脑子都是新技术和新业务,抛出各种想法并检查团队的进展。而且,虽然他关注亚马逊其他产品的用户反馈到了不正常的程度,但却不认为倾听这些意见能够带来戏剧性的伟大发明,只有天马行空的“乱想”,才能实现颠覆性的突破。几年后,他在致股东的信中写道:“推动历史的东西,用户不需要知道。我们必须代表他们发明。我们必须靠自己的想象力来探索一切可能性。”[9]
但是,对于贝佐斯关于智能手机的看法,许多草鸮项目员工都有所怀疑。很多人觉得3D显示屏仅仅是个噱头和耗电的罪魁祸首。贝佐斯在智能手机方面的一些盲点也让人担忧。“真有人会用手机上的日历吗?”一次开会时他问。“是的,我们会用。”几个没有私人助理的人回答。
就像在多普勒项目中一样,贝佐斯给出的截止日期是不现实的,为了完成目标,团队只能招更多的工程师。但是,对于一个失败的技术项目,更多的工程师只能让损失更大。Kindle在当时对亚马逊而言具有战略上的重要意义,因此草鸮小组不能用内部的硬件工程师,而只能从摩托罗拉、苹果和索尼等公司挖人。自然,他们不到最后一天是不会告诉这些人他们要开发的是什么项目。“只要你在科技圈有点名气,他们就会找上你。”一位Fire Phone项目经理说。
距离产品发布只有6个月了。他们的进度一直卡在3D显示器上。最早设计的顶级照相组件很快就过时了,所以他们决定升级处理器和摄像头,重新启动这个项目。它延续了用猫头鹰名字来命名的传统——Duke(公爵)[10]。[11]小组立即开始着手新的工作,并取消了另一个手机项目,这个代号为“Otus”(鸱鸺,也是一种猫头鹰)的项目计划由HTC来代工生产一款只拥有基本功能的低成本手机,它选用的安卓操作系统,也是亚马逊新型平板电脑Fire所使用的,这款平板电脑被看成是苹果iPad的有力的低成本替代品。
鸱鸺被叫停时,这个项目的员工感到非常失望,因为他们私下里认为,亚马逊在手机市场上的机会不是一个炫酷的3D显示器,而在于通过一款免费或低价智能手机来改变市场格局。团队士气开始变化。一个对整个项目抱有怀疑的小组,秘密买了一套印着“不同意,但服从”的军用标签,这句话是亚马逊领导力原则的第13条,决定一旦做出,持有不同意见的员工也必须服从并全力投入。
2014年4月,贝佐斯在致股东的年度信函中写道:“发明的过程充满艰难,时间久了,遭遇一些大的失败也是必然的。”没想到一语成谶。团队正准备在当年夏天的一个大型活动中推出这款手机。贝佐斯的妻子麦肯齐还出现在彩排过程中,提供支持和建议。
2014年6月18日,贝佐斯在西雅图弗里蒙特工作室推出了Fire Phone,他努力再现已故史蒂夫·乔布斯的超凡魅力,并对手机的3D显示和手势跟踪功能表现出极大的热情。“我认为他确实相信这个产品会成功,”当时亚马逊公关副总裁克雷格·伯曼说,“如果不是,他肯定不会把这种信息传递给团队。”
人们对这款手机的评价非常尖刻。在亚马逊痛苦地开发Fire Phone的四年里,智能手机市场已经发生了巨大变化,并且越来越成熟,Fire Phone自认为的创新之处,与现在用户的期望已经完全不是一码事。由于它运行的安卓系统并非谷歌的授权版本,所以没有Gmail和YouTube这些受欢迎的应用程序。虽然它比即将面世的iPhone 6便宜,但比亚洲制造商生产的大量廉价、简洁的手机贵,无线运营商大量补贴这些亚洲低价手机以换取两年合同。
负责该项目的副总裁伊恩·弗里德说:“这款手机有很多特色,但客户并不在乎。”“我和杰夫都犯了一个错误。我们并没有将Fire Phone的价值主张与亚马逊品牌保持一致,这是非常重要的。”弗里德接着说。贝佐斯事后告诉他:“你不应该对Fire Phone感到哪怕一分钟难过。答应我,你不要为此难过。”[12]
那个夏天的晚些时候,亚马逊凤凰城一个配送中心的工作人员注意到,成千上万个未售出的Fire Phone原封不动地放在巨大的木货架上。10月,亚马逊减记了1.7亿美元的存货并取消了该项目,这是该公司有史以来遭遇的最大的失败之一。“导致项目失败的原因,我们都早有所料,这是整件事情最疯狂的部分。”软件工程师艾萨克·诺布尔说,他是从一开始就对项目持怀疑态度的人之一。
讽刺的是,Fire Phone的惨败给多普勒带来了好运气。在没有智能手机市场份额需要保护的情况下,亚马逊可以毫无顾忌地开拓新型智能扬声器市场。手机项目解散后,许多没有立即被谷歌和苹果收留的工程师,公司给了他们几周时间在亚马逊找新工作。有些去了多普勒,有些去了新的热门产品项目Fire TV。最重要的是,贝佐斯没有惩罚伊恩·弗里德和其他Fire Phone产品经理,而是在亚马逊内部发出了一个强烈的信号,即冒险是有回报的,特别是当失败主要归咎于CEO时。
另外,这件事也揭示了亚马逊企业内部一个令人担忧的事实。许多Fire Phone团队成员怀疑过项目会失败,但似乎没有人有足够的勇气和智慧站出来与他们顽固的领袖争辩。
期待已久的发布
杰夫·贝佐斯安排好这些人之后,研究Alexa原型的多普勒高管带着受伤的骄傲退回到会议室,开始重新思考解决数据悖论的方法。他们的老板是对的。通过亚马逊员工进行的内部测试数据太有限了,他们需要大规模扩展Alexa的测试范围,同时想办法对外界保密。
2013年春天,罗希特·普拉萨德和语音科学家珍妮特·斯利夫卡用了几天时间设计出的方案很快就得到格里格·哈特的批准。这个方案让多普勒程序的开发像打了鸡血,也回答了那个后来让语音专家困惑的问题——亚马逊到底是用什么办法超越不可战胜的谷歌和苹果,成功打造出语音控制的虚拟助手的。
在亚马逊内部,该方案被称为AMPED。亚马逊与澳大利亚数据收集公司Appen签约,秘密地开始了Alexa的合作。Appen租了一些房屋和公寓,最开始是在波士顿。亚马逊在这些房间内乱扔了各种“伪装”设备:基座麦克风、Xbox游戏机、电视和平板电脑。在房间周围不同高度的墙壁上植入了大约20个Alexa设备,每个设备都用一些布包起来,使它们无法被看到,声音却可以通过。然后,Appen与一个临时中介签约,让大量合同员工每周六天、每天八小时鱼贯而入这些房间,阅读iPad上的固定句子和开放式的问题,如“要求播放你喜欢的音乐”和“要求你想要助手做的任何事情”。
Alexa的扬声器已关闭,所以不会发出声音,但每台设备上的7个麦克风捕获了所有内容,并将音频流传输到亚马逊的服务器。接着,另一批工作人员手动检查记录并对文字转录进行注释,将可能会困扰机器的要求进行分类,如“打开《饥饿游戏》”,这样,下次Alexa就可以知道这个要求其实是指播放詹妮弗·劳伦斯主演的电影《饥饿游戏》。[13]
波士顿测试带来了希望,亚马逊决定扩大该方案,在接下来的7个月中,该公司在西雅图和其他十个城市租用了更多的房屋和公寓,以捕捉成千上万名带薪志愿者的声音和讲话模式。设备放置、声学环境、背景噪声、方言口音以及说出一个简单请求如天气怎样或播放贾斯汀·汀布莱克的音乐时,人类可能采用的五花八门的谈话方式——种种因素杂糅起来,产生了一个巨大无比的海量数据库。
全天不断的随机测试人员涌入房屋和公寓,屡屡引发高度疑心的邻居报警。在一个实例中,波士顿一座公寓大楼的一位居民怀疑隔壁有一个贩毒交易或卖淫团伙,并打电话给警察,警察要求进入公寓。紧张的工作人员给了他们模棱两可的解释,并带他们看了一圈房间,然后匆忙关闭了该站点。有时,到达现场的临时工被奇怪的文本和整件事情的云谲波诡搞得莫名其妙,决定拒绝参加测试。一位负责注释转录文字的亚马逊员工后来回忆说,他听到一名临时工中途停下来,对他怀疑正在偷听的人说:“这太愚蠢了。做这事的公司不觉得尴尬吗!”
但亚马逊并不觉得尴尬。到2014年,它的语音数据存储量增加了1万倍,并在很大程度上弥补了与苹果和谷歌等竞争对手之间的数据鸿沟。贝佐斯高兴坏了。哈特并未要求他批准AMPED方案,但在该计划开始前的几周,他用一份六页报告向贝佐斯汇报,描述了该项目的内容及其数百万美元的成本。贝佐斯读到这份文件时,脸上露出了灿烂的笑容,过去一段时间的烦恼似乎都消失了。“这次我看到了你的认真!接下来我们做什么?”
接下来是多普勒期待已久的发布。在发布前夕,员工每周工作80~90个小时,错过大量的家庭时间。贝佐斯没有丝毫松懈,他要确保一切细节都是对的,并不断提出新的要求。例如,在西雅图异常晴朗的一天,夕阳的余晖从他的会议室窗户流过,贝佐斯注意到那个灯环的光还不够明亮,于是他下令彻底重做。几乎只有他一个人主张使用一种名为“Voice Cast”的功能,该功能将Alexa设备连接到附近的Fire平板电脑,这样用户的口令就可以在平板电脑的屏幕上以卡片的形式显示出来。当工程师们试图偷偷放弃该功能时,他发现了,并告诉团队没有该功能,产品就不发布(最终很少有客户使用这个功能)。
但是他也在很多事情上做对了。随着发布会的临近,一队员工担心该设备在嘈杂的音乐或对话中听不到命令,建议配一个像Fire TV那样的遥控器。[14]贝佐斯对此表示反对,但同意与第一批音箱一起交付遥控器,以了解客户是否会使用它们(结果没有用户使用,后来的产品中就没有遥控器了)。
在决定产品到底用什么名字时,他也成功阻止了一场灾难。四年来,团队在这个问题上一直没有达成共识。他们无休止地争论虚拟助手和硬件本身是否应该使用一个名字。在决定分开命名后,他们为音箱想了无数个名字,最后决定叫它亚马逊Flash,新闻功能称为“Flash简报”,印有Flash品牌的包装箱也已准备就绪。
但是在推出之前不到一个月,贝佐斯在一次会议上说:“我认为可以起个更好点儿的名字。”在寻找替代方案时,他们选择借用Alexa一个功能的名称——Echo,用户一般使用这个功能要求Alexa重复一个单词或短语(这个功能后来改名为“西蒙说”)。因为没有足够的时间印制新包装盒和用户手册,Echo最早的一批购买者收到的是一个纯黑的盒子。哈特聘请来的负责产品发布的总监托尼·里德不得不在没有产品名称的情况下编写用户手册,她说:“这是每个人都应该具备的技能。”
2014年11月6日,亚马逊Echo正式推出,仅仅几个月前,Fire Phone的失败还历历在目。这一次,贝佐斯没有举行新闻发布会或发表有远见的演说,完全放弃了对发明这种仪式的史蒂夫·乔布斯三心二意的致敬。贝佐斯用一种新的、低调的和让自己更自在的方法取而代之:他让团队发布了一则宣布Echo正式发布的新闻稿和YouTube上一段两分钟的视频,视频内容是一个家庭正与Alexa愉快地交谈。亚马逊的高管们并没有将新产品吹捧为一款全功能的计算机,而是认真强调了几个他们确信有用的功能,例如播报新闻和天气、设置闹钟、创建购物清单和播放音乐。
然后,他们要求用户排队预购Echo,并仔细检查这些用户的列表,看他们是否已是亚马逊Music的用户和拥有Kindle。考虑到这是一个未经测试的市场,他们的第一批订单只有8万台,并用几个月的时间逐步发布,相较之下,Fire Phone的第一批订单就超过30万台。格雷格·哈特说:“Fire Phone无疑使我们变得更加谨慎了。它让我们重新审视一切细节。”
长达四年的研发过后,不止一位多普勒资深员工怀疑亚马逊Echo可能会紧随Fire Phone之后,成为另一个失败的科技产品。在发布会那天,他们抱着笔记本电脑,挤在距离菲奥纳大楼只有几分钟步行路程的主楼新办公室的“作战指挥室”里,看着预购名单快速变长,甚至超过了他们所预测的最夸张的情况。
在心惊胆战中,有人意识到他们正在错过这个重大的成功时刻。艾尔·林赛说:“我们成功了,却对这一刻毫无准备。”因此,大约100名员工前往附近的酒吧庆祝这个期待已久的时刻,而只有几位疲倦的高管和工程师参加了那晚的活动。
无边界的扩展
在接下来的几周内,19万名客户下单订购Echo。除了一些必然存在的怀疑之声,好评也出现了,诸如“我只是说给未来,而它在倾听”[15]“这是亚马逊多年来最具创新性的产品”。[16]员工发电子邮件给Alexa高管托尼·里德和格雷格·哈特,恳求为家人和朋友申请产品。
Echo发货后,团队可以看到设备被开启,人们真的在使用它们。贝佐斯的直觉是正确的:用户在家里不用触摸智能手机屏幕,就能召唤一台计算机,这种感觉非常神奇。而拥有一个能够回答你的问题(“1夸脱有几杯?”)、为你播放音乐,甚至可以与其开玩笑(“Alexa,你结婚了吗?”)的音箱,是有价值的。
许多多普勒员工觉得他们现在终于可以松口气,享受所有带薪假期了,但事实并非如此。一波未平,一波又起,贝佐斯决定趁热打铁。罗希特·普拉萨德说:“我们连续取得了成功,这改变了我的生活。”他被提拔为副总裁,并最终加入广受吹捧的亚马逊领导委员会S-team。“我清楚Alexa和Echo的剧本,却对后来五年的剧情一无所知。”
在接下来的几个月中,亚马逊推出了Alexa技能套件,允许其他公司为Echo构建支持语音的应用程序;灯泡和闹钟等产品的制造商则可以通过Alexa语音服务软件将Alexa集成到它们自己的产品中。贝佐斯还告诉格雷格·哈特,项目团队需要每周发布一次新功能,由于没有办法发出更新信号,亚马逊还要每周向客户发送电子邮件,提醒他们其设备提供的新功能。
贝佐斯个人的愿望清单成了产品计划——他希望Alexa可以无处不在,无所不能。最初为了快速发布而暂时搁置一边的服务,如通过Alexa购物,现在已成为当务之急。贝佐斯向工厂订购了更小、更便宜的Echo版本,包括冰球大小的Echo Dot和使用电池的便携式版本Amazon Tap。就虚拟助手和智能音箱之间的市场竞争,贝佐斯评论说:“亚马逊不会愤怒于被人赶超。”贝佐斯的发言是Alexa推出后一年一度的夏末OP1计划会议的一部分。“但是,如果作为创造者我们不能成为这个领域的领导者,不是更让人生气吗?”
在亚马逊公司主楼以及Alexa团队在联合湖南区逐渐增加的办公室内,一切变得更加忙碌。他们不断推出新的功能,并收集用户反馈。硅谷的初创公司称这种产品开发方式为“最小可行性产品”(MVP)。而在亚马逊流行的叫法是杰夫·威尔克发明的“最小可爱产品”(MLP)。“什么样的产品会让我们感到自豪?”他问。很多功能(如语音通话)起初都不成熟,也很少被用到,但这并不重要。2015年圣诞节期间,亚马逊售出了100万台Echo设备。[17]
Alexa部门的口号是“快速变大”,与亚马逊早年使用的口号相同。历史总在重演。产品推出后的第一年,这个拥有几百名员工的团队规模膨胀到1000人,在接下来的五年中,又令人难以置信地膨胀到10万人。通过这一切,贝佐斯像一个火药狂人,不断在火上喷洒轻油,花了大约1000万美元在2016年1月投放了亚马逊有史以来第一个超级碗广告,邀请了亚历克·鲍德温、梅西·埃丽奥特和迈阿密海豚橄榄球队前四分卫丹·马里诺推广Alexa。
尽管有这些关注,但亚马逊内部仍感觉到Alexa组织的发展速度不够快。仅凭贝佐斯一封电子邮件和一张白板草图就开发出该产品的格雷格·哈特离开了这个部门,去帮助运营Prime Video项目。“多年以来,我每天起来最热爱做的事情就是创造Alexa,”多年后他仍然饱含热情地说道,但是随着Alexa团队的快速发展,“它可能更适合另一位领导者”。
一位长期受贝佐斯喜爱的人——迈克·乔治取代了他的位置。他是一个光头,富有个人魅力,喜欢穿牛仔靴、在脸上涂油彩,他总是喜欢吹着口哨、迈着亚马逊式昂扬的步伐走进会议室。
迈克·乔治拥有贝佐斯所谓的“可替代”能源。多年来,贝佐斯把他当作消防员,四处救火,并在人力资源、市场、支付等部门以及后来的贝佐斯私人慈善事业“第一日学院基金”建立秩序。同事们热心地称他为“蛮子”“永远爱运动的高中男孩”“杰夫的一根肋骨”。
迈克·乔治仅仅管理了Alexa一年,但他的影响一直持续到今天。Alexa部门的招聘速度无法满足其用人需求,所以亚马逊制定了一个全公司范围的选拔办法,为每名加入亚马逊其他业务群(如AWS和零售)的新员工,提供一个在Alexa部门的岗位机会。那些亚马逊经理被半路截胡,失去了他们为自己部门招募来的抢手工程师,这让他们很窝火。
乔治还对Alexa小组的结构进行了重大调整。它过去是一个单一功能的组织,按照中心化管理的方式设置工程、产品和营销团队,但这种架构的运转流畅性和效率都无法满足贝佐斯的喜好。乔治改而按照亚马逊理想高效的“两个比萨”团队重组了Alexa,每个小团队都致力于Alexa某个特定的模块,如音乐、天气、照明、恒温器、视频设备等。
每个小团队都由一个所谓的“单线程领导者”[18]全权负责,该人对整个小团队的成功或失败拥有最终控制权并担负全部责任。Alexa和亚马逊本身一样,成了无数个CEO的领地,每个CEO都自主运作。为了约束这些CEO,乔治统领创建了“北极星”文档,确立了一个全局性的、语音控制计算平台的战略。
同时,贝佐斯批准了所有这些调整并密切参与,参加产品评论,阅读每周五晚上所有“两个比萨”团队的工作进展汇编,指出各种细小的问题或故障,而团队必须利用周末来解决这些问题和故障。与亚马逊其他项目高管一样,Alexa的高管也经常收到来自CEO的大量电子邮件,常常是转发一个客户投诉,加上一个简单的问号,并期望在24小时内得到答复。他还是公司内部Alexa的首席布道者。“你在为Alexa做什么?”他问其他高管,就像几年前的AWS时期一样。公司中的每个人都必须将Alexa包括在他们提交给S-team的OP1文档中,描述他们来年的计划。
2016年底,在800万**家庭购买了Echo或Echo Dot之后,负责该设备的总裁戴夫·利普在内部宣布,亚马逊已是全球最畅销的音箱公司。这场艰难的征战取得了胜利。当然,贝佐斯的目标是让亚马逊成为世界顶级的人工智能公司,在这方面,他面对的将是艰巨无比的竞争。
那年秋天,谷歌推出了谷歌Home智能音箱。《连线》杂志评价,它看起来更加时尚,“感觉就像你可以在其中种植多肉植物一样”。[19]它的声音也更加清晰,可以预见性地在网上搜索,提供沉着冷静的答案。Alexa前高管查理·金德尔说:“每当圣诞季来临,团队都在等着看苹果或谷歌这一次会发布什么,如果没有,我们就会额手称庆。”虽然这些公司对模仿别人很介意,但最终它们还是无法抗拒快速增长的智能音箱市场的巨大吸引力。
这给Alexa团队带来了更大的压力,他们必须加快速度并在硬件的功能和版本更新方面保持领先地位。2017年初,一位瑞典客户发电子邮件给贝佐斯,询问亚马逊为何非得等着特定语言版本的Alexa开发好才能在欧洲推出Echo,为什么不能先将英语版产品卖给这些国家。其实,这些都已经在产品日程上了,但不是优先事项。一位高管说,贝佐斯在西雅图时间凌晨2点收到了这封电子邮件,第二天早上,已经有六个独立的小组在紧锣密鼓地把Alexa放到80个新国家/地区的货架上。[20]
后来,Alexa高管们说贝佐斯的密切参与使他们的日子更难过,但也产生了无法估量的结果。
托尼·里德说,杰夫“给了我们权力和许可去做一些我们需要做的事情,来实现更快、更大的目标。你可以非常自由地行事,考虑如何使用现有资源……有时,你没有任何边界。杰夫希望我们不受任何限制”。
但是疯狂的速度和增长存在诸多弊端。多年来,Alexa智能手机应用程序看起来就像是一个设计专业的学生熬夜狂欢后想出的东西。在家里安装一个Echo或把它们连接在一起,操作非常复杂。用户用正确的语音方式触发第三方应用和功能也很困难和令人迷惑。
由单线程领导者领导的无数“两个比萨”团队的分散和混乱,体现在产品上,就是很多方面都变得过于复杂。2017年接任迈克·乔治管理Alexa部门的高管汤姆·泰勒,风格尖刻、沉稳,他也同意,很多基本任务,如安装并将设备与其他智能家电相连等,都会“让用户感到痛苦,非常痛苦”。他着手“找出存在于我们自身组织架构上的、让用户苦不堪言的所有问题”。
泰勒和他的同事无法搞定所有的问题。2018年3月,一个故障导致世界各地的Alexa随机发出疯狂、无提示的笑声。[21]几个月后,Echo在未接受指令的情况下录下了俄勒冈州波特兰市一对夫妇的私人谈话,然后莫名其妙地将录音通过存在通信录里的电话号码,发送给了丈夫在西雅图的一位员工。亚马逊表示,该设备认为自己听到了唤醒指令和一系列记录与转发对话的命令。这是“极为罕见的事件”,并且“尽管发生了这一系列事件,但我们正在评估减少这种情况发生的可能性”。[22]这些事情发生后,亚马逊要求员工必须编写“错误更正”报告,该报告会详细分析事件,并通过包含一系列提问和回答(称为“五个为什么”)的程序来努力找出根本原因。这些报告都会被发给贝佐斯,详细汇报发生了什么故障,并提出解决方案。
有些错误是无法挽回的,在年轻用户心中,就有Alexa喜欢暗杀圣诞老人的倾向。有一件事就发生在Alexa Prize比赛期间(Alexa Prize是亚马逊发起的大学生竞赛,参赛者创造可以进行复杂多主题对话的聊天机器人)。Alexa用户只要说“Alexa,让我们聊天吧”,就可以和其中一个聊天机器人进行交谈,过后,用户将对其性能进行评分。在2017年的第一场比赛中,华盛顿大学的聊天机器人从在线论坛Reddit(红迪网)上检索答案,并错误地告诉孩子圣诞老人只是一个传说。[23]随后,孩子的家长进行了投诉,这个聊天机器人随即暂时中止了比赛(但后来还是赢得了50万美元的大奖)。
Alexa迄今跌宕起伏的发展历程,展示了它的成功和它存在的问题。到2019年,亚马逊已售出超过1亿台Echo。在过去的十年间,贝佐斯对科幻小说和发明的痴迷催生了一款大受欢迎的产品,但其对传统隐私观念的冲撞和挑战也为媒体所关注。
但是,Alexa仍然没有像贝佐斯和罗希特·普拉萨德最初希望的那样与人类进行对话。尽管它催生了一个新的产业,其中有大量初创企业和其他公司寄希望于语音支持的服务和设备,但使用Alexa的第三方应用或“技能”的人并不多,而且与苹果和谷歌的应用商店相比,开发人员能够从开发Alexa应用上获得的收入仍然不算丰厚。
贝佐斯热切地相信一切都将在未来几年发生改变。敬畏的员工和目睹他将Alexa变为现实的亚马逊粉丝,都相信这位CEO可以预知未来。但是从至少一方面来看,他没有。
2016年,贝佐斯正在审核Echo Show,这是第一台具有视频屏幕的Alexa。负责该项目的高管回忆,在好几次演示产品原型的场合,贝佐斯一上来就要求Alexa播放嘲笑某位共和党总统候选人的视频。
他说:“Alexa,给我看唐纳德·特朗普谈中国的那条视频。”或者,“Alexa,播放昨晚斯蒂芬·科尔伯特的独白”。然后,“他会不顾一切地大笑起来”,参加演示的一位副总裁说。
贝佐斯根本不能预知未来。
[1] 1英尺=30.48厘米。——编者注
[2] Katarzyna Niedurny, “Kariera G?osu Ivony. ‘Wsiadam do windy i s?ysz? jak mówi?“pi?tro pierwsze’” (“Ivona’s Voice Career. ‘I get in the elevator and hear me say “first floor” ’ ”) January 4, 2019, onecie/jacek-labijak-o-karierze-glosu-jacek-w-syntezatorze-mowy-ivona/kyht0wl(January 19, 2021).
[3] Eugene Kim, “The Inside Story of How Amazon Created Echo, the Next Billion Dollar Business No One Saw Coming,” Business Insider, April 2, 2016, 19, 2021).
[4] David Baker, “William Tunstall-Pedoe: The Brit Taking on Apple’s Siri with ‘Evi,’ ”Wired UK, May 8, 2012, 19, 2021).
[5] Mike Butcher, “Sources Say Amazon Acquired Siri-Like Evi App For $26M — Is A Smartphone Coming?” TechCrunch, April 17, 2013, smartphone-coming/ (January 19, 2021).
[6] James Vlahos, “Amazon Alexa and the Search for the One Perfect Answer,” Wired,February 18, 2018, perfect-answer/ (January 19, 2021).
[7] Nikko Str?m, “Nikko Str?m at AI Frontiers: Deep Learning in Alexa,” Slideshare,January 14, 2017, in-alexa (January 19, 2021).
[8] Amazon. Techniques for mobile deceive charging using robotic devices. U.S.Patent 9711985, filed March 30, 2015. (January 19, 2021).
[9] Jeff Bezos, “2018 Letter to Shareholders,” Amazon, April 11, 2018, 19, 2021).
[10] 猫头鹰公爵的典故来自一个神话传说,传说中猫头鹰作为守护天使,成为智慧、魔法及希望的象征,被皇室封为公爵。——编者注
[11] Austin Carr, “The Inside Story of Jeff Bezos’s Fire Phone Debacle,” Fast Company, January 6, 2015, 19, 2021).
[12] Charles Duhigg, “Is Amazon Unstoppable?” New Yorker, October 10, 2019,https://www.newyorker.com/magazine/2019/10/21/is-amazon-unstoppable(January 19, 2021).
[13] Matt Day, Giles Turner, and Natalia Drozdiak, “Amazon Workers Are Listening to What You Tell Alexa,” Bloomberg, April 10,2019, reviews-audio?sref=dJuchiL5 (January 19, 2021).
[14] Joshua Brustein, “The Real Story of How Amazon Built the Echo,” Bloomberg,April 19, 2016, 19, 2021).
[15] Mario Aguilar, “Amazon Echo Re- view: I Just Spoke to the Future and It Listened,” Gizmodo, June 25, 2015, just-spoke-to-the-future-and-it-1672926712 (January 19, 2021).
[16] Kelsey Campbell-Dollaghan, “Amazon’s Echo Might Be Its Most Important Product in Years,” Gizmodo, November 6, 2014, be-its-most-important-product-in-yea-1655513291 (January 19, 2021).
[17] Brustein, “The Real Story.”
[18] “单线程”一词是计算机科学术语,单线程程序一次只执行一个命令。——编者注
[19] David Pierce, “Review: Google Home,” Wired, November 11, 2016, (January 19, 2021).
[20] Todd Bishop, “Amazon Bringing Echo and Alexa to 80 Additional Countries in Major Global Expansion,” GeekWire, December 8, 2017, expansion/ (January 19, 2021).
[21] Shannon Liao, “Amazon Has a Fix for Alexa’s Creepy Laughs,” Verge,March 7, 2018, (January 19, 2021).
[22] Matt Day, “Amazon’s Alexa recorded and shared a conversation without consent,report says,” Seattle Times, March 24, 2018, report-says (February 12, 2021).
[23] James Vincent, “Inside Amazon’s $3.5 Million Competition to Make Alexa Chat Like a Human,” Verge, June 13, 2018, (February 12,2018).
如发现本站有涉嫌抄袭侵权/违法违规等内容,请联系我们举报!一经查实,本站将立刻删除。