谷歌新品发布会(谷歌新品发布会2021)
通过机器学习技术,谷歌给Google翻译新增盖丘亚语(属于美洲原住民语系)等新语种
实时翻译的存在,证实知识与计算机技术结合,能够让人们生活更加美好。现在,使用Google翻译人数之多,远超以往,但我们不能止步于此,还应让Google翻译更加普及。
现在还有很多语言在互联网上出现得没有那么频繁,翻译这些语言是个技术难题,因为用来训练翻译模型的文本通常是双语文本,例如同一个短语的英语与西班牙语版本,但并非所有语言都有足够量的公开双语文本。
因此,随着机器学习的进步,我们开发了一种单语模式,能让翻译模型在从未见过某种新语言直译版本的情况下,直接学习翻译此新语言。我们通过与新语言母语人士和当地机构合作,发现用单语方式进行翻译质量已经不错,我们也将进一步提升翻译质量。
谷歌为Google翻译新增24种新语言
我很激动的宣布,我们为Google翻译新增24种新语言,包括首批增加的美洲原住民语言。共计有3亿多人在使用这24种语言,这样的突破正在推动我们获取知识与使用电脑的方式,发生根本性转变。
Google地图新升级
许多关于这个世界的可知信息,都超越了语言范畴,它们存在于我们周围的物理与地理空间中。15多年来,Google地图一直致力将这些信息,以丰富、有用的形式呈现出来,帮助用户导航。AI的进步,正在将这项工作推向新高度,无论是将覆盖范围扩大到偏远地区,还是重新设想如何以更直观的方式探索世界。
Google地图沉浸式视图将航拍与街景图像融合
我们也为Google地图带来新功能。我们利用3D绘图、机器学习技术进步,正在融合数十亿张航拍与街景图像,创建新的高保真地图。我们将这些突破性技术结合起来,为用户提供沉浸式视图新体验,使用户能以前所未有方式探索一个地方。
让我们去伦敦看看吧。假设用户计划与家人一起参观英国伦敦市中心威斯敏斯特区。用户现在能直接从手机上Google地图获得身临其境视野,还可在景点周围移动,可以看到这就是威斯敏斯特大教堂。如果用户想前往大本钟,可在地图上看到去往大本钟的道路交通是否拥堵,甚至能看到天气预报。如果用户还想在参观期间吃点东西,可查看附近餐厅,并能通过应用直接到餐厅里面看看。
令人惊讶的是,这并不是有架无人机在餐厅里飞行拍摄,是我们使用神经渲染技术,仅通过图像创造的体验。谷歌云沉浸式流Google Cloud Immersive Stream让这种体验,可在几乎所有智能手机上运行。这项功能将在2022年晚些时候,在Google地图中针对全球部分城市推出。
Google地图另一个重大升级是推出环保路线,这项功能已在2021年落地,能够为用户显示最节约油耗的路线,提供更加节约、减少碳排放的选择。环保路线已在**、加拿大推出,用户按照环保路线行驶约860亿英里/1,384亿公里,减少约50万吨碳排放,相当于路面上减少10万辆正在行驶的汽车。
环保路线将在2022年晚些时候扩展到欧洲
我很高兴与大家分享,我们正在将这项功能扩展到更多地方,包括2022年晚些时候将扩展到欧洲。柏林地图示例中,用户可选择仅慢3分钟的路线,将油耗降低18%,这些微小的决定将产生巨大影响。随着这项功能扩展至欧洲和其他地区,我们预计到2022年底,可减少碳排放量将增加1倍。
我们同样在航班搜索服务GoogleFlights增加类似功能,用户搜索2个城市间航班时,我们会向用户显示碳排放估计值、价格、时间表等其他信息,让用户轻松选择更加环保航班。Google地图与GoogleFlights中这些环保功能,是我们非常重要的目标,让10亿人通过我们产品做出更可持续选择,我们非常高兴能够看到这些进展。
YouTube新功能帮助用户轻松访问视频内容
除Google地图外,视频正在成为我们分享信息、互相交流与学习必不可少的载体。很多时候,用户进入YouTube后,希望在YouTube找到某个视频中特定片段,我们希望帮助用户更快获取所需信息。
2021年,我们推出自动生成章节功能,让用户能更轻松跳转到最感兴趣部分。这对创作者来说,也是很棒的功能,因为它节省创作者制作章节的时间。我们现在正在应用DeepMind多模式技术,能同时应用于文本、音频、视频,以更高准确性、更快速度自动生成章节。有了这个功能,我们现在目标是,将自动生成章节视频数量增加10倍,从目前800万,增至2023年8,000万。
通常,了解视频内容最快方法是阅读它字幕,所以我们也在使用语音识别模型来转录视频。现在所有Android、iOS用户都能获取视频字幕。
在未来几个月内,将在Google Chat中加入总结功能
我们正在努力将转录与总结功能引入Google Meet,用户能快速补上重要会议中错过部分。
改进Google Meet视频
很多时候,你真的非常希望有个虚拟房间,能让你和其他人待在一起。这就是为什么我们在全息视频聊天技术Project Starline启发下,继续提高音频与视频质量。我们在2021年I/O开发者大会上介绍了Project Starline,一直在Google各个办公室进行测试,寻求反馈,并改进技术。在这个过程中,我们发现了些可立刻应用于Google Meet的技术。
Project Starline启发了机器学习驱动的图像处理技术,可自动改善Google Meet图像质量。这项技术适用于所有类型设备,因此无论你在哪里,都能展现你最佳形象。
“思维提示链”技术让模型能更好进行推理,给出更准确答案
“思维提示链”大大提高PaLM准确性,让它在数学问题等多个推理基准测试中,达到最顶级水平。我们在不改变模型训练方式的情况下,完成了这一切。
此外,功能强大的PaLM还能做到更多。例如,现在网络上,可能没有足够多以你所使用语言提供的信息。更令人沮丧的是,你所搜寻的答案可能就在某处,只是没有以你看得懂的语言呈现,PaLM提供了一种有望让每个人都更容易获得知识的新方法。
我展示1个示例,PaLM可以用孟加拉语回答问题,就像我们用孟加拉语的问题,和孟加拉语、英语的答案训练了它一样。
我们可以开始用孟加拉语提问:“孟加拉国的国歌是什么?”顺便说下,答案是“Amar Sonar Bangla”,PaLM也答对了。这并不令人惊讶,因为在孟加拉语资料中,很显然能找到相关答案。
你还可以尝试些不太可能以孟加拉语找到相关信息的问题,比如:“纽约流行的披萨配料是什么?”该模型再次以孟加拉语做出正确回答。虽然它的回答到底有多“正确”,这点很可能在纽约人间引发辩论。
令人印象深刻的是,PaLM从未见过孟加拉语与英语间的对译,我们也从未训练过它如何回答问题或翻译,该模型自己将所有功能结合在一起,可以用孟加拉语正确回答问题。我们可以将这些技术,扩展到更多语言和其他复杂任务。
我们对语言模型的潜力非常乐观。有朝一日,我们希望能以用户说的任何语言,回答更多问题,让知识在Google搜索和其它Google工具中更容易获取。
推出全世界最大的开放机器学习中心
我们今天所分享的进步,之所以能成为现实,离不开我们在基础设施方面的持续创新。我们最近还宣布计划向**各地数据中心、办公室投资95亿美元。
我们最先进的数据中心之一位于**中南部俄克拉荷马州的梅斯县。我激动地宣布,我们将为Google云客户推出全世界最大的开放机器学习中心。
谷歌最先进的数据中心之一,位于**中南部俄克拉荷马州梅斯县
此机器学习中心拥有8个Cloud TPU v4芯片(张量处理器,专为机器学习构建),是Google定制的,建在为Google最大的神经模型提供支持的网络基础设施之上,能提供接近9 x 10^18 FLOPS的算力,能为Google客户提供前所未有的运行复杂模型和工作负荷的能力。我们希望这将推动众多领域创新,从医学、物流,到可持续性发展等。
说到可持续发展,该机器学习中心已达到90%无碳能源运营。这能帮助我们实现目标,到2030年,旗下所有数据中心与园区实现全天候无碳运营,我们要成为第一个做到这点的大公司。
在投资数据中心的同时,我们也在努力创新Google移动端平台,更多数据处理能在本地设备进行。Google定制的Google Tensor张量计算芯片,是朝此方向迈进的重要一步。Pixel 6、Pixel 6 Pro旗舰手机已搭载Google Tensor芯片,让你手机直接拥有AI功能,包括我们所应用的最好的语音识别技术。
这也是向让设备更安全这一目标迈出的一大步,与安卓的私有计算核心Private Compute Core结合后,这项技术可直接在用户设备上运行数据驱动的功能,保护你的隐私。
不管是至关重要还是微不足道的时刻,每天都有人向我们产品寻求帮助。让这点成为可能的关键就是,在每一步都保护用户隐私信息。尽管技术正变得日益复杂,但我们产品是安全的,从设计上保护隐私,让用户拥有控制权,因此,在让全世界更多人能安全上网这点上,我们比其他人走得更远。
我们今天还分享了Android等平台的更新,这些更新正通过智能手机与其他可连接设备,如电视、汽车、手表,向数十亿人提供访问、连接、信息。
Google Pixel 6a
谷歌旗下第一款智能手表Pixel Watch,也与大家正式见面,外观十分圆润,与此前疑似曝光图基本一致,不过谷歌没有公布其价格与具体发售时间。
Pixel Watch
谷歌发布第一部支持主动降噪的TWS耳机Pixel Buds Pro,支持空间音频功能,颇有直接对标苹果AirPods Pro意味,但售价仅为199美元/约1,300元人民币。
拍照方面,AI算法不仅能对物体进行消除操作,还能改变物体颜色。
语音方面,AI算法能帮助用户更高效进行实时翻译。
安全方面,Pixel 6a搭载Titan M2芯片,并支持屏下指纹识别功能。
性能方面,根据GeekBench数据,谷歌初代Tensor芯片的CPU性能大致相当于高通上代旗舰SoC骁龙888的水平。
谷歌希望,未来智能设备为用户提供服务将变得无感、随时随地,智能手表是非常关键的一环。
值得注意的是,Pixel Watch将在2022年秋季上市,但谷歌并未公布其具体价格与发布时间。
谷歌也没有公布Pixel Watch具体芯片配置,有曝光信息称,谷歌Pixel Watch将搭载三星Exynos系列芯片。
多设备协同方面,谷歌展示一款搭载谷歌Tensor芯片的平板电脑,目标是在2023年发布这款平板电脑产品。
谷歌希望通过在手机、手表、耳机、平板等各设备领域布局,给用户带来覆盖更多场景、计算,能够无缝协同的智能化体验。
多设备互联成Android重点,点名“Matter”加码AIoT
关于Android系统相关升级介绍,被放在大会中后段。谷歌提到,2023年整年,消费者新激活安卓手机数量将超过10亿部。
谷歌表示,虽然手机目前依然是用户的计算中心,手表、汽车等设备都开始具有计算能力,在多设备场景中,开放将变得十分重要。
新的Android 13中,手机依然是中心,但在手机之外,系统能更好的连接更多设备。
界面自定义方面,Android 13有所升级,此外Android 13还加入更多隐私安全保护功能。
手机和钱包是我们必带的两样东西,谷歌希望用手机取代钱包,谷歌钱包除支付功能,还可预定电影票、储存疫苗接种卡,未来还会支持数字身份证、数字驾照功能。谷歌钱包将会在Android、Wear OS操作系统中应用。
用于可穿戴设备的Wear OS,谷歌表示,目前,Wear OS设备数量已达到2021年同期的3倍,越来越多开发者加入Wear OS应用生态中。
谷歌在发布会上特别提到Android系统针对大屏设备的优化。目前,大屏设备上有近2.7亿活跃用户。
针对平板等大屏设备,Android系统进行特殊优化,例如对图像、文字显示,有针对性调整,提升显示效率,例如在TikTok中,视频与评论分别显示在左右两侧,用户能在观看视频的同时看评论。
自然语言处理NLP领域,谷歌AI技术能对文字段落进行更好的理解、总结,并帮助用户快速找到重点信息。
视频通话领域,谷歌AI视频增强技术能显著提升视频效果,让暗部更清晰。
谷歌搜索是谷歌王牌业务之一,在AI技术加持下,谷歌认为,未来用户可通过任何方式、在任何地方进行搜索,例如通过语音、文字、图片等方式进行搜索。
谷歌表示,目前用户通过图片搜索次数达到每月80亿次,1年时间增长3倍。
谷歌推出near me搜索功能,可根据用户位置,为用户提供更便捷地点搜索功能。
用户甚至能通过1张食物照片,找到制作这道菜肴的餐厅。
谷歌认为,AI技术的加入,让设备能更好理解我们所在的世界,并从中获取用户需要的信息,多模态搜索能力是背后的核心技术支持。
AI语音助手对话更简便、头脑更聪明,甚至学会了“想象”
谷歌表示,AI对话能力技术领域,全球每天有7亿人使用Google Assistant。
谷歌发布“Look and Talk”功能,用户不再必须通过“Hi Google”唤醒设备,能通过注视并直接讲话与语音助手进行交流。
用户只需看着设备屏幕上的前置摄像头,并说出需求,语音助手就会进行应答。
另外,用户可直接通过快捷短语控制语音助手,例如上个闹钟、关个灯。
谷歌核心目的,是让用户与语音助手交互更自然。
开放式对话处理方面,谷歌进一步优化神经网络模型,语音助手甚至能对非连续对话进行理解。
例如用户说话时即使磕巴、语句断断续续,语音助手还是能听懂用户意思。
PaLM可以用没有训练过的语言,回答用户提出的问题,打破语言的边界。
谷歌在大会上宣布,他们将为谷歌云客户提供全球最大的开放机器学习中心,该数据中拥有9 exaFLOPS算力。
谷歌特别提到,这些语音、视频AI技术,都能通过谷歌Tensor芯片实现落地,在手机等产品中直接应用。
结语:硬件版图再拓展,谷歌软硬件协同优势凸显
谷歌2022年I/O开发者大会上,硬件戏份甚至多于软件,不少产品也是谷歌首次发布甚至是首次公开展示,硬件产品布局上,谷歌在加快脚步。
与此同时,不论是Android系统升级,还是系统上各类APP能力提升,也能看到谷歌已完成从芯片到算法、从硬件到软件的技术打通,成为谷歌与苹果掰一掰手腕的底气。
科技行业竞争日益激烈,科技巨头们都不再只依靠单点产品突破,而往往采取多线出击、软硬件技术并行策略,通过软硬件协同建立自身优势生态壁垒,已成为行之有效的方式。
相关研报:
【头号玩家第二季预售】:科技创新带来范式转换,拓展无尽新边疆
九宇资本赵宇杰:1.5万字头号玩家年度思考集,科技创新,无尽前沿
九宇资本赵宇杰:1.5万字智能电动汽车年度思考集,软件定义,重塑一切
【重磅】前沿周报:拥抱科技,洞见未来,70期合集打包送上
【重磅】六合年度报告全库会员正式上线,5年多研究成果系统性交付
【智能电动汽车专题预售】百年汽车产业加速变革,智能电动汽车时代大幕开启
【头号玩家第一季预售】:科技巨头探索未来,头号玩家梯队式崛起
【首份付费报告 年度会员】直播电商14万字深度报告:万亿级GMV风口下,巨头混战与合纵连横
【重磅】科技体育系列报告合集上线,“科技 体育”深度融合,全方位变革体育运动
【重磅】365家明星公司,近600篇报告,六合君4年多研究成果全景呈现
九宇资本赵宇杰:CES见闻录,开个脑洞,超级科技巨头将接管一切
【万字长文】九宇资本赵宇杰:5G开启新周期,进入在线世界的大航海时代|GBAT 2019 大湾区5G峰会
九宇资本赵宇杰:抓住电子烟这一巨大的趋势红利,抓住产业变革中的变与不变
【IPO观察】第一季:中芯国际、寒武纪、思摩尔、泡泡玛特、安克创新等11家深度研报合集
【IPO观察】第二季:理想、小鹏、贝壳、蚂蚁、Snowflake、Palantir等12家公司深度研报合集
【IPO观察】第三季:Coinbase、Roblox、快手、雾芯科技等12家公司深度研报合集
【重磅】年度观察2019系列合集:历时3个多月,超20万字近500页,复盘过去,展望未来,洞悉变与不变
【珍藏版】六合宝典:300家明星公司全景扫描,历时3年,210万字超5,000页,重磅推荐
九宇资本赵宇杰:对智能电动汽车产业的碎片化思考
九宇资本赵宇杰:九宫格分析法,语数外教育培训领域的道与术
【2022回乡见闻录】20位90、00后2万字,4国13地,全方位展现国内外疫情防疫、春节氛围、发展现状差异
【2021回乡见闻录】22位90后2万字,就地过年与返乡过年碰撞,展现真实、立体、变革的中国
【2020回乡见闻录】20位90后2万字,特殊的春节,时代的集体记忆
【重磅】22位“90后”2万字回乡见闻录,讲述他们眼中的中国县城、乡镇、农村
六合君3周岁生日,TOP 60篇经典研报重磅推荐
下午茶,互联网世界的三国杀
5G助推AR开启新产业周期,AR眼镜开启专用AR终端时代
新商业基础设施持续丰富完善,赋能新品牌、新模式、新产品崛起,打造新型多元生活方式
【重磅】中国新经济龙头,赴港赴美上市报告合辑20篇
知识服务 付费 音频,开启内容生产新的产业级机遇,知识经济10年千亿级市场规模可期
从APP Store畅销榜4年更替,看内容付费崛起
新三板,我们有个九宇会家族
新三板破万思考:新三板日交易量10年100倍?
九宇资本赵宇杰:科技改变消费,让生活更美好|2017 GNEC 新经济新消费峰会
九宇资本赵宇杰:创业时代的时间法则,开发用户平行时间|2016 GNEC 新经济新智能峰会
九宇资本赵宇杰:互联网引领新经济,内容创业连接新生态|2016 GNEC 新经济新营销峰会
请务必阅读免责声明与风险提示
如发现本站有涉嫌抄袭侵权/违法违规等内容,请联系我们举报!一经查实,本站将立刻删除。