彪悍的谷歌AI狂潮:甩出8大AI黑科技,公布全新安卓Q、手机和大屏音箱

智东西(公众号:zhidxcom)
文 | 心缘 王小溪

智东西5月8日报道,今日凌晨(美国时间5月7日上午),继Facebook、微软开发者大会之后,谷歌终于迎来了自己的主场——第11届Google I/O 2019开发者大会如期而至。

本届大会为其三日,依然是在老地方在山景城的海岸线圆形剧场(The Shoreline Amphitheatre)举行。

尽管过去一年谷歌过得相当不太平,被谷歌CEO桑达尔·皮查伊(Sundar Pichai)称之为“谷歌「有史以来最为动荡不安的时刻」”,这次大会依然吸引到来自全球的约3万名与会者,足见谷歌对开发者的号召力之强。

彪悍的谷歌AI狂潮:甩出8大AI黑科技,公布全新安卓Q、手机和大屏音箱

这使得本届Google I/O开发者大会显得尤为关键,谷歌究竟能不能一举赢回广大开发者的心,就看今天了!

在本届大会,谷歌的两大硬件阵容Pixel、Nest组团更新,另外,谷歌带来了最新的安卓系统Android Q,AI更是本次大会上当之无愧的主角 。主要亮点包括:

1、发布中端手机Pixel 3a(售价399美元起)和Pixel 3a XL(售价479美元起)。

2、发布10英寸屏幕带摄像头智能音箱Nest Hub Max,新增面部匹配功能,售价229美元,Nest Hub降价至149美元。

3、首发全新一代安卓移动操作系统Android Q:新增暗色主题、专注模式。

4、推出新一代Google Assistant,将其语音识别模式从数百GB减少到半千兆字节,使其小到足以适合手机。

5、拟将Google Assistant内置于Waze中,可唤醒驾驶模式,用语音处理一切事物。

6、谷歌搜索加入3D摄像头和AR功能,可以通过搜索将3D模型置于现实世界。

7、Google Lens升级,新增语音功能,门槛超低。

8、推出Live Caption功能,为手机上的音频或视频实时自动生成字幕,还可以实时转录电话。

9、谷歌地图将推出AR模式,在现实街景中为用户指路。

10、拟在网页上推出Duplex(Duplex on the web)。

11、将在谷歌地图和Youtube新增隐身模式。

12、公布Euphonia项目,研究如何改进其AI语音算法,帮助有语言障碍的患者进行高效沟通。

此外在大会前一天,谷歌还公开了汽车操作系统Android Auto的新设计,新增暗色主题,并允许用户同屏访问多个应用。

一、AI仍是主旋律:开场抛出8个新功能

毫无例外,谷歌CEO桑达尔·皮查伊(Sundar Pichai)率先登场,一上场就幽默地说:“今天除了I/O大会外,还有巴萨对利物浦比赛值得关注。”

作为面向开发者的盛会,近几年来,AI技术及应用的更新升级已经成为各大科技公司开发者大会的保留曲目。

早在2016年的I/O大会上,谷歌就亮出了“从移动优先到AI优先(Mobile first to AI first)”的新战略。

在接下来长达两三个小时的开幕演讲里,AI几乎贯穿始终。

1、谷歌搜索:融入3D摄像头和AR

谷歌宣布将增强现实(AR)融入到谷歌搜索中,只需在搜索框输入你想搜索的内容,即可将相关实物通过3D摄像头和AR技术,放到真实场景中。

比如只要用摄像头对准街道就能显示相应的信息,手机就会告诉你在哪能买吃的,从哪里进入会场。

Pichai表示,谷歌的目标就是更好的为大家服务。他首先展示了Google News的搜索能力,搜索“黑洞”后,谷歌使用机器学习的方式推荐新闻,能看到一条展示黑洞是如何被发现的时间线。

你还能通过搜索找到你想要的播客(Podcast),就像搜索照片、文章一样,这些播客可以先存储下来以后再听。

另外,谷歌还将3D摄像头、AR和搜索结合在一起。

比如搜索“肌肉模型”或者谋一双鞋,你就能通过3D摄像头和AR技术将模型或鞋子显示在桌面上,甚至可以和实物进行对比。同样,如果你搜索大白鲨,还能让大白鲨放到真实场景中。

彪悍的谷歌AI狂潮:甩出8大AI黑科技,公布全新安卓Q、手机和大屏音箱

2、Google Lens新增语音功能,35美元手机也能用

谷歌最近新推出的视觉搜索工具Google Lens也增加了新功能。

一个接地气的例子就是当你在餐馆里用餐时,可以用Google Lens可自动识别菜单,高亮显示最受欢迎的菜品,还可以在Google Map上的评价。

你也可以通过菜品的图片,可以直接搜索到菜品的做法,这给广大吃货们无疑是大福利。

更智能的是,Google Lens在你就餐结束后帮你结账,计算小费以及每个人应付的价格。

这背后是Google强大的知识图谱和应用生态。据介绍,Google Lens在Google Assistant、Google Photos和Google Camera中的使用已超过10亿次。

谷歌高管宣布功能在文本识别之外,又增加了语音朗读等更多智能化功能。

更令人惊喜的当属Google Go的新功能。

它是一款入门级手机搜索应用程序,允许用户将摄像机指向一个标志,并翻译文本并以其母语朗读。新增语音功能。

考虑到很多人看不懂英语,你只需用摄像头直接对准英文文字,就能听到它读给你,一边读一边将原文字显示高亮,还能将原文直接翻译成你读得懂、听得懂语言。

据介绍,谷歌计划让Google Lens支持英语、日语、中文等14种语言。

彪悍的谷歌AI狂潮:甩出8大AI黑科技,公布全新安卓Q、手机和大屏音箱

同时,它的使用门槛非常低,容量压缩到100KB以下,可应用于入门级设备,连售价仅35美元的手机都可以使用这个功能。

3、网页上的Duplex

在上一届I/O大会上大秀实力的全双工Duplex又来了,Duplex可在手机上使用,现已在美国44个州推出,它只需一个语音命令,就可以代替人类与餐厅工作人员进行对话,为人类预订餐桌。

例如预订汽车租赁服务,它通过Gmail和历史记录了解您的旅行日期和您的汽车偏好,打开相应的网站,就可以代替你填写所有需要的信息,帮你选择你喜欢的汽车型号,你只需最后确认细节,就能快速完成订车过程。

谷歌高管表示,希望Duplex不仅能用于手机,还能用于网页(Duplex on the web)。现在谷歌正在为这一方向而努力,并将在今年晚些时候分享更多细节。

4、Google Assitant:惊人的响应速度

下面是谷歌助手(Google Assistant)的最新进展,现在它能够瞬间执行用户的语音命令。

据介绍,这在谷歌内部被称之为“下一代智能助理”,“把AI最强大的系统带到手机”,“改变系统的未来”。

为了更好识别和处理语音,Google Assistant整合更多的机器学习模型,可识别不同音节,并将这些音节组成单词,使得执行命令的速度比你用手点击手机还要快得多。

Pichai表示,这相当于“将谷歌数据中心塞到自己的口袋”。

现场谷歌演示了通过Google Assistant一口气发布一连串命令,无需说“Hi Google”,就你能以超快速度连续打开不同应用,并执行相应指令。

彪悍的谷歌AI狂潮:甩出8大AI黑科技,公布全新安卓Q、手机和大屏音箱

除了跨App多任务处理外,语音写邮件的演示效果也相当惊艳,几乎演示者话音刚落,邮件就已经写完了。

全新Google Assistant通过深度学习将100GB模型压缩到1.5GB,可直接供移动设备使用,预计将在今年晚些时候推出的新Pixel手机上率先发布。

此外,谷歌推出Picks for you、个人参考(Personal References)功能,使得Google Assitant更好推断和理解用户的需求,提供更加精准的个性化推荐。

5、Google Assitant与Waze集成,唤醒驾驶模式

另一个有趣的更新是Google Assitant将在“短短几周内”内置于地图导航软件Waze中。

说“Hi Google,让我们开车”就可以进入驾驶模式,这个模式拥有一个一个极简主义的仪表板视图,重点显示您在驾驶时可能需要的内容,如方向、音乐等提醒。

彪悍的谷歌AI狂潮:甩出8大AI黑科技,公布全新安卓Q、手机和大屏音箱

在驾驶模式中,Google Assitant可根据日历上的预定为你推荐最短的路线,而且你的视线完全不需要离开路,就能打电话或完成其他任务。

并且今年晚些时候可以在任何使用Google智能助理的手机上使用。

另外在大会前一天,谷歌汽车操作系统Android Auto的新设计也被公开,新增暗色主题,看上去更为简洁大方,在导航的同时允许用户同屏访问多个应用。

6、安全隐私:更多隐私设定,强调混合学习

谷歌已经在Chrome中使用了隐身模式(Incognito mode)超过十年,如今Google Maps和YouTube也都将推出该功能。

它就像在Chrome中一样,用户可以在地图上搜索某个地点,并在一个区域内自动导航,你的数据和位置记录并不会与你的用户相连。

彪悍的谷歌AI狂潮:甩出8大AI黑科技,公布全新安卓Q、手机和大屏音箱

此外,Pichai还提到了此前谷歌研发的混合学习(Federated Learning)技术。

这种技术使得AI模型可以直接放在手机上训练,无需将手机中的数据上传到云端,从而在保护用户隐私的同时,持续优化AI模型,推进技术的边界。

7、Live Caption:为视音频实时生成字幕

彪悍的谷歌AI狂潮:甩出8大AI黑科技,公布全新安卓Q、手机和大屏音箱

Pichai介绍说,全世界有5亿聋哑人,谷歌希望通过实时语音转录文本,让听不见世界的人也能和其他人高效沟通。

除了宣布在持续不断研究Live Transcribe这项转录技术外,Pichai重点介绍了一项新功能——Live Caption。

Live Caption可实现在线语音转录文本,能为任何音频或视频源添加了实时字幕。Pichai称甚至关闭视频声音,也可以生成字幕。

另外一个例子是Live Relay,该功能可帮助有听力障碍的人打电话,可以将对方的语音生成实时文字。

再比如渐冻症患者一般用目光来控制打字,而利用机器学习技术,可实时识别他们的表情,让他们可以快速表达自己并被人理解。

这些AI新应用也会在新安卓系统Android Q中能够使用。

8、Project Euphonia:帮助有语言障碍者高效沟通

在这一环节的最后,Pichai宣布推出Project Euphonia,以探讨AI如何更好地理解那些有语言障碍和其他类型语音模式的人。

Pichai说,语音识别技术目前不适用于有语言障碍的人,因为没有人收集到足够大的数据集。而这就是Euphonia进来的地方。

他表示,谷歌正努力在未来向Google智能助理提供这些语音识别模型,但要实现这一目标,谷歌需要更多训练数据,因此他呼吁更多有语言障碍的人贡献其语音样本。

二、10英寸带屏智能音箱Nest Hub Max:搭载安全摄像头

近几年,谷歌一直在加大智能音箱、智能门锁等智能家居硬件方面的押注。

谷歌表示将Nest和智能家居团队结合在一起,所有智能家居设备现在都属于Nest品牌。

在本届大会上,Google带来了智能硬件新品——10英寸屏幕带摄像头的智能家居控制中枢Nest Hub Max,售价229美元,去年发布的Nest Hub则减价到129美元,面向12个市场,支持19种语言。

彪悍的谷歌AI狂潮:甩出8大AI黑科技,公布全新安卓Q、手机和大屏音箱

果然,正如此前普遍猜测的那样,Nest Hub Max是今年推出的Google Home Hub的加大版,屏幕从7英寸加大到10英寸,具有Home Hub的所有功能以及一些新功能,可以连接智能灯、智能锁、摄像头等多种智能家居设备。

Nest Hub Max内置Google Assitant智能助手和立体声扬声器,并搭载了安全摄像头Nest Cam,与运动及声音报警集成在一起,既可以作为安全监视器,还能作为Duo视频通话的关口。

例如,当你离家时,你可以将Nest Hub Max的相机用作家庭安全摄像头并流式传输实时视频。

同时谷歌也表示坚决捍卫用户的隐私,只要用户不想被拍摄,Nest Hub Max就不会拍摄用户的视频。

另一个很酷的功能是新的面部匹配功能,可以识别每个家庭成员并为之匹配个性化体验。

每个人都可以设置自己的面部识别,并将照片与个人信息相连接,当一名家庭成员走到设备面前,它就会显示这位成员的行程、喜欢的音乐、视频等等。

还有一个新鲜的功能是用户可以用手势来操控设备,它使用设备上的机器学习来识别手势,因此用户甚至不需要说话就能暂停音乐。

谷歌宣称,Nest Hub Max也可以被用户当做厨房电视来使用。

彪悍的谷歌AI狂潮:甩出8大AI黑科技,公布全新安卓Q、手机和大屏音箱

三、新一代安卓系统Android Q问世,2款中端手机售价399美元起

发布新一代安卓系统一直是谷歌I/O雷打不动的常规流程,Android Q的测试版在1个月前已经上线,并在4月份更新。

另外在本次大会上,此前已曝光大量信息的中端手机Pixel 3a/Pixel 3a XL终于来了。

1、Android Q:暗色模式更省电,增加专注模式、智能回复等功能

谷歌宣布,全球目前有25亿台Android设备,有180+合作伙伴,此次谷歌发布的Android Q围绕着“创新、安全和隐私”三大关键词。

从今天起,Android Q的Beta版可用于13个品牌的21种设备,包括所有Pixel手机。

这13个手机品牌包括Pixel、一加、TEcno、小米、ASUS、华为、索尼、诺基亚、OPPO、LG、Essential、vivo、realme 。

彪悍的谷歌AI狂潮:甩出8大AI黑科技,公布全新安卓Q、手机和大屏音箱

最令人期待的当属Android Q和AI的整合。

比如音频实时转字幕的功能,可以直接在设备上进行,无需网络就可完成。

它还提供智能回复功能,现在可用于Android设备上的所有消息传递应用。智能回复不仅预测单词,还预测短语甚至完整回复。

在用户打字的时候,系统会预测用户要输入的文字,然后为用户提供有用的建议,直接打开第三方应用,为用户节约不少时间。

其他亮点包括:

(1)支持折叠屏,和Android P一样,Android Q 也新增支持可折叠手机功能,并优化该功能的兼容性,还新增类似于FaceID的面部识别功能。

彪悍的谷歌AI狂潮:甩出8大AI黑科技,公布全新安卓Q、手机和大屏音箱

(2)推出全局暗色(Dark Theme)主题,支持自动检测壁纸色调以自动调整黑暗模式的开关,有利于电池省电。不过目前还没有暗色模式切换开关。

彪悍的谷歌AI狂潮:甩出8大AI黑科技,公布全新安卓Q、手机和大屏音箱

(3)进一步强调隐私保护,Android Q中新增了50个隐私和安全设定,控制应用程序对个人位置的分享,并且会通过发出通知提醒用户有哪些应用程序在收集资料。

比如允许用户更细粒度地管理App定位权限,当应用第一次开启并需要调用定位权限时,系统提供“始终允许”、“仅在使用期间打开”和“拒绝”三种选项。

彪悍的谷歌AI狂潮:甩出8大AI黑科技,公布全新安卓Q、手机和大屏音箱

另一项重大更新是新支持与安全性相关的可单独更新的Android OS Framework模块。它们在后台进行无线更新,并且无需用户重新启动即可应用更新。

(4)发布专注模式(Focus Mode)。Android Q和Android P都增加了这项新功能,该功能可启用“请勿打扰”,并禁用任何你不想被分散注意力的特定App,一定程度上减少了用户对智能手机的使用时间。

系统中还增添家长控制模式,家长可以对孩子玩手机的时间进行设置,这种设置可以具体到每一个应用程序的时间花费上,妈妈再也不用担心小孩沉迷于手机!

2、Pixel 3a/Pixel 3a XL售价399美元起

早在一个月前,谷歌商店Google Store就释放了官方信号,在登录页面写着:“5月7日(北京时间5月8日),Pixel宇宙将有大事发生。”

正如此前铺天盖地的预告那样,中端手机Pixel 3a和Pixel 3a XL终于来了,售价399美元,仅为Pixel 3/Pixel 3 XL售价的一半。

彪悍的谷歌AI狂潮:甩出8大AI黑科技,公布全新安卓Q、手机和大屏音箱

值得一提的是此款手机的电池,谷歌宣称,这款手机一次充电可使用30个小时,充电15分钟可使用7个小时。

谷歌称全新Pixel手机配备了3.5 mm耳机插孔,不会牺牲安全和隐私,并提供使用连续3年的软件更新。

新款Pixel手机与此前的Pixel 3、Pixel 3 XL外观几乎如出一辙,提供黑、白、浅紫三种配色,即日起在Verizon、T-Mobile、Sprint、AT&T等主流运营商处提供,将在下图中的13个国家或地区销售。

彪悍的谷歌AI狂潮:甩出8大AI黑科技,公布全新安卓Q、手机和大屏音箱

Pixel 3a搭载骁龙670处理器,采用5.6英寸1080P OLED显示屏、3000 mAh电池及4GB内存;Pixel 3a XL搭载骁龙710处理器,采用6.0英寸FHD+ OLED显示屏、3400 mAh电池及6GB内存。

两款手机都有32GB/64GB/128GB存储选择,后置采用和Pixel 3同款的1200万像素单摄像头,配备谷歌定制的Pixel Visual Core,性能与旗舰Pixel 3相近,但不会搭载 Google Assistant。

Pixel 3a摄像头性能优越,它保留了夜拍增强功能,并提供人像模式,拍摄的图片放大之后清晰度依然很高。

彪悍的谷歌AI狂潮:甩出8大AI黑科技,公布全新安卓Q、手机和大屏音箱

同时,Pixel 3a手机利用语言识别技术可以为用户过滤掉很多骚扰电话。

那么较低的价格放弃了什么呢?Pixel 3a没有防水和无线充电等高级功能。虽然谷歌在云端提供免费的Google照片存储,但Pixel 3a设备上传照片的质量将仅限于高质量,而非全分辨率。

还有一个巨大的惊喜,谷歌地图(Google Maps)推出了AR模式。

只需打开Google Maps,你就会从摄像头看到现实的街景,并在街景上看到明显的路标。

彪悍的谷歌AI狂潮:甩出8大AI黑科技,公布全新安卓Q、手机和大屏音箱

该模式已经测试了一段时间,Pixel手机可以使用早期预览版本。

四、去年的2大AI项目,3日覆盖18个议题

最后,研究人员还介绍了去年Google AI的两大项目。

其一是Google AI在医疗领域的应用,它可以提供更好的诊断,比如使用AI更早查出肺癌。谷歌研究人员利用深度学习模型来发现肺部的病变,它的诊断能力甚至要高于医学专家。把AI应用肺癌诊断,可以使40%的患者提高生存率。

同时谷歌还利用AI来预测洪水,能为印度等洪水高发地区提供更精准的洪水预测。

第二个项目是用AI建立外部生态系统,谷歌聚合并资助了来自世界的不同组织一同致力于发现细菌病变,以提高公共健康水平。

本届谷歌I/O 2019大会将涉及18个议题,涵盖广告、Android/Play、谷歌助手、AR增强现实、Chrome操作系统、云、设计、Firebase、Flutter、游戏、物联网、位置/地图、ML/AI、开源、支付、搜索和Web等。

谷歌主题演讲就到此落幕了,随后谷歌将在今日的31个主题会议中分别介绍Android、Android辅助功能、Android C++开发、Android机器学习、谷歌游戏、Chrome和网络、ARCore等一系列新功能。

明后两天,Android Studio UI设计和调试工具、Android开发工具、Google Cast SDK、架构组件、Google Play、Android Kotlin、JavaScript、共享存储、Android Studio Build System、Google Play Billing、Android OS用户界面等新功能也将陆续被展示。

结语:处处彰显的AI与人文关怀

自2016年谷歌将战略从“mobile first”调整到“AI first”后,AI俨然已经取代安卓成为I/O大会的主角,贯穿整个开幕演讲。

谷歌在AI方面几乎是十项全能。无论是令人惊叹的零延迟语音转录文字能力,还是实用的谷歌地图AR导航功能,都彰显出谷歌在AI技术方面的领先实力。

即便是新发布的Android Q,一大亮点也是与AI结合,如智能回复、音频实时转字幕,安卓作为谷歌的移动军团主力军,已成为其AI布局中的重要一环。

在整场演讲期间,除了无处不在的AI外,另外一个处处彰显的即是人文关怀。

我们不断地听到谷歌高管们强调他们如何用技术来为人们生活带来更大的便利,如何给予用户保护隐私的空间,如何去考虑到弱势的残疾人,希望能帮助他们像正常人一样高效的沟通。

科技与人文的交织,使得这场I/O的序幕显得如此隆重而令人印象深刻。