智东西(公众号:zhidxcom)
文 | 心缘

智东西4月25日消息,今日, 百度大脑开放日第二期在北京中关村创业大街百度大脑创新体验中心举行。

据介绍,自2016年启动开放后,百度大脑已成为服务规模最大的AI开放平台,开放了171种AI能力,可实现24小时快速集成,开发者数量超过110万。

继上个月的首场百度大脑开放日带来24项全新AI技术(百度大脑首期开放日秀肌肉:24种新AI能力,赋能市政、物流、教育N大行业)后,本次活动上,百度AI技术生态部高级经理刘倩又全面解析了百度大脑最新推出的13款通用新能力以及6项升级。

百度大脑推新组合拳:连发13通用AI新能力、6项新升级、2个新福利

其中,蓝色部分为今日发布的新品,绿色部分为新升级的产品,最下方的三行白字是百度为开发者们发放的福利。

在发布今日的新能力和平台之前,刘倩先回顾了在本周二首届WAVE SUMMIT 2019深度学习开发者峰会上,百度不仅给唯一国产的深度学习框架PaddlePaddle赐了中文名“飞桨”,带来了PaddlePaddle 11项新特性及服务重磅发布,还宣布AI Studio亿元算力支持计划,供开发者们免费试用工业旗舰GPU。

百度大脑推新组合拳:连发13通用AI新能力、6项新升级、2个新福利

上图黄色框标注了PaddlePaddle新发布或者重大升级之处。

其中,百度面向工业应用的中文NLP工具集PaddleNLP、业界首个视频处理PaddleCV、自动选取最适用的网络模型的工具AutoDL Design等新特性均相当吸睛。

一、EasyDL通用版全面升级,商品检测专业版发布

PaddlePaddle的服务平台中,除了前几日新发布的一站式开发平台AI Studio外,还有一款已经被广泛使用的定制化训练与服务平台EasyDL。

据介绍,EasyDL目前拥有超过1.5万个企业客户,已创建超过3万个模型。

EasyDL可为开发者提供零算法基础定制高精度AI模型。相比AI Studio,它不需要使用者具备算法经验。

百度大脑推新组合拳:连发13通用AI新能力、6项新升级、2个新福利

在今日的活动中,百度不仅带来了EasyDL通用版的升级,还发布了商品检测专业版。

1、通用版升级:支持多人标注,升级离线SDK服务

物体检测需要实时在线标注,而数据标注通常任务量大,需要多人协同完成,而且数据标注人员和模型开发人员往往不是同一个账号。

针对这一问题,EasyDL物体检测模型全新支持多人标注,大幅提升标注效率。

另外,刘倩强调,不管多高效的工具,采集设备的一致性、数据的一致性、使用场景的一致性都很重要。如果训练和测试使用的设备、数据类型不一致,那么训练出优秀的模型是不现实的。

对此,EasyDL通用版将离线SDK服务全面升级,提供更高精度算法、更全平台支持以及灵活的授权方式。

百度大脑推新组合拳:连发13通用AI新能力、6项新升级、2个新福利

2、商品检测专业版:高效处理,完备配套工具

据悉,EasyDL一个重要场景是商品检测,超过10%的用户在EasyDL通用平台上,训练零售场景的商品检测识别模型。

线下商品数数字化是新零售转型的首要环节,而用AI技术实现商品检测与识别时商品数字化的有效手段。

商品检测在EasyDL通用版会遇到商品种类繁多、放置方位不确定、拍摄角度和光线不同、目标商品与非目标商品混杂、难以一次拍摄货架全景等问题,致使存在大量样本数据、复杂数据标注和模型适应性差等难点。

为了解决零售行业存在的这些难题,EasyDL全新推出商品检测专业版,在通用版的基础上,结合了行业洞察的数据、算法、工具、预制技能等一系列服务,实现更高效的AI模型生产。

百度大脑推新组合拳:连发13通用AI新能力、6项新升级、2个新福利

EasyDL商品检测专业版能极大降低数据采集和标注成本,主要特性包括:

(1)预置海量SKU商品图库

平台提供600个常见SKU多角度单品图片数据,覆盖饮品、日用品、调味品和零食四大品类,即将扩展至2000个。

(2)自动图像合成

自动图像合成可高效生成大规模样本,丰富货架场景,使得模型适应性增强(尺度、倾斜、遮挡、光照)。

(3)SKU图像采集箱

SKU图像采集箱用于快速获取新增单品SKU多角度图像,这一特性即将推出。

在算法层面,EasyDL商品检测专业版提供贴合场景的算法和配套工具,同样包含3类:

(1)专项算法调优,包括基于大规模商品预训练、面向零售场景优化、面向超大分类优化等。

(2)场景化模型选择,4种商品预测场景被预置,包括普通货架/货柜、自助结算台、无人零售货柜和地堆商品,供用户根据实际业务需求灵活选择。

(3)货架拼接SDK,该特性也即将发布,用于解决实际应用中无法一次拍摄货架全景的问题,模型自动实现拼接、排重和商品检测计数。

百度大脑推新组合拳:连发13通用AI新能力、6项新升级、2个新福利

当前,EasyDL商品检测专业版已经在线上开放。

二、语音开放能力:新福利、新产品、新平台

在语音开放能力方面,今日百度大脑不仅带来了一项福利,推出2款新产品和1个新平台和,还提前预告了将在5月发布的新品。

1、发福利:限时极速版增额服务

第一个福利是百度的语音识别服务,输入一段小于60秒的音频,即可输出文字结果。

在6月前,百度将向每个用户免费额外赠送5万次调用量,如果用户进行实名认证,再送20万次调用量,如果开通付费并产生1次付费调用,将再加送50万次调用量。

也就是说,每个用户最高可获得近80万次的免费调用量。

百度大脑推新组合拳:连发13通用AI新能力、6项新升级、2个新福利

2、新产品:远场语音开发套件

紧接着,百度展示了一组新产品——远场语音开发套件RK3308,三款麦克风阵列规格适用于多种业务场景,包括音箱、机器人、平面型家电、PAD、车载设备等。

百度大脑推新组合拳:连发13通用AI新能力、6项新升级、2个新福利

一套开发套件价格为1299元,已经上线AI市场。

3、新平台:语音自训练平台

通用语音识别模型在垂直场景表现参差不齐,针对性优化训练成本高、耗时长。

对此,百度推出语音自训练平台,零代码自主训练语言模型,帮助业务场景获得更高效地获得更好的识别效果,应用场景有语音助手、语音输入、智能客服等。

基于百度多业务积累的基础模型,语音自训练平台拥有四大核心优势:

(1)简单:全流程零代码自主完成,上传文本即可训练,训练前后准确率对比评估科学直观。

(2)灵活:支持词汇、长文本等多种训练方式。

(3)有效:业务用语识别有效提升5%-15%准确率。

(4)可靠:模型专属使用,稳定性高。

百度大脑推新组合拳:连发13通用AI新能力、6项新升级、2个新福利

4、新产品:语音合成离线SDK

为了满足无望或弱网环境下的APP、机器人、硬件设备播报需求,提供稳定、一致的合成体验,百度推出语音合成离线SDK。

该产品首先发布安卓版本,iOS版本也将马上推出。其音库支持4个发音人,并在持续增加中。其授权方式支持按设备授权、产品线授权。

5、5月新品预告

百度还提前预告了将在5月发布的新品,包括语音合成5个新音库和呼叫中心语音解决方案。

百度大脑推新组合拳:连发13通用AI新能力、6项新升级、2个新福利

呼叫中心语音解决方案则是转为呼叫中心业务场景提供语音能力,包括呼叫中心专属语音识别模型、专属合成发音人,应用场景有电话销售、智能外呼、客服质检等业务。

三、视觉方向:新福利、新能力、新升级

视觉方向是本日百度大脑公布新能力和新升级最多的一个方向,共有6项新能力发布和4款能力升级。

1、发福利!人体分析服务免费调用额度升级

百度大脑视觉方向首先公布的好消息也是发福利,包括人体关键点识别、人体检测与属性、人流量统计、人像分割、手势识别在内的人体分析服务免费调用额度升级:

从1天免费500次,升级为1天免费50000次,超额部分200元/月/QPS起,这个价格在业界还是很有竞争力的。

企业认证后,还可以享受5 QPS不限调用量。

2、6个新能力

除了发布福利,百度大脑还带来了视觉方向的6个新能力:

(1)人脸融合:对两张人脸进行融合处理,生成同时具备2长人脸外貌特征的人脸图像。

(2)车辆属性识别:识别图像中的小汽车、卡车、巴士、摩托车、三轮车、自行车,可识别小汽车的11种属性。

(3)车辆外观损伤识别:针对常见小汽车车型,可识别数十种车辆部件、五大类外观损伤。

(4)钱币识别:支持数百类币种、数千种面额,识别准确率98%以上。

(5)黑白图像上色:将黑白图像上色成彩色图像。

(6)拉伸图像恢复:自动识别过渡拉伸的图像,将其恢复成正常比例。

百度大脑推新组合拳:连发13通用AI新能力、6项新升级、2个新福利

3、4款新升级

另外,百度大脑对4款能力进行升级,包括OCR文字识别、红酒识别、人像分割。

其中,OCR文字识别支持最新营业执照的识别,增殖税发票识别平均相应时长降至原来的1/3,四要素识别准确率高达99.9%,支持发票全部31个字段。

红酒升级整合红酒信息服务应用“酒咔嚓”的专业数据,识别结果增加产区、糖分、葡萄品种、品尝温度等更丰富的信息。

人像分割的精度也得到大大提升,模型IoU从93.6%提升到96.5%。

四、语言和知识:新升级、新优化、新平台

百度大脑在语言和知识方向宣布的第一款升级为情感倾向分析支持定制训练。

百度大脑推新组合拳:连发13通用AI新能力、6项新升级、2个新福利

如图所示,通用型情感倾向分析在任何场景或应用得出的情感倾向都是一样的,而定制化分析则可以在餐饮服务种判断偏正向,在手机配件中判断偏负向。

另外,百度大脑带来自然语言处理3个支持定制优化的能力:定制情感分析、定制词法分析、定制评论观点抽取。

百度大脑推新组合拳:连发13通用AI新能力、6项新升级、2个新福利

针对自动写作和辅助写作的需求,百度大脑推出新平台——智能写作平台。

自动写作应用包括智能写诗、智能春联以及视频、图文转换的多模写作。

辅助写作的应用主要有观点抽取、情感分析、关键词热度趋势、关联分析等,帮助用户在创作前辅助选题、激发灵感,还可以帮助推荐创作素材和丰富内容,以及进行成文后的有文本纠错、质量检查等任务。

百度大脑推新组合拳:连发13通用AI新能力、6项新升级、2个新福利

结语:慎重对待开放能力,加速技术商业落地

百度大脑已全面开放了底层技术、开源深度学习框架、通用AI能力、定制AI能力平台、硬件开放平台、AI市场等多层次的百度大脑作为国内全面性和领先性都属于业界翘楚的AI开放平台,正在为越来越多的开发者带来更为简单易用的AI开发体验。

百度大脑推新组合拳:连发13通用AI新能力、6项新升级、2个新福利

据刘倩介绍,目前百度大脑很多能力免费开放,超额部分收费。百度大脑对开放能力非常慎重,小规模邀请测试是免费的,目的是验证真实场景可用性;大范围应用推广的窗口期也是免费;得到大面积验证后,再考虑商用收费。

如今,我国在海量数据和大规模市场应用方面拥有明显优势,AI技术的商业化落地进程也正在快马加鞭。早早嗅到AI技术商业变现机遇的百度,已经编织出一张超级AI巨网,面向越来越多的行业和场景提供持续升级的智能化服务,助推产业变革。