AI挑战赛赛况正酣:北京气象局首度公布3年数据集,AI给叶子看病当“医生”

智东西(公众号:zhidxcom)
文 | 心缘

智东西11月1日消息,由创新工场、搜狗、美团、美图联合举办的AI Challenger 2018全球AI挑战赛已经启动了两个月有余。其中,天气预报竞赛和农作物病害检测竞赛都是今年首次启动的新赛道。

昨日,智东西来到创新工场,同少数媒体一起,和中国气象局北京城市气象研究所副所长陈敏、创新工场人工智能工程院执行院长王咏刚、新客科技创始人刘新农分别聊了聊AI如何影响气象预测和农作物病害防治。

一、首次公开北京3年气象数据集,率先发起农作物病害检测竞赛

AI Challenger全球挑战赛是面向AI开发者的开源数据集合编程竞赛平台,在今年8月29日正式启动。目前大赛已吸引来自81个国家、1000家大学和公司的AI开发者参与。

今年的AI Challenger 2018除了设置观点型问题阅读理解等5个主赛道外,还有天气预报竞赛等4个实验赛道以及十多个来自不同领域的全新数据集。尽管目前数据集仅供参赛者使用,创新工场人工智能工程院执行院长王咏刚表示,在大赛结束后,这些数据集会在某个时间点上开放给没有参加比赛的人。

从赛道来主题来看,本届大赛牢牢抓住“用AI挑战真实世界的问题”这一核心,无论是天气预报竞赛还是农作物病害检测,都与人们的日常生活关系密切。两个赛道的最终加权总成绩的前三名将分别获得5万、1万、2500元奖金和获奖证书。

1、天气预报赛道

为了用AI提高天气预报准确性,天气预报赛道邀请参赛者基于“观测”和“睿图”数据集来进行模型训练与测试。这是北京气象局第一次公开发布气象数据集,包含气象要素的实况和预报两部分。

其数据集由北京市近3年的逐小时历史“观测”(OBS)和“睿图”(RMAPS)数据组成。“观测”集有9个地面气象要素,通过气象仪器实时监测得到;“睿图”集包含地面和特征气压层等29个气象要素,由数值预报模式在超级计算机上运算产生。前者仅记录当前气象要素实况;后者可预测未来36小时内气象要素估计值,但存在误差。

本次竞赛的预报量分别是2-m温度(t2m)、2-m相对湿度(rh2m)和10-m风速(w10m),通过气象常用天气预报质量评价标准(RMSE,BIAS)来计算参赛者提交的预报值准确度,并结合答辩表现,加权计算总成绩。

2、农作物病害检测赛道

我国是农业大国,农业病害防治不仅影响农业生产,对国家经济而言也是至关重要。

而近年来飞速发展的图像识别技术恰恰可以作为准确识别农业病害并提供合适防治措施的有效工具。对此,AI Challenger 2018联合新客科技发起世界上首个农作物病害检测竞赛。

本次竞赛提供农作物叶子图像的数据集,对病害类别、植物品种以及病害程度进行了专业的标注。其标注图片共47637张,包含苹果、樱桃等10个物种,27种病害,和61个按照“物种-病害-程度”划分的病害分类。

二、用AI预测天气,突破传统气象分析思维

从古至今,天气都是人们日常最关注的话题之一。我们赖以生存的大气环境瞬息万变,科学认识大气环境带来的物理变化规律,不仅有助于准确预测天气变化,还帮助人类提前预警自然灾害,保障生命与财产安全。

中国气象局北京城市气象研究所副所长陈敏认为,传统气象+AI有望创造“1+1>2”的创新趋势。

AI挑战赛赛况正酣:北京气象局首度公布3年数据集,AI给叶子看病当“医生”

▲中国气象局北京城市气象研究所副所长陈敏

1、现代数值天气预报无法达到无限准确的目标

现代天气预报的基石是数值预报,它将大气的演变规律近似表示为一组数学方程式,从有限观察中获得当前大气的初始状态,借助高性能计算机用数值方法近似求解。

目前华北地区使用睿图数值预报体系,其中的睿图-ST短期数值预报子系统即是本次AI Challenger天气预报竞赛中各参赛选手的PK目标。

AI挑战赛赛况正酣:北京气象局首度公布3年数据集,AI给叶子看病当“医生”

尽管数值预报已经全面普及,现在的天气预测仍存在一定偏差,这是因为人类对大气变化过程的认知仍然有局限性,混沌现象也导致计算预报还远达不到无限准确的目标。

另外,全球气象观测网的空间密度有限,难以精确捕捉冰雹、龙卷风、强雷暴等短历时、高影响的灾害天气。

2、AI技术可根据不完全信息进行推断

AI技术的发展给天气预测里带来了更广阔的空间。其实AI技术早在上世纪80年代中期就开始应用于气象领域,但真正应用到日常的天气预报非常少。

对于海量气象观测和计算数据,机器可以通过搭建天气智能系统用视觉对象来进行预测,学习并掌握局部或大规模的天气系统演变规律,比如目前已有基于雷达图像识别的短临预报的相关尝试。

AI技术还可以根据逻辑模糊或者不完全不确定信息进行推断,能利用统计和数值模式中无法直接描述的抽象预报知识,学习数值天气预报的缺陷和误差原因,进而提升预报水平。这也是本次天气预报竞赛的实践目标。

3、AI在气象领域的大规模应用道阻且长

前文虽然列数了AI的优势,但言易行难,目前AI还无法做到大规模应用到真实的天气预报中。创新工场人工智能工程院执行院长王咏刚认为,用AI做天气预报有如下几个难题。

AI挑战赛赛况正酣:北京气象局首度公布3年数据集,AI给叶子看病当“医生”

▲创新工场人工智能工程院执行院长王咏刚

其一,AI现在做的比较成功的任务,是因为在这些任务上AI研发人员已经应用了一套包括数据、工具、流程、评测标准的完整机制。但如果让AI工程师做气象预测,AI工程师既找不到稳定运行多年的数据集,也拿不到客观的评价标准,基本从零开始探索这片领域。

其二,天气预报涉及的数据维度和数据因子远多于此前图像、语音、文本等比较成功的AI应用领域,很难确定影响到天气预报结论的干扰因子究竟有多少。

其三,天气预报专家和AI工程师互相缺乏对方的知识领域,在人才储备上存在知识跨界的需求。

陈敏随后补充道,AI算法的普适性也是一个难题,比如在天津训练好的天气模型,拿到冬天下大雪的东北未必还能适用。AI算法需经过实际天气预报业务中各种场景和极端天气的考验,才能真正大规模地推广和应用。

三、智能识别病害,让AI做“植物医生”

正如俗语所言“民以食为天”,农业一直是我国的第一产业。就在去年,我国农作物病害受灾面积高达1亿亩左右,对农业生产总值造成近8%的直接损失。

新客科技创始人刘新农表示,之所以出现这样的状态,是因为现在的农业病虫害防治是等到病虫害发生了才去治,而在幼虫阶段就开始防治,效果会更好。

AI挑战赛赛况正酣:北京气象局首度公布3年数据集,AI给叶子看病当“医生”

▲上海新客科技创始人刘新农

1、农业病害防治需要智能化升级

刘新农谈到做AI农作物病害防治竞赛主要基于四个原因。

首先,目前我国农业在智能化方面的普及程度还很低,科技对我国农业的改造程度偏弱,农民作为中国最大的群体,并没有很好享受到科技带来的价值。

其次,为了防治病虫害,很多农民在生产过程中大量使用农药,农药残留超标的农产品不仅会严重影响食用者的健康。

第三,从环保角度来说,农药会对土地造成污染,还会影响整个水系。

最后,当前的农业技术人员普遍识别能力有限,而AI应用有助于提升病害识别的准确度。

如果AI能为农民提供更好的防治工具,培养农民对新兴科技产生信任,这些问题就会迎刃而解。

要让AI在解决农业病虫害中发挥实际作用呢,刘新农认为,除了亟待建设公开的病虫害数据图集,发展机器学习与图像识别系统,还需要在农民群体中普及智能手机。

2、建设病害数据集,打造手机上的“植物医生”

本次发起农作物病害检测竞赛的新客科技针对上述痛点,通过专有人员拍摄、定点摄像、和专业第三方机构合作以及公开收集等渠道,采集了小麦、玉米、苹果等20余种常见农作物病害图像,每种病害照片数量均超过万张。

新客科技在今年4月成立,其创始人刘新农在农业领域有十多年的经验,曾任联想控股农业事业部顾问,还曾创建国内豆粕行业最大的电商交易平台“富农商贸通”。新科科技已与西北农林科技大学、郑州省农科院果树研究所等专业院校合作,进行农作物病害分类。

该公司推出了可拍照识别农作物病害的微信公众号。农户在微信公众号上传叶子图片后,就能通过AI技术计算分析,获得病害类型、发病程度以及防治方法等信息。该应用现在已在河南开封和驻马店等地推广。

AI挑战赛赛况正酣:北京气象局首度公布3年数据集,AI给叶子看病当“医生”

王咏刚表示,从比赛到现在,参加农业病虫害检测比赛的队伍数已超过1000多支队伍,远多于其他比赛,这些队伍也取得了不错的成绩。

刘新农也介绍道,目前大赛最高准确率接近90%,而传统的识别病害方法正确率仅有大约60%。不过,他告诉智东西,早期AI只能作为一个辅助的工具,随着AI应用的普及推广带来更多数据反馈,准确率会更高。

结语:AI还有更多落地场景,开放数据集是第一步

无论是天气预测还是农作物病虫害检测,都与人们的实际生活需求密切相关。尽管这两个传统行业的智能化升级才刚刚起步,我们已经可以预见AI将通过赋能这些行业给我们生活带来的便利。

发展AI的终极目标是改善人类生活,而数据是决定一个AI模型的优劣的重要因素。各行各业有着多年积累的产业数据,开放更多高质量的海量数据集,对于AI技术的快速发展和促进传统行业智能化升级而言,都是必行之径。