Github引入AI:不但能自动打标签,未来还要增强交互能力

智东西(公众号:zhidxcom)
编 | 花弧

导语:全球最大开发者社区GitHub在Universe开发者大会上公布史上最重大更新,还透露了GitHub中的AI应用。

智东西10月18日消息,GitHub在16日至17日的GitHub Universe开发者大会上发布热门开源项目及热门语言等的年度报告,同时还发布自动化流程工具GitHub Actions这一史上最大更新,更在接受外媒Venturebeat采访时讲述了GitHub平台的AI化。

成立自2008年的GitHub是全球最大的开发者社区,允许开发者存储并同世界各地的同行分享代码,目前拥有9600 万个项目,截止今年9月30日全球有3100多万开发人员在使用。今年 6 月,微软还以 75 亿美元的价格收购了 GitHub,预计在年底完成收购。

2018年的GitHub Universe开发者大会上,GitHub在年度报告之外,还发布发布史上最大更新:最新发布的GitHub Actions搭载AI可以让所有人直接运行部分代码。

这款新工具Actions将使开发者不仅可以在GitHub上存储代码,还能运行代码。

大会期间外媒Venturebeat对GitHub资深数据科学家Omoju Miller进行了采访,讨论这个全球最大的开发者社区如何利用机器学习来创建更多由AI驱动的应用,相关应用将为开发者提供更多便利。

Github引入AI:不但能自动打标签,未来还要增强交互能力

▲Omoju Miller

以下为访谈内容:

V(Venturebeat):Experiments项目完全聚焦于人工智能吗,还是包括GitHub内部进行的所有实验性探索呢?

M(Miller):现阶段,该项目是GitHub内部最专注人工智能的。我们第一个原型产品是语义代码搜索,现阶段还有其他的产品在开发中,我们还没有决定下一步推出什么。这些产品正如刚刚已经发布的语义代码搜索一样,发布就可应用,并且将会是一个系列,一年内推出两到四个。

V:GitHub是一个独特的社区,对开发者工具和开发者的需求都有很好的了解。你希望GitHub生产出来的人工智能产品能够为开发者提供什么?什么是只有GitHub才能提供的独特服务?

M:因为我们有很多开源代码,所以基于这些资源我们更能知道如何帮助开发者更高效地编程。我们可以做的另一件事就是让开发者更好地使用彼此的代码。

现在我们写的很多东西都是英文的,所以你看到的文档都是英文的,但开发者来自世界各地ーー我们80%的用户都来自美国以外的国家。如果我们可以使用人工智能来帮助翻译一些文档,那么访问各种代码就会变得更容易,比如我在使用Python代码的时候,把相关粤语文档翻译成英文的,我就能更好的用Python代码。

V:可以多谈一些语义搜索吗?

M:我们的语义搜索在experiments.github.com上完全开源,它是一个将自然语言转化为代码的Sequence-to-Sequence模型,但它基本上是将自然语言映射到代码的嵌入空间。

V:关于人工智能将如何应用于GitHub的愿景,你还能告诉我什么?

M:我们希望把这些AI功能带到GitHub平台上,因为AI能优化代码、问题、需求、项目等多个层面的交互。在未来,开发者只需要问“你能帮我找到和这段代码相似的代码吗?”,以及发出“帮我在这种编程语言里找到这段代码”的命令,AI就能执行。

V:我联想到其他地方推出的一些AI服务,比如Gmail能猜测你想说什么并主动提供邮件内容。Github在编程上会推出类似的预测服务吗?

M:在句子到句子的层次上,是这样。对于一些重复率较高的工作,AI就能理解你的动机。当你开始输入后续内容时,你只需点击特定tab,就会有后续内容自动出现,你就可以根据需要填充。

V:今天人工智能是如何应用于GitHub的?GitHub上的开发者可以获得什么样的服务?

M:我们去年发布了一个发现功能,这是一个推荐引擎,基于你的关注数据和浏览数据适时为你推荐有趣的存储库和项目。AI最主要的应用之一就是打标签,所以GitHub也会自动提供标签建议,这样开发者就可以更容易地把存储库标记为数据科学、机器学习、Ruby或其他的主题。

另一个AI应用是提供安全漏洞警告,机器学习能发现Python、Ruby等编程语言中存在的漏洞,但这个应用目前还未推出,现阶段只是原型供内部试用。

原文来自:Venturebeat