1、谷歌DeepMind数学几何AI模型登Nature

2、谷歌推出画圈搜索及生成式AI多重搜索功能

3、三星发布Galaxy S24系列手机,搭载谷歌Gemini

4、OpenAI CEO首次公开回顾“宫斗”

5、OpenAI CEO称首要任务是推出下一代模型

6、OpenAI CEO称AGI对世界的影响没那么大

7、亚马逊App测试AI问答功能

8、小米申请注册大模型商标

9、智源FlagEval大模型评测榜单1月榜发布

10、工信部发布AI产业建设指南草案

11、上海:以AI等技术为支撑实施教育数字化转型

12、广东省政务服务和数据管理局挂牌成立

13、RWKV母公司元始智能获种子轮融资

14、苹果发布自回归视觉模型AIM

15、新型注意力机制Lightning Attention-2发布

1、谷歌DeepMind数学几何AI模型登Nature

今日,谷歌DeepMind宣布推出AI数学模型AlphaGeometry,能够以接近人类金牌得主的水平解决奥林匹克几何问题,相关论文也于今日登上国际顶刊《自然》(Nature)。为了训练模型,研究团队生成了1亿个合成定理及其解决方案,涵盖各种复杂程度的问题,AlphaGeometry完全基于这些数据进行了从头训练。在针对30道奥数几何题的基准测试中,AlphaGeometry在规定的奥数解题时间内成功解决了25道题。相比之下,此前最先进的机器系统仅解决了其中10道题,而人类金牌得主的平均解题数量为25.9道。

论文地址:nature.com/articles/s41586-023-06747-5

2、谷歌推出画圈搜索及生成式AI多重搜索功能

当地时间1月17日,谷歌推出两项新的搜索功能:画圈搜索(Circle to Search)和AI驱动的多重搜索(Multisearch)。画圈搜索可以使用户无需切换应用程序,使用画圈、涂鸦、点击等简单的交互方式获取更多信息。AI驱动的多重搜索允许用户在上传照片或屏幕截图时,不仅获得视觉匹配结果,还能获得AI提供的智能见解,如用户可以上传一个棋盘游戏的照片,并追问这是什么游戏、该怎么玩等。

3、三星发布Galaxy S24系列手机,搭载谷歌Gemini

据The Verge报道,三星今日推出Galaxy S24系列手机,引入“Galaxy AI”功能。Galaxy AI大部分新功能都由谷歌Gemini大模型提供支持,包括视频和照片编辑工具、实时语音翻译等。据悉,这是Gemini Pro首次部署在Vertex AI上供客户使用,用于笔记、语音录音和键盘的摘要;手机使用Imagen 2对照片进行生成式编辑,以及Gemini Ultra用于复杂任务,Gemini Nano作为设备上的小型语言模型。三星美国及澳大利亚官方新闻稿角注中提到,Galaxy AI功能将在受支持的三星Galaxy设备上免费提供,直到2025年底。

4、OpenAI CEO首次公开回顾“宫斗”

据CNBC昨日报道,OpenAI CEO萨姆·阿尔特曼(Sam Altman)在达沃斯世界经济论坛上公开回顾被开除一事,称自己被董事会赶下台的那天晚上,他感到“非常困惑”并且“非常措手不及”,但很快就接受了事实,开始考虑寻找新东家或者思考下一步创业的方向,“直到第二天早上董事会的一些成员给我打电话,我才真正考虑回来的事情。”当被问及OpenAI是否会改革其结构并成为一家传统的硅谷营利性公司时,阿尔特曼称OpenAI永远不会成为一家传统公司,但可能会重新考虑公司结构,不过现在首要关注的是董事会。

5、OpenAI CEO称首要任务是推出下一代模型

据The Information今日报道,OpenAI CEO萨姆·阿尔特曼(Sam Altman)在达沃斯世界经济论坛上透露,他目前的首要任务是推出公司的下一代大型语言模型,也许会被称为GPT-5。他说,OpenAI未来的大模型版本或许会基于个体用户的价值观和居住国家的程度定制,这可能会让人们感到“不舒服”。

6、OpenAI CEO称AGI对世界的影响没那么大

据CNBC昨日报道,OpenAI CEO萨姆·阿尔特曼(Sam Altman)在达沃斯世界经济论坛上谈道,AGI(通用人工智能)可能会在“相当近的未来”得到开发,但它对世界、工作的改变比人们想象中小得多。阿尔特曼称,AI尚未以许多经济学家担心的那样大规模取代工作岗位,并补充说该技术已经逐渐成为一种“非常强大的生产力工具”。

7、亚马逊App测试AI问答功能

据The Verge今日报道,亚马逊正在其iOS和安卓移动应用程序中测试一项新的AI功能,该功能可以让客户询问有关产品的具体问题,如帮助准确计算出新架子的尺寸、确定电池的使用寿命,甚至写一首关于雪地靴的圣诞颂歌。亚马逊发言人透露该功能仍在测试中,它不能进行与产品无关的对话或回答问题。

8、小米申请注册大模型商标

据企查查信息显示,小米近日申请注册科学仪器类“ChatMI”商标、运输工具类“小米大模型”商标,当前商标状态均为等待实质审查。其中“ChatMI”商标商品/服务包括模拟对话用聊天机器人软件、与语音传输设备连用的个人耳机、辅助人类和供人娱乐用具有交流和学习功能的类人机器人、智能音箱、科学研究用具有AI的人形机器人等。“小米大模型”商标商品/服务包括汽车、电动汽车、电动运载工具、摄影无人机等。

9、智源FlagEval大模型评测榜单1月榜发布

据智源研究院微信公众号发文,今日,FlagEval大语言模型测评榜单1月榜发布,本期新增近期开源的Mistral(MoE模型)、BlueLM、MindSource、SUS-chat-34B、DeepSeek等模型的评测结果,并使用平行测验增强主观评测可靠性。评测显示,Mixtral-8x7B系列模型英文能力远优于中文能力,其基座模型英文能力接近Aquila2-34B;vivo发布的BlueLM系列模型中英文能力较为均衡,整体评测结果在10B以下模型中位于中上游。

详细测评结果:flageval.baai.ac.cn

10、工信部发布AI产业建设指南草案

昨日,工业和信息化部科技司公开征求对《国家人工智能产业综合标准化体系建设指南》(征求意见稿)的意见,公示时间为2024年1月17日至2024年1月31日。指南提出到2026年,共性关键技术和应用开发类计划项目形成标准成果的比例达到60%以上,新制定国家标准和行业标准50项以上,开展标准宣贯和实施推广的企业超过1000家,参与制定国际标准20项以上。

《国家人工智能产业综合标准化体系建设指南》(征求意见稿)原文地址:

miit.gov.cn/cms_files/filemanager/1226211233/attach/202311/7240bd43f3fc4b598351f9b135e68e4a.pdf

11、上海:以AI等技术为支撑实施教育数字化转型

昨日,上海市人民政府办公厅发布印发《关于进一步深化学习型城市建设的意见》的通知,提出加快数字化转型,以AI、大数据、移动互联网等技术应用为支撑,深入实施教育数字化转型战略行动,探索形成“互联网+”终身教育新模式,推动实现优质教育资源公平普惠可及。

《关于进一步深化学习型城市建设的意见》原文地址:

shanghai.gov.cn/cmsres/27/27a1f3797038418f99ad6fba42c282c2/6790a836b40042b87410379568f04ebe.pdf

12、广东省政务服务和数据管理局挂牌成立

据广东政数微信公众号发文,今天上午,根据广东省机构改革工作部署,广东省政务服务和数据管理局正式挂牌成立。

13、RWKV母公司元始智能获种子轮融资

据AI科技评论报道,开源大模型RWKV背后的公司元始智能,已于1月16日完成种子轮融资,由奇绩创坛和某匿名投资者投资,目前元始智能已开始继续融第二轮。RWKV是国产开源的首个非Transformer架构的大语言模型,目前已经迭代到第六代RWKV-6。据悉,RWKV-5的15亿和30亿参数版本已发布,且70亿参数版本会在今年1月发布,而RWKV-6的15亿和30亿参数版本将在今年2月发布,然后将继续训练70亿和140亿参数版本。

RWKV体验地址:rwkv.com

14、苹果发布自回归视觉模型AIM

来自苹果的团队昨日在arXiv上发表论文,提出一组使用自回归生成目标进行预训练的视觉模型AIM,展示了图像特征的自回归预训练具有与文本对应物(即大型语言模型)类似的缩放属性。具体来说,该论文主要有两个发现:模型容量可以轻松地扩展到数十亿个参数;AIM有效地利用了大量未经筛选的图像数据集。

论文地址:

arxiv.org/pdf/2401.08541

项目地址:

github.com/apple/ml-aim

15、新型注意力机制Lightning Attention-2发布

OpenNLPLab团队于1月16日在arXiv上发表论文,提出并开源了Lightning Attention-2,这是一种能够实现线性注意力的理论计算优势的线性注意力实现。为了实现这一点,团队利用了Tiling思想,分别处理线性注意力计算中的内部块和间隔块组件。无论输入序列长度如何,Lightning Attention-2都保持一致的训练和推断速度,并且比其他注意力机制快得多。

论文地址:

arxiv.org/pdf/2401.04658.pdf

开源地址:

github.com/OpenNLPLab/lightning-attention