北京获准的大模型占全国近半;OpenAI CEO筹建AI芯片公司;零一万物多模态语言模型上线丨AIGC大事日报

1、北京获准开放的生成式AI大模型产品占全国近半

2、零一万物Yi-VL多模态语言模型上线

3、猎户星空大模型发布

4、OpenAI CEO谋划建立AI芯片合资公司

5、OpenAI封禁美国政客机器人的开发者账号

6、AI创企Cohere寻求最高10亿美元融资

7、曝DeepMind科学家大模型创业 融资2亿欧元

8、AI在谷歌2024新年目标中居于首位

9、Meta新研究让Llama 2自我迭代赶超GPT-4

10、中科院华为推出视觉模型VMamba

11、新壹视频大模型通过备案

12、马斯克否认xAI已获得5亿美元新融资

13、英国包裹公司在对话机器人失控后禁用AI

14、84%受访游戏开发者为AIGC感到担忧

1、北京获准开放的生成式AI大模型产品占全国近半

据北京日报报道,在1月21日北京市第十六届人民代表大会第二次会议在北京会议中心开幕上,市长殷勇作政府工作报告。报告指出,北京市巩固提升高精尖产业发展优势,出台通用人工智能、人形机器人等30余项细分产业支持政策……获准向公众开放的生成式人工智能(生成式AI)大模型产品占全国近一半,“京通”“京办”“京智”三个智慧城市应用终端快速升级拓展,高级别自动驾驶示范区实现160平方公里连片运行,全国首个数据基础制度先行区启动建设,数字经济增加值占地区生产总值比重达42.9%。

2、零一万物Yi-VL多模态语言模型上线

今日,零一万物Yi系列模型家族迎来新成员,Yi Vision Language(Yi-VL)多模态语言大模型面向全球开源。Yi-VL模型基于Yi语言模型开发,包括Yi-VL-34B和Yi-VL-6B两个版本。据悉,在全新多模态基准测试MMMU中,Yi-VL-34B以41.6%的准确率,成功超越了一系列多模态大模型,仅次于GPT-4V(55.7%),具有较强的跨学科知识理解和应用能力。

Hugging Face地址:

https://huggingface.co/01-ai

ModelScope 地址:

https://www.modelscope.cn/organization/01ai

3、猎户星空大模型发布

1月21日,猎豹移动董事长兼CEO、猎户星空董事长傅盛宣布猎户星空大模型发布。据称,猎户星空大模型通过140亿参数实现了千亿参数大模型才能实现的效果,面向素质教育等七大应用领域进行微调,且可以在千元显卡算力上运行。

4、OpenAI CEO谋划建立AI芯片合资公司

据外媒The Information报道,OpenAI首席执行官萨姆·阿尔特曼(Sam Altman)计划建立一个全球工厂网络来布局半导体。阿尔特曼已与多家公司进行了交谈,包括总部位于阿布扎比的G42和日本软银集团公司,为该项目筹集数十亿美元资金。阿尔特曼自去年以来一直在与半导体行业高管探讨,希望通过新芯片设计降低大型语言模型成本。据直接了解此事的人士透露,虽然OpenAI将使用这些芯片,但阿尔特曼称,这些合资公司布局与OpenAI是分开的。OpenAI没有立即回应置评请求。

5、OpenAI封禁美国政客机器人的开发者账号

据路透社报道,1月20日,OpenAI封禁了民主党总统候选人国会议员迪恩·菲利普斯( Dean Phillips)的机器人的开发者,这是OpenAI第一次针对GPT被滥用采取行动。OpenAI发言人在给路透社的一份声明中表示:“我们最近删除了一个开发者帐户,该帐户故意违反我们的API使用政策,该政策禁止政治竞选或未经同意冒充个人。”AI初创企业德尔福(Delphi)在创建了数字版的迪恩之后,已经无法使用OpenAI的平台。

6、AI创企Cohere寻求最高10亿美元融资

据外媒报道,加拿大AI大模型创企Cohere近日正在洽谈新一轮融资,融资额在5亿至10亿美元之间,或使其获得高于去年的22亿美元的估值。Cohere由谷歌前科学家艾丹·戈麦斯(Aidan Gomez)等人创立于2019年,曾获得英伟达、甲骨文以及以及Index Ventures和Inovia Capital等风投公司的投资。Cohere于2023年9月开启其检索增强生成(RAG)版聊天API公测,由Cohere的旗舰生成式AI大语言模型Command提供支持。

7、曝DeepMind科学家大模型创业 融资2亿欧元

据彭博社报道,谷歌DeepMind的两位科学家近期一直在与投资者讨论在巴黎组建一家AI初创公司的事宜。一直在DeepMind担任科学家的洛朗·西弗雷 (Laurent Sifre)正在与同事卡尔·图尔斯 (Karl Tuyls) 就组建这家公司(目前名为 Holistic)进行谈判,该合资企业可能专注于构建新的AI模型。知情人士称,该团队已与潜在投资者就可能超过2亿欧元(约合15.7亿元人民币)的融资进行了讨论。

8、AI在谷歌2024新年目标中居于首位

据外媒The Decoder报道,谷歌最近在内部宣布了其2024年的公司目标,AI位居榜首:“提供世界上最先进、最安全、最负责任的人工智能”。其他目标包括:提高知识、学习能力、创造力和生产力;创建有用的个人电脑平台和设备;使企业和开发人员能够在谷歌云上进行创新;提供全球最值得信赖的产品和平台;为员工和世界打造一个“非凡”的谷歌;提高公司的速度、效率和生产力,并实现持久的成本节约。

9、Meta新研究让Llama 2自我迭代赶超GPT-4

1月18日,Meta和纽约大学研究团队发布一项新成果——自我奖励语言模型,支持大模型在自己生成自己的微调数据,从而实现自我迭代。基于该方法的三次迭代上微调Llama 2-70B产生的模型优于AlpacaEval 2.0排行榜上的许多现有系统,包括Claude 2、Gemini Pro和GPT-4。为了实现超人智能体(Agents),传统的方法通常根据人类的偏好来训练奖励模型,这可能会受到人类表现水平的限制;其次,这些单独的冻结奖励模型无法在LLM训练中学习改进。因此团队研究了自我奖励语言模型,其中语言模型本身通过LLM-as-a-Judge提示在训练期间提供自己的奖励。结果表明,在迭代DPO训练过程中,它们不仅指令遵循能力得到了提高,而且对自身提供高质量奖励的能力也得到了提高。

论文地址:

https://arxiv.org/pdf/2401.10020.pdf

10、中科院华为推出视觉模型VMamba

1月18日,来自中国科学院、华为、鹏城实验室的研究人员推出一个新的视觉模型VMamba(Visual State Space Model,视觉状态空间模型)。CNN(卷积神经网络)和ViTs(视觉Transformer)是视觉领域当下最主流的两种基础模型,但这两种模型的计算复杂度都较高。通过对全局接受域和动态权重的结合,ViTs实现了卓越的视觉建模性能。这一观察结果促使团队提出一种新的架构VMamba,该架构继承了这些组件,同时提高了计算效率。大量的实验结果证实,VMamba不仅在各种视觉感知任务中表现出提升,而且随着图像分辨率的增加,它比现有基准显示出更明显的优势。VMamba-S在ImageNet-1K上达到83.5%的正确率,比Vim-S高3.2%,比Swin-S高 0.5%。

论文地址:

https://arxiv.org/pdf/2401.10166.pdf

GitHub地址:

https://github.com/MzeroMiko/VMamba

11、新壹视频大模型通过备案

根据新壹科技公众号公告,1月18日,新壹科技推出的聚焦视频领域生成式AI(大语言模型)新壹视频大模型通过了《生成式人工智能服务管理暂行办法》备案,全面向社会开放服务。新壹视频大模型发布于2023年7月27日,现已具备从视频脚本生成、素材匹配原生AI视频生成、声音克隆、智能剪辑到数字人播报的全流程AI视频生产能力。

体验地址:

https://aigc.yizhentv.com/

12、马斯克否认xAI已获得5亿美元新融资

据路透社报道,马斯克于1月19日否认其AI公司xAI已获得5亿美元融资。此前有知情人士曝料,xAI正在寻求150亿至200亿美元的估值,已经从投资者那里获得了5亿美元的投资承诺,目标是10亿美元,预计将在未来几周内敲定条款。去年12月6日,根据一份提交给美国证券交易委员会的文件,xAI正在寻求筹集至多10亿美元的股权投资。

13、英国包裹公司在对话机器人失控后禁用AI

据路透社报道,英国一家包裹递送公司1月20日关闭了其在线聊天系统中的AI功能,因为一名用户哄骗该系统写了一首诗来描述该公司的客户服务有多糟糕。“DPD是浪费时间,也是客户最糟糕的噩梦……有一天,DPD终于被关闭了,每个人都欢欣鼓舞。他们终于可以从一个知道什么的真人那里得到他们需要的帮助了。”一位用户于上周四在社交媒体X上分享了该机器人的失控对话。而后,这家公司在英国独立电视台报道的一份声明中表示:“AI元素立即被禁用,目前正在更新。”

14、84%受访游戏开发者为AIGC感到担忧

据外媒The Verge报道,美国游戏开发者大会 (GDC) 的组织者近日发布了年度游戏行业状况调查,3000多名受访者中,84%的人表示他们在一定程度上非常担心使用生成式AI的道德问题。调查结果详细阐述了开发者担忧的原因,理由包括AI有可能取代工人、加剧裁员或使开发者面临可能的版权侵权投诉。开发者还担心AI程序可能会在未经他们同意的情况下从他们自己的游戏中窃取数据。