书生·浦语2.0大模型开源;比亚迪发布璇玑AI大模型;阿里发布3D角色视频替换框架丨AIGC大事日报

1、上海AI实验室等开源书生·浦语2.0大模型

2、阿里发布3D角色视频替换框架Motionshop

3、阿里云自研云原生数据库PolarDB发布新版本

4、比亚迪发布璇玑AI大模型

5、百度与山东港口将合作试点大模型港口应用

6、马斯克寻求特斯拉25%投票权

7、Stability AI发布30亿参数代码模型

8、AI创企Sakana获3000万美元种子轮融资

9、谷歌利用股票薪酬池留住顶级AI研究员

10、OpenAI CEO称并不需要《纽约时报》的训练数据

11、OpenAI CEO称未来AI发展需要能源突破

12、传OpenAI董事会曾邀请竞争对手CEO加入

13、微软CEO称对OpenAI治理结构没有异议

14、沃达丰与微软就AI技术签署15亿美元协议

15、Salesforce CEO称AI公司应为版权材料付费

16、Adobe Premiere Pro引入新的AI音频编辑功能

1、上海AI实验室等开源书生·浦语2.0大模型

据上海AI实验室微信公众号发文,今日,上海AI实验室与商汤科技联合香港中文大学和复旦大学正式发布新一代大语言模型书⽣·浦语2.0(InternLM2)。InternLM2是在2.6万亿token的高质量语料上训练得到的,沿袭第一代书生·浦语(InternLM)的设定,包含7B及20B两种参数规格及基座、对话等版本,提供免费商用授权。书生·浦源大模型挑战赛同日启动,首期赛事包含行业应用和创新创意两个赛道,即日起面向全球进行场景和赛队征集。

开源地址:

github.com/InternLM/InternLM

huggingface.co/internlm

modelscope.cn/organization/Shanghai_AI_Laboratory

2、阿里发布3D角色视频替换框架Motionshop

1月16日,阿里通义实验室发布了用3D角色替换视频中角色的框架Motionshop。框架由两部分组成,一是用于提取修复背景视频序列的视频处理管道,二是用于生成3D角色视频序列的姿势估计和渲染管道。通过并行两条管线并使用高性能光线追踪渲染器TIDE ,整个过程可以在几分钟内完成。用户可在魔搭社区试用Demo,上传不超过15秒的人物视频、选择替换人物、选择要替换的虚拟角色模型,等待10分钟左右即可生成。

项目主页:

aigc3d.github.io/motionshop

Demo试用:

modelscope.cn/studios/Damo_XR_Lab/motionshop/summary

3、阿里云自研云原生数据库PolarDB发布新版本

今日,阿里云自研云原生数据库PolarDB发布“三层分离”新版本。据介绍,这是业内首个支持三层分离形态的云原生数据库 ,可帮助用户节省50%的数据库成本;同时接入大语言模型,大幅提升数据库智能决策水平,IO依赖查询性能提升10倍。此外,阿里云推出数据库场景体验馆、训练营等系列新举措,开发者可率先免费体验PolarDB核心特性及NL2BI等AI新功能。

4、比亚迪发布璇玑AI大模型

据比亚迪汽车微信公众号发文,1月16日,比亚迪发布了双循环多模态AI——璇玑AI大模型,首次将AI应用到车辆全领域。璇玑AI大模型覆盖了整车三百多个场景,璇玑架构作为行业首个智电融合的智能化架构,让汽车拥有了智能化的“大脑”和“神经网络”,使其可以像高级智慧生命体一样全面感知、集中思考、精准控制和协同执行。

5、百度与山东港口将合作试点大模型港口应用

据百度智能云微信公众号发文,1月16日,山东省港口集团与百度举行大模型研发合作启动仪式,双方将联合探索大模型港口应用场景,推动大模型试点应用。百度与山东省港口集团将基于百度智能云千帆大模型平台,在港口日常管理、经营分析、生产运行、智慧办公、物流服务等领域共同开展大模型港口实践,并实现共同推广应用。

6、马斯克寻求特斯拉25%投票权

1月16日,特斯拉CEO埃隆·马斯克(Elon Musk)在一条讨论他的特斯拉股权的社交平台X帖子下评论,称如果没有约25%的投票控制权,他很难将特斯拉发展成为AI和机器人领域的领导者,除非拥有足够大的影响力,否则“我宁愿在特斯拉之外制造产品”。

7、Stability AI发布30亿参数代码模型

今日,Stability AI发布30亿参数代码模型Stable Code 3B,这是此前发布的Stable Code Alpha 3B模型的后续版本,专为代码补全设计。据介绍,Stable Code 3B性能与Meta的Code Llama 7B相匹配,但体积缩小了60%,它的基座模型在4万亿token的自然语言数据上训练得到,并在此基础上进一步训练。Stable Code 3B适用于多种语言,支持中间填充功能(FIM)和扩展上下文大小等功能,可在PC端实时运行。

模型地址:

huggingface.co/stabilityai/stable-code-3b

8、AI创企Sakana获3000万美元种子轮融资

AI创企Sakana今日宣布完成3000万美元(约合人民币2.16亿元)的种子轮融资,估值约为2亿美元(约合人民币14.39亿元)。此轮融资由Lux Capital领投,Khosla Ventures、索尼集团、谷歌AI和研究部门负责人、Scale AI CEO、HuggingFace CEO等跟投。Sakana于2023年由两位行业研究人员戴维·哈(David Ha)和利昂·琼斯(Llion Jones)创立,他们此前都曾在谷歌从事AI相关系统的工作,后者是Transformer论文八名作者之一。这家初创公司的方法可能会使得人工智能的训练和使用成本比现有技术更便宜。Sakana目前有约10名员工,主要业务是开发基于软件的工具,用于构建小型AI模型,并制作一些概念验证模型。

9、谷歌利用股票薪酬池留住顶级AI研究员

据The Information今日报道,尽管谷歌进行了一轮大规模裁员,但它仍在利用一个特殊的股票薪酬池来留住其顶级AI研究人员,因为竞争对手OpenAI以数百万美元的薪酬方案吸引他们。据直接了解此事的人士透露,谷歌DeepMind部门是其最重要举措的核心,该部门的顶级研究人员已获得每人价值数百万美元的大量限制性股票。目前尚不清楚DeepMind如何挑选符合条件的研究人员,但参与该计划的人可以获得在一年内归属的股票授予期,而其他员工的授予期为四年。如果OpenAI继续提高员工薪酬,谷歌在AI研究部门(拥有约2000名员工)的支出可能会大幅增加。据统计,自10月份以来,OpenAI已聘用了至少六名谷歌Gemini模型的贡献者。

10、OpenAI CEO称并不需要《纽约时报》的训练数据

据彭博社报道,OpenAI CEO萨姆·阿尔特曼(Sam Altman)在当地时间周二的达沃斯世界经济论坛上称:“有些人认为,你需要我所有的训练数据,我的训练数据非常有价值。事实上,情况一般并非如此。例如,我们并不想在《纽约时报》的数据上进行训练。”在《纽约时报》上个月起诉OpenAI及其最大的投资者微软,指控其侵犯版权造成数十亿美元的损失之后,OpenAI正在大力争取新闻内容的访问权。据彭博社上周援引知情人士消息报道,OpenAI正在与CNN、福克斯公司和《时代》杂志等出版商就新闻内容授权进行谈判。

11、OpenAI CEO称未来AI发展需要能源突破

据路透社报道,OpenAI CEO阿尔特曼在当地时间周二的达沃斯世界经济论坛上称,未来AI的耗电量将大大超出人们的预期,因此必须在能源方面取得突破。阿尔特曼说,更多气候友好型能源,特别是核聚变或更便宜的太阳能和储能,是AI的发展方向,“这促使我们加大对核聚变的投资”。

12、传OpenAI董事会曾邀请竞争对手CEO加入

据The Information今日报道,知情人士透露,上个月,OpenAI董事会董事亚当·达安杰洛(Adam D’Angelo)曾致电大数据公司Databricks的CEO阿里·高吉(Ali Ghodsi),询问他是否考虑加入OpenAI董事会。Databricks的主要业务是帮助公司开发AI应用程序,高吉将公司定位为OpenAI的准竞争对手,曾公开建议主要客户开发他们自己的AI模型或定制开源模型,而不是依赖OpenAI的闭源模型。

13、微软CEO称对OpenAI治理结构没有异议

据彭博社报道,微软CEO萨提亚·纳德拉(Satya Nadella)于当地时间周二称,他对合作伙伴OpenAI的治理结构没有意见。而在两个月前,OpenAI的非营利性董事会不顾投资者利益,临时解雇了其CEO。

14、沃达丰与微软就AI技术签署15亿美元协议

据路透社报道,跨国移动电话运营商沃达丰近日与微软达成了为期10年的合作伙伴关系,将投资15亿美元(约合人民币108亿元),用于利用微软Azure OpenAI和Copilot技术开发以客户为中心的AI,并将用可扩展的Azure云服务取代物理数据中心。

15、Salesforce CEO称AI公司应为版权材料付费

据彭博社报道,Salesforce CEO马克·贝尼奥夫(Marc Benioff)在当地时间周二的达沃斯世界经济论坛上称,AI公司通过窃取知识产权来构建自己的技术,“没有人真正确切地知道这些数据的合理价格是多少,但AI公司应该标准化支付,以公平对待内容创作者。”

16、Adobe Premiere Pro引入新的AI音频编辑功能

今日,Adobe旗下线性编辑软件Premiere Pro引入新的AI音频编辑功能,包括交互式淡入淡出手柄,使用户能够通过直接在主编辑时间轴上拖动自定义音频过渡来快速创建自定义音频过渡;AI驱动的音频类别标记,可自动识别剪辑并将其标记为对话、音乐、音效或环境噪音等。增强语音测试版功能也将在未来几周内向所有Premiere Pro用户开放。