前百度高管接手AWS大中华区；英伟达取消以色列AI峰会；华为剧透小艺语音转写功能丨AIGC大事日报

1、谷歌前高管出任微软生成式AI副总裁

2、英伟达宣布取消原定下周的以色列AI峰会

3、百度前副总裁出任亚马逊云科技大中华区负责人

4、百度文心大模型4.0或将10月17日发布

5、传百度文心大模型4.0：万卡训练史上最大参数

6、美图发布自研AI视觉大模型3.0

7、中国移动本周将发布行业大模型

8、华为终端BG CTO李小龙剧透小艺语音转写功能

9、视觉中国与华为云签署视觉大模型合作协议

10、贾佳亚团队开源70B长文本大模型LongAlpaca

11、华人团队提出交错视觉语言生成模型MiniGPT-5

12、OpenAI CEO：套壳ChatGPT不是长久之计

1、谷歌前高管出任微软生成式AI副总裁

近日，谷歌前副总裁阿帕娜·切纳普拉加达（Aparna Chennapragada）于其领英主页宣布加入微软，将担任副总裁，领导Microsoft 365和Microsoft Designer的生成式AI工作。其领英主页显示，阿帕娜是谷歌的资深员工，曾在谷歌任职近13年，主导AR和视觉搜索产品。据The Information报道，在谷歌任职期间，她作为关键技术顾问与谷歌CEO桑达尔·皮查伊（Sundar Pichai）有着密切合作。

2、英伟达宣布取消原定下周的以色列AI峰会

英伟达近日于官网发布公告，宣布考虑到以色列目前的局势，原定于10月15日-16日的以色列AI峰会取消。此前，英伟达于9月29日预告了此次峰会。据多家媒体报道，10月7日，巴勒斯坦哈马斯武装组织对以色列发动了大规模武装突袭行动。

3、百度前副总裁出任亚马逊云科技大中华区负责人

据亚马逊云科技微信公众号发文，今天，亚马逊云科技全球销售、市场和服务高级副总裁Matt Garman对内宣布了大中华区领导人变更。张文翊在成功担任亚马逊全球副总裁、亚马逊云科技大中华区执行董事四年后调任，储瑞松将接任这一职位。据介绍，储瑞松在企业软件、IT咨询、云计算和人工智能方面拥有30年的经验，加入亚马逊云科技之前，他曾担任百度集团副总裁，是百度高层管理团队之一，负责领导百度阿波罗智能汽车业务。

4、百度文心大模型4.0或将10月17日发布

《科创板日报》8日讯，据悉，百度正在加紧训练文心大模型4.0，或将在10月17日百度世界大会上发布。据消息人士透露，文心大模型4.0的进展比预期快很多，将是基础模型的大升级，理解、生成、逻辑、记忆四大核心能力都将提升，尤其在逻辑推理、代码和数学等方面提升最明显。

5、传百度文心大模型4.0：万卡训练史上最大参数

据IT之家报道，此前遭爆料正在加紧训练的文心大模型4.0实际上已经在小流量测试，其参数量大于所有已公开发布参数的LLM（大语言模型），预计突破万亿级别；推理成本相比文心3.5增加很多，据传大概是8-10倍。爆料人称，文心大模型4.0仍然是一个单一模型，并没有采用GPT和很多其他LLM使用的混合专家模型（MoE）。此外，消息称文心4.0是在万卡AI集群上训练出来的，或是国内首次使用万卡规模集群进行训练的大语言模型。据悉，国内目前只有华为、阿里透露已建成万卡AI集群，但都没有发布基于此的具体模型。

6、美图发布自研AI视觉大模型3.0

据美图微信公众号发文，10月9日，美图公司举办15周年生日会并发布自研AI视觉大模型MiracleVision（奇想智能）3.0版本，用户可以访问AI视觉创作工具“WHEE”官网体验。据介绍，MiracleVision 3.0将全面应用于美图旗下影像与设计产品，并将助力电商、广告、游戏、动漫、影视五大行业。

美图公司创始人、董事长兼首席执行官吴欣鸿在会上谈道，视觉大模型应用普及将经历三个阶段：2024年之前为探索期，2024-2025年为高速发展期，2026-2030年为成熟期，随着视觉大模型在生产端的应用走向成熟，视觉大模型将助力千万设计场景，引领美学升级与社会经济增长。

此外，美图还公布了6月19日发布的影像生产力工具最新数据：AI视觉创作工具“WHEE”的优质AI效果生成数超过550万张；AI口播视频工具“开拍”月活跃用户数突破35万；桌面端AI视频编辑工具“WinkStudio”累计服务近10万名视频创作者；主打AI商业设计的“美图设计室”助力近百万中小电商卖家降本增效；美图AI助手“RoboNeo”每天帮助近万名用户自动修图，比传统修图效率提升35%。

体验地址：https://www.whee.com/

7、中国移动本周将发布行业大模型

据中国移动微信公众号发文，10月11日至13日，第11届中国移动全球合作伙伴大会将在广州保利世贸博览馆举办。据介绍，中国移动届时将与合作伙伴联合推出5G-A、RedCap、空天地一体、行业大模型、AI超算中心、智算等端到端解决方案，以及全景化展现数智技术与现代工业、农业、政务、生活等领域相结合的最新成果。官方还提到，本次大会线上平台采用沉浸式互动技术，以5G+算力+超高清+VR+MR等数字化手段打造超写实元宇宙“中心广场”“三大主题展馆”及两翼“元上论坛”“元上交易”空间。

8、华为终端BG CTO李小龙剧透小艺语音转写功能

10月8日，华为终端BG CTO李小龙发微博剧透小艺通话及语音转写功能，称新功能很好用。有网友询问该功能是否可以模仿机主声音，李小龙回应称用户可以自己录制开场语。

9、视觉中国与华为云签署视觉大模型合作协议

据视觉中国微信公众号发文，近日，视觉中国与华为云正式签署关于视觉大模型的合作协议。双方将以华为云盘古大模型为基础打造视觉大模型，共同实现视觉领域高度智能化发展，推进更深层次的内容产业智能转型。

10、贾佳亚团队开源70B长文本大模型LongAlpaca

近期，香港中文大学贾佳亚团队联合MIT发布长文本开源大语言模型LongAlpaca，包括7B、13B、70B三个参数规模版本。据介绍，在该团队自研的大语言模型文本长度拓展方案LongLoRA加持下，LongAlpaca只需两行代码、一台8卡A100机器，便可将7B模型的文本长度拓展到100k Tokens，70B模型的文本长度拓展到32k Tokens。据悉，贾佳亚系香港中文大学终身教授，原腾讯杰出科学家，前腾讯优图实验室联合负责人，2020年离职创办AI公司思谋科技。

论文地址：

https://browse.arxiv.org/pdf/2309.12307.pdf

GitHub项目地址：

https://github.com/dvlab-research/LongLoRA

11、华人团队提出交错视觉语言生成模型MiniGPT-5

据机器之心报道，10月3日，加州大学圣克鲁兹分校的华人团队提出了MiniGPT-5，这是一种以”生成式Voken“概念为基础的创新型交错视觉语言生成技术。据介绍，通过特殊的视觉Token”生成式Voken“，MiniGPT-5将Stable Diffusion机制与LLM（大型语言模型）相结合，为熟练的多模态生成预示了一种新模式。除了原有的多模态理解和文本生成能力外，MiniGPT5还能提供合理、连贯的多模态输出。

论文地址：

https://browse.arxiv.org/pdf/2310.02239v1.pdf

项目地址：

https://github.com/eric-ai-lab/MiniGPT-5

12、OpenAI CEO：套壳ChatGPT不是长久之计

据量子位报道，在9月22日-24日举行的YC Alumni Reunion 2023校友会上，OpenAI CEO奥特曼发表演讲，提出一些创业建议。据网友总结，其观点大致可以分为三点：一是简单包装OpenAI的公司活不长久，二是看好AI医学顾问、AI个性化一对一辅导等方向，三是盲目筹资非常不明智。此外，消息称奥特曼在演讲中剧透了下一代大模型的方向，称GPT-5和GPT-6将具备多模态输出能力，相比现有的GPT可靠性更高、个性化定制体验更好。

相关推荐