前百度高管接手AWS大中华区;英伟达取消以色列AI峰会;华为剧透小艺语音转写功能丨AIGC大事日报

1、谷歌前高管出任微软生成式AI副总裁

2、英伟达宣布取消原定下周的以色列AI峰会

3、百度前副总裁出任亚马逊云科技大中华区负责人

4、百度文心大模型4.0或将10月17日发布

5、传百度文心大模型4.0:万卡训练史上最大参数

6、美图发布自研AI视觉大模型3.0

7、中国移动本周将发布行业大模型

8、华为终端BG CTO李小龙剧透小艺语音转写功能

9、视觉中国与华为云签署视觉大模型合作协议

10、贾佳亚团队开源70B长文本大模型LongAlpaca

11、华人团队提出交错视觉语言生成模型MiniGPT-5

12、OpenAI CEO:套壳ChatGPT不是长久之计

1、谷歌前高管出任微软生成式AI副总裁

近日,谷歌前副总裁阿帕娜·切纳普拉加达(Aparna Chennapragada)于其领英主页宣布加入微软,将担任副总裁,领导Microsoft 365和Microsoft Designer的生成式AI工作。其领英主页显示,阿帕娜是谷歌的资深员工,曾在谷歌任职近13年,主导AR和视觉搜索产品。据The Information报道,在谷歌任职期间,她作为关键技术顾问与谷歌CEO桑达尔·皮查伊(Sundar Pichai)有着密切合作。

2、英伟达宣布取消原定下周的以色列AI峰会

英伟达近日于官网发布公告,宣布考虑到以色列目前的局势,原定于10月15日-16日的以色列AI峰会取消。此前,英伟达于9月29日预告了此次峰会。据多家媒体报道,10月7日,巴勒斯坦哈马斯武装组织对以色列发动了大规模武装突袭行动。

3、百度前副总裁出任亚马逊云科技大中华区负责人

据亚马逊云科技微信公众号发文,今天,亚马逊云科技全球销售、市场和服务高级副总裁Matt Garman对内宣布了大中华区领导人变更。张文翊在成功担任亚马逊全球副总裁、亚马逊云科技大中华区执行董事四年后调任,储瑞松将接任这一职位。据介绍,储瑞松在企业软件、IT咨询、云计算和人工智能方面拥有30年的经验,加入亚马逊云科技之前,他曾担任百度集团副总裁,是百度高层管理团队之一,负责领导百度阿波罗智能汽车业务。

4、百度文心大模型4.0或将10月17日发布

《科创板日报》8日讯,据悉,百度正在加紧训练文心大模型4.0,或将在10月17日百度世界大会上发布。据消息人士透露,文心大模型4.0的进展比预期快很多,将是基础模型的大升级,理解、生成、逻辑、记忆四大核心能力都将提升,尤其在逻辑推理、代码和数学等方面提升最明显。

5、传百度文心大模型4.0:万卡训练史上最大参数

据IT之家报道,此前遭爆料正在加紧训练的文心大模型4.0实际上已经在小流量测试,其参数量大于所有已公开发布参数的LLM(大语言模型),预计突破万亿级别;推理成本相比文心3.5增加很多,据传大概是8-10倍。爆料人称,文心大模型4.0仍然是一个单一模型,并没有采用GPT和很多其他LLM使用的混合专家模型(MoE)。此外,消息称文心4.0是在万卡AI集群上训练出来的,或是国内首次使用万卡规模集群进行训练的大语言模型。据悉,国内目前只有华为、阿里透露已建成万卡AI集群,但都没有发布基于此的具体模型。

6、美图发布自研AI视觉大模型3.0

据美图微信公众号发文,10月9日,美图公司举办15周年生日会并发布自研AI视觉大模型MiracleVision(奇想智能)3.0版本,用户可以访问AI视觉创作工具“WHEE”官网体验。据介绍,MiracleVision 3.0将全面应用于美图旗下影像与设计产品,并将助力电商、广告、游戏、动漫、影视五大行业。

美图公司创始人、董事长兼首席执行官吴欣鸿在会上谈道,视觉大模型应用普及将经历三个阶段:2024年之前为探索期,2024-2025年为高速发展期,2026-2030年为成熟期,随着视觉大模型在生产端的应用走向成熟,视觉大模型将助力千万设计场景,引领美学升级与社会经济增长。

此外,美图还公布了6月19日发布的影像生产力工具最新数据:AI视觉创作工具“WHEE”的优质AI效果生成数超过550万张;AI口播视频工具“开拍”月活跃用户数突破35万;桌面端AI视频编辑工具“WinkStudio”累计服务近10万名视频创作者;主打AI商业设计的“美图设计室”助力近百万中小电商卖家降本增效;美图AI助手“RoboNeo”每天帮助近万名用户自动修图,比传统修图效率提升35%。

体验地址:https://www.whee.com/

7、中国移动本周将发布行业大模型

据中国移动微信公众号发文,10月11日至13日,第11届中国移动全球合作伙伴大会将在广州保利世贸博览馆举办。据介绍,中国移动届时将与合作伙伴联合推出5G-A、RedCap、空天地一体、行业大模型、AI超算中心、智算等端到端解决方案,以及全景化展现数智技术与现代工业、农业、政务、生活等领域相结合的最新成果。官方还提到,本次大会线上平台采用沉浸式互动技术,以5G+算力+超高清+VR+MR等数字化手段打造超写实元宇宙“中心广场”“三大主题展馆”及两翼“元上论坛”“元上交易”空间。

8、华为终端BG CTO李小龙剧透小艺语音转写功能

10月8日,华为终端BG CTO李小龙发微博剧透小艺通话及语音转写功能,称新功能很好用。有网友询问该功能是否可以模仿机主声音,李小龙回应称用户可以自己录制开场语。

9、视觉中国与华为云签署视觉大模型合作协议

据视觉中国微信公众号发文,近日,视觉中国与华为云正式签署关于视觉大模型的合作协议。双方将以华为云盘古大模型为基础打造视觉大模型,共同实现视觉领域高度智能化发展,推进更深层次的内容产业智能转型。

10、贾佳亚团队开源70B长文本大模型LongAlpaca

近期,香港中文大学贾佳亚团队联合MIT发布长文本开源大语言模型LongAlpaca,包括7B、13B、70B三个参数规模版本。据介绍,在该团队自研的大语言模型文本长度拓展方案LongLoRA加持下,LongAlpaca只需两行代码、一台8卡A100机器,便可将7B模型的文本长度拓展到100k Tokens,70B模型的文本长度拓展到32k Tokens。据悉,贾佳亚系香港中文大学终身教授,原腾讯杰出科学家,前腾讯优图实验室联合负责人,2020年离职创办AI公司思谋科技。

论文地址:

https://browse.arxiv.org/pdf/2309.12307.pdf

GitHub项目地址:

https://github.com/dvlab-research/LongLoRA

11、华人团队提出交错视觉语言生成模型MiniGPT-5

据机器之心报道,10月3日,加州大学圣克鲁兹分校的华人团队提出了MiniGPT-5,这是一种以”生成式Voken“概念为基础的创新型交错视觉语言生成技术。 据介绍,通过特殊的视觉Token”生成式Voken“,MiniGPT-5将Stable Diffusion机制与LLM(大型语言模型)相结合,为熟练的多模态生成预示了一种新模式。除了原有的多模态理解和文本生成能力外,MiniGPT5还能提供合理、连贯的多模态输出。

论文地址:

https://browse.arxiv.org/pdf/2310.02239v1.pdf

项目地址:

https://github.com/eric-ai-lab/MiniGPT-5

12、OpenAI CEO:套壳ChatGPT不是长久之计

据量子位报道,在9月22日-24日举行的YC Alumni Reunion 2023校友会上,OpenAI CEO奥特曼发表演讲,提出一些创业建议。据网友总结,其观点大致可以分为三点:一是简单包装OpenAI的公司活不长久,二是看好AI医学顾问、AI个性化一对一辅导等方向,三是盲目筹资非常不明智。此外,消息称奥特曼在演讲中剧透了下一代大模型的方向,称GPT-5和GPT-6将具备多模态输出能力,相比现有的GPT可靠性更高、个性化定制体验更好。