1、OpenAI前开发者关系主管加入谷歌

2、OpenAI发布首支Sora制作的MV

3、DALL-E 3灰度测试局部重绘功能

4、Microsoft 365用户将优先使用GPT-4 Turbo

5、Anthropic发现大模型长文本漏洞

6、开源版AI程序员SWE-agent发布

7、出门问问通过港交所聆讯

8、元象首个MoE大模型开源

9、2024年全国数据工作明确八项重点任务

10、网信办生成式AI服务备案信息3月新增23家

11、2024年Top100 AI公司报告发布

12、亚马逊为创企提供AI大模型免费积分

13、雅虎收购Ins联创成立的AI新闻平台Artifact

14、创企Hailo发布边缘侧生成式AI芯片Hailo-10

15、Stability AI前CEO称不喜欢这份工作

16、谷歌新论文:潜在扩散模型并非越大越好

17、腾讯开源视频生成工具MuseV

1、OpenAI前开发者关系主管加入谷歌

今日,OpenAI前开发者关系主管Logan Kilpatrick在其社交平台X宣布,将加入谷歌领导AI Studio的产品并支持Gemini API,“将把谷歌打造为开发人员构建AI的最佳家园”。他在OpenAI任职一年半时间,并于3月1日宣布离职。

2、OpenAI发布首支Sora制作的MV

今日,OpenAI发布了首支由Sora生成的MV,其中音乐由由艺术家August Kamp制作,画面是该艺术家使用Sora辅助完成。August Kamp评价道:“这就是我认为Sora这个工具的特别之处。我可以与大家分享曾经被我独自锁在脑海中的画面。这首歌在我心中一直都是这个样子,只是现在我可以展示给大家看了。”

3、DALL-E 3灰度测试局部重绘功能

今日,据社交平台X博主@歸藏发文,OpenAI已开始灰度测试DALL-E 3的局部重绘功能,用户可点击生成的图片进入编辑页面,用画笔涂抹想要修改的区域,并在右侧对话框输入想要修改的内容即可生成。

4、Microsoft 365用户将优先使用GPT-4 Turbo

今日,微软宣布向云生产力平台Copilot for Microsoft 365用户提供两项重要更新:优先访问GPT-4 Turbo模型、取消对话数量和长度的限制同时增加文件上传。此外,本月晚些时候微软将向Copilot for Microsoft 365用户提供Microsoft Designer中扩展的图像生成功能,包括高峰时段的优先访问。

5、Anthropic发现大模型长文本漏洞

今日,大模型创企Anthropic发布论文,提出一种“越狱”技术,可以用来躲避大型语言模型开发人员设置的安全护栏,对Claude 2、GPT-3.5、GPT-4、Llama 2和Mistral 7B等多个主流模型都有效。该方法利用长上下文窗口,攻击者输入一个以数百个虚假对话为开头的提示,提示中包含有害的请求,就能使大模型产生潜在有害的反应。

论文地址:

https://cdn.sanity.io/files/4zrzovbb/website/af5633c94ed2beb282f6a53c595eb437e8e7b630.pdf

6、开源版AI程序员SWE-agent发布

昨日,普林斯顿团队开源发布了Agent打造的AI程序员SWE-agent,它能让GPT-4等大模型轻松编辑和运行代码,在SWE-bench测试集上获得与首个AI程序员Devin相似的准确度,平均耗时93秒。

项目主页:

https://swe-agent.com/

开源地址:

https://github.com/princeton-nlp/SWE-agent

7、出门问问通过港交所聆讯

昨日,生成式AI创企出门问问正式通过港交所聆讯,并披露聆讯后资料集,即将于主板挂牌上市。招股书显示,本次IPO募资净额将用于持续提高建模技术,以进行模型训练,通过在未来数年引进世界领先的技术和人才,对底层基础模型进行垂直优化,并改进解决方案的现有程序算法;用于解决方案开发及营销;将分配至用于寻求战略联盟、投资及收购,以实施解决方案发展的长期增长策略等。

聆讯后资料集:

https://www1.hkexnews.hk/app/sehk/2023/105965/documents/sehk24040204425_c.pdf

8、元象首个MoE大模型开源

今日,据元象XVERSE微信公众号发文,元象发布XVERSE-MoE-A4.2B大模型 ,采用业界最前沿的混合专家模型架构,激活参数4.2B,效果即可达到13B模型水准。据介绍,XVERSE-MoE-A4.2B实现了极致压缩,相比XVERSE-13B-2仅用30%计算量,并减少50%训练时间。在多个权威评测中,元象MoE效果大幅超越Gemma-7B、Mistral-7B、Llama2-13B等开源模型,并接近超大模型Llama1-65B。该模型全开源,无条件免费商用。

ModelScope魔搭开源地址:

https://modelscope.cn/models/xverse/XVERSE-MoE-A4.2B

9、2024年全国数据工作明确八项重点任务

据国家数据局微信公众号昨日发文,首次全国数据工作会议于4月1日到2日在北京召开,会上明确了八项重点任务:健全数据基础制度、提升数据资源开发利用水平、以数字化赋能高质量发展、促进数据科技创新发展、优化数据基础设施布局、强化数据安全保障能力、提升数据领域国际合作水平、发挥试点试验的引领作用。

10、网信办生成式AI服务备案信息3月新增23家

昨日,中国网信网于官网发布关于生成式AI服务已备案信息的公告。网信部门会同相关部门按照《生成式人工智能服务管理暂行办法》要求,有序开展生成式AI服务备案工作,已备案信息将定期更新。根据最新文件,3月共有23个大模型通过备案。

11、2024年Top100 AI公司报告发布

昨日,技术市场情报平台CB Insights发布了2024年Top100的AI公司报告,关注来自16个国家/地区从事大模型、AI基础设施等最有前途的100家公司。据介绍,评选标准包括交易活动、行业合作伙伴关系、团队实力、投资者实力、专利活动等,还分析了CB Insights对软件买家的采访,并深入研究了初创公司提交的分析师简报。根据融资金额来看,OpenAI、Anthropic、Databricks占据前三;根据估值与员工人数的比值来看,Sakana AI、Mistral AI、Anthropic和OpenAI位列前四。

完整报告地址:

https://www.cbinsights.com/learn/ai-100-2024

12、亚马逊为创企提供AI大模型免费积分

据路透社昨日报道,亚马逊云科技(AWS)在采访中称,公司已扩大针对初创公司的免费积分计划,以降低使用主要AI模型的成本,提高其AI平台Bedrock的市场份额。为了吸引创企客户,亚马逊现在允许其云积分覆盖其他提供商的模型的使用,包括Anthropic、Meta、Mistral AI和Cohere。

13、雅虎收购Ins联创成立的AI新闻平台Artifact

雅虎昨日宣布,已于3月29日完成对AI新闻平台Artifact的收购。Artifact将不再作为独立APP运行,其AI驱动的个性化技术及其他功能将在未来几个月内集成到雅虎新闻等。Artifact由社交平台Instagram联合创始人Kevin Systrom和Mike Krieger于2023年1月创立,主要业务是提供AI驱动的个性化新闻推荐。今年1月,Artifact宣布关停服务。

14、创企Hailo发布边缘侧生成式AI芯片Hailo-10

今日,以色列芯片制造商Hailo宣布扩大C轮融资,获得1.2亿美元的追加资金。同时,Hailo宣布推出高性能边缘侧生成式AI芯片Hailo-10,使用户可以在本地拥有和运行生成式AI应用程序,而无需采用云服务。据介绍,在主流生成式AI平台上,Hailo-10可以在低于5W的功率下以每秒高10个Token的速度运行Llama2-7B;在运行文生图模型Stable Diffusion 2.1时,Hailo-10在相同的低功耗范围内每张图像的额定生成速度不到5秒。

15、Stability AI前CEO称不喜欢这份工作

据《商业内幕》昨日报道,于3月辞职的Stability AI前CEO埃马德·莫斯塔克(Emad Mostaque)在采访中谈道,担任CEO并不是一件有趣的事,直言自己一直不喜欢这份工作。他引用了马斯克对CEO职责的评价,“创办一家公司就像凝视深渊并吃玻璃”。莫斯塔克称,自己特别擅长帮助创意人员、开发人员和研究人员发挥设计系统的潜力,但不会处理人力资源、运营和业务发展事务,还谈到自己担任CEO期间患有阿斯伯格症和多动症。

16、谷歌新论文:潜在扩散模型并非越大越好

来自谷歌、霍普金斯大学的团队昨日在arXiv上发表论文,研究了潜在扩散模型(LDM)的扩展特性,重点是其采样效率。通过对已建立的文本到图像扩散模型进行实证分析,作者对模型大小如何影响不同采样步骤的采样效率进行了深入研究。研究结果显示,在给定推理预算的情况下,较小的模型在生成高质量结果方面经常优于较大的模型。

论文地址:

https://arxiv.org/pdf/2404.01367.pdf

17、腾讯开源视频生成工具MuseV

3月27日,来自腾讯的团队在GitHub上开源了一个基于扩散的虚拟人视频生成框架MuseV,能够生成基于视觉条件并行去噪的无限长度和高保真虚拟人类视频。该方法技术论文暂未发布,直接开源了训练好的模型和部署运行的代码,主页显示训练代码也即将推出。

项目主页:

https://github.com/TMElyralab/MuseV