阿里被曝领投MiniMax;英伟达跻身全球市值TOP3;OpenAI AGI时间表疑似泄露丨AIGC大事日报

1、“两会”代表委员群策AI大模型落地

2、Anthropic最强模型发布 性能全面超越GPT-4

3、AWS宣布提供Claude 3模型访问

4、“最强文生图大模型”研究论文发布

5、OpenAI谷歌微软Meta联名签署AI公开信

6、ChatGPT新增文本朗读功能

7、3D生成模型TripoSR开源 1秒将单图转3D模型

8、53页PDF曝OpenAI的Q*模型推进时间表

9、Mac专属大模型框架上线

10、英伟达市值超沙特阿美 成全球第三大上市公司

11、潞晨科技开源Sora复现架构方案 降本46%

12、传阿里领投MiniMax新一轮融资

13、联汇科技完成新一轮数亿元战略融资

14、AI创企Baseten获4000万美元B轮融资

15、新旦智能完成千万级别天使轮融资

16、前中关村科金副总裁邓江加入百川智能

17、腾讯云AI系列产品促销 AI绘画19.9元1000次

18、阿里推AI电商工具“绘蛙”

19、华为云盘古大模型通过标准符合性验证

20、汤姆猫:正推进申请接入Sora模型

21、始智AI wisemodel开源社区上线半年成绩单

22、海淀区与清华大学合作共建AI产业高地

23、清华将建设100门AI赋能教学试点课程

24、摩根大通AI辅助现金流模型可减少90%人工工作

25、谷歌创始人现身为Gemini图像生成问题认错

26、OpenAI开发者关系负责人离职

27、AI报税聊天机器人翻车:测试题答错一半

28、AMD对华销售AI芯片遇阻

29、印度限制生成式AI工具发布

1、“两会”代表委员群策AI大模型落地

据北京商报报道,在今年的全国两会上,代表委员们就AI大模型的趋势、应用、监管等话题积极建言献策。提出相关建言的科技产业代表有全国政协委员、中国移动党组书记、董事长杨杰,全国人大代表、小米集团董事长雷军,全国政协委员、360集团创始人周鸿祎,全国人大代表、科大讯飞董事长刘庆峰,全国政协委员、天娱数科副总经理贺晗,全国政协委员、知乎创始人兼CEO周源等。

2、Anthropic最强模型发布 性能全面超越GPT-4

OpenAI的一大劲敌Anthropic昨晚宣布推出Claude 3模型家族,包括Claude 3 Haiku、Sonnet、Opus,都支持超过100万个tokens的输入,并新增多模态功能,支持处理图像、图表等。其中,Opus性能最强,在大多数AI系统的常见评估基准上都优于GPT-4;Sonnet在智能与速度之间达到平衡,特别适合企业工作负载;Haiku模型最快、最具成本效益,能不到3秒读取arXiv(~10k tokens)上带有图表和图形信息和数据密集的研究论文。Opus和Sonnet均已可用,Haiku很快就会发布。

3、AWS宣布提供Claude 3模型访问

亚马逊云科技今日宣布,致力于AI安全和研究的公司Anthropic的Claude 3系列模型将基于Amazon Bedrock提供服务。客户将可以通过Amazon Bedrock访问Claude 3系列的3个支持视觉功能的模型Claude 3 Opus、Sonnet和Haiku。其中Sonnet模型现已在美东(北弗吉尼亚州)和美西(俄勒冈州)区域正式可用,Opus模型和Haiku模型将在未来数周内推出。

4、“最强文生图大模型”研究论文发布

Stability AI今日发布“最强文生图大模型”Stable Diffusion 3的研究论文,对技术细节进行深入描述。这篇论文很快将在arXiv上开放。经评估,Stable Diffusion 3等于或优于当前最先进的文生图系统。多模态扩散Transformer(MMDiT)架构为图像和语言表示使用独立的权重集,与以前版本的Stable Diffusion 3相比,提高了文本理解和拼写能力。

论文地址:https://stabilityai-public-packages.s3.us-west-2.amazonaws.com/Stable+Diffusion+3+Paper.pdf

5、OpenAI谷歌微软Meta联名签署AI公开信

SV Angel昨晚发布一封AI公开信,呼吁“每个人都建立、广泛部署和使用AI来改善人们的生活”。OpenAI、Meta、谷歌、微软、Salesforce、Hugging Face、Mistral AI、Databricks、Scale AI、Character.AI、ElevenLabs等超过200家机构已签名,承诺“致力于建设将为人类更美好的未来做出贡献的AI”,“有共同的责任做出选择,使AI的利益最大化,降低风险”。

6、ChatGPT新增文本朗读功能

OpenAI今日宣布ChatGPT上线“朗读”功能,可将对话文本内容读出声。在iOS或安卓系统上的操作方式是点击并按住消息,然后点击“Read Aloud(大声朗读)”按钮。OpenAI也在网页端滚动,用户可点击消息下方的“Read Aloud”按钮。

7、3D生成模型TripoSR开源 1秒将单图转3D模型

Stability AI今日宣布与国内3D生成模型创企VAST合作开源了一款快速3D物体重建模型TripoSR,能在1秒内从单张图像生成高质量的3D模型。TripoSR在低推理预算下运行,对没有GPU的用户完全可用。当在英伟达A100上测试时,它在大约0.5秒内生成草稿质量的3D输出(纹理网格),优于其他开放的图像转3D模型,如OpenLRM。在MIT许可下,TripoSR模型权重和源代码可下载,允许商业、个人和研究使用。

项目地址:https://github.com/VAST-AI-Research/TripoSR

技术报告:https://stability.ai/s/TripoSR_report.pdf

8、53页PDF曝OpenAI的Q*模型推进时间表

昨日凌晨,社交平台X上一个名为杰克逊(Jackson)的网友发布了一个53页PDF文件,名为《揭示OpenAI计划在2027年前创建AGI》。根据该文件,OpenAI于2022年8月开始训练一个125万亿参数的多模态模型。第一个阶段是Arrakis,也叫Q*。该模型在2023年12月完成了训练,但由于推理成本过高而取消了发布,这是原计划于2025年发布的GPT-5。Gobi(GPT-4.5)被重新命名为GPT-5,因为原来的GPT-5被取消了。Q*的下一阶段最初是GPT-6,但后来更名为GPT-7,最初计划于2026年发布,但因为最近马斯克的诉讼而被搁置。Q* 2025 (GPT-8)计划于2027年发布,实现全面AGI。目前还不知这个透露可靠度有多高,OpenAI未对此进行回应。

文件地址:https://drive.google.com/file/d/1xlRDbMUDE41XPzwStAGyAVEP8qA9Tna7/view

9、Mac专属大模型框架上线

根据社交平台X及GitHub,由一名OpenAI前员工打造的苹果电脑专属大模型框架Chat with MLX近期上线。该框架支持中文、英语、法语等11种语言,可轻松集成任何HuggingFace和MLX兼容的开源模型,只要两行代码就能完成部署,支持苹果电脑跑本地大模型。

GitHub地址:https://github.com/qnguyen3/chat-with-mlx

10、英伟达市值超沙特阿美 成全球第三大上市公司

据彭博社报道,英伟达周一市值超过沙特阿美,成为仅次于苹果和微软的全球第三大上市公司。截至美东时间周一收盘,英伟达总市值为2.13万亿美元。

11、潞晨科技开源Sora复现架构方案 降本46%

潞晨科技昨日宣布其已经开源完整的Sora复现架构方案Open-Sora。据称,这一架构方案还可降低46%复现成本,并将模型训练输入序列长度扩充至819K patches。目前Open-Sora已涵盖:提供完整的Sora复现架构方案,支持动态分辨率,支持多种模型结构,支持多种视频压缩方法,支持多种并行训练优化。

GitHub地址:https://github.com/hpcaitech/Open-Sora

12、传阿里领投MiniMax新一轮融资

据创投日报昨日报道,通用大模型初创项目MiniMax正在进行新一轮大规模融资,阿里为其中的核心领投方。此前不久,另一家大模型创企月之暗面也传出了完成10亿美元规模融资的消息,据称大部分资金来自于阿里。

13、联汇科技完成新一轮数亿元战略融资

联汇科技2月28日宣布已完成新一轮数亿元战略融资,投资方由中国移动产业链发展基金中移和创投资、前海方舟旗下中原前海基金和齐鲁前海基金等多家头部国资与市场化机构组成。联汇科技成立于2003年,聚焦多模态数据分析、 视觉语义理解、预训练大模型、AIGC等AI技术即产业落地,目前已推出iBase向量数据库、欧姆多模态预训练大模型、OmBot自主智能体等产品。本轮融资将用于多模态大模型及自主智能体的技术研发、产品创新及市场拓展,进一步扩大在运营商、能源电力、媒体等大B行业与重点细分市场的领先优势。

14、AI创企Baseten获4000万美元B轮融资

美国AI创企Baseten今日宣布获得4000万美元B轮融资,由IVP和Spark Capital领投,Greylock、Conviction Partners、天使投资人Lachy Groom等参投,估值超过2亿美元。Baseten成立于2019年,主营业务是帮助客户采用经训练的开源或定制AI模型,并将其投入公共应用。

客户可通过在Baseten的云上部署他们的模型,而不必设置后端基础设施。Baseten的软件会根据特定时间内AI模型的流量自动调整公司支付的计算资源数量。如果客户需要GPU,它还可以帮助获得供应稀缺的GPU。

15、新旦智能完成千万级别天使轮融资

据投资界报道,近日,深圳AI初创公司新旦智能完成了千万级别的天使轮融资,由全球化人工智能企业APUS与AI行业资深投资人周弘扬联合投资。新旦智能创立于2023年,由清华、伯克利、腾讯、Meta等学术与工程界精英组成,成立以来新旦智能分别用7B、30B模型在全球公认榜单MT-Bench上登顶TOP1,实现了Score:8.58,仅次于GPT4。

16、前中关村科金副总裁邓江加入百川智能

据《科创板日报》3月4日报道,前中关村科金副总裁邓江加入国内头部大模型创业公司百川智能,作为商业合伙人担任金融事业群总裁职务,负责金融行业解决方案的打造以及合作生态的建立。邓江曾在中国农业银行总行、中信银行总行从事核心业务系统研发、产品设计和团队管理工作。2022年加入中关村科金,任副总裁负责金融行业线的组建,成功交付验收项目近百个。

17、腾讯云AI系列产品促销 AI绘画19.9元1000次

腾讯云昨日宣布推出一系列AI产品促销活动,包括语音识别、语音合成、AI绘画、数智人、人脸核身等多个领域。在首单专区,新用户购买最低0.4折,包括AI绘画服务19.9元1000次,人脸融合14.9元1000次,录音文件识别14.9元60小时等;在特惠专区,所有用户最低1.5折,包括人脸核身全场7折,语音识别全场6折,AI绘画5折起,数智人全场5折等。

18、阿里推AI电商工具“绘蛙”

据Tech星球昨日报道,阿里成立了一支AI电商团队,目前正在打造一款针对商家和达人的AI电商产品“绘蛙”。据悉,绘蛙开发主体为杭州连凡信息技术有限公司,该公司由阿里巴巴(中国)有限公司100%持股。“绘蛙”将为淘宝、天猫商家和达人在生成营销文案、训练专属AI模特等方面提升创作效率,助商品快速被“种草”。

19、华为云盘古大模型通过标准符合性验证

据华为中国官微昨日发文,在由中国信通院组织的可信AI大模型标准符合性验证中,华为云盘古大模型顺利完成金融大模型标准符合性验证,并获得优秀级(4+级)评分,这也是本次金融大模型评测各厂商中的最高等级。华为云盘古大模型成为首批通过金融大模型标准符合性验证的产品,也是首批通过行业大模型标准符合性验证的产品。

20、汤姆猫:正推进申请接入Sora模型

汤姆猫3月3日在互动平台上回答投资者问:“公司正在推进申请接入OpenAI的Sora模型,并计划进行相关的素材制作的测试,目前暂未正式接入Sora。”

21、始智AI wisemodel开源社区上线半年成绩单

始智AI wisemodel.cn开源社区平台昨晚公布自2023年9月4日官宣上线以来的半年成绩单:wisemodel开源的模型数量达到390个,开源数据集的数量达到58个。同时,wisemodel社区正式上线了代码和算力模块,AI领域的开源项目代码也可以在wisemodel社区上同步发布。

wisemodel社区于今年2月19号还发起了开源复现Sora计划,目前已有40余位来自清华、北大、上交、中科院、港科大、东京大学等国内外高校的研究成员以及来自大厂和创业团队的研究成员加入。复现计划团队分为模型组、数据组、评测组和infra组,已经分别在开展相应部分的研究和验证工作。

22、海淀区与清华大学合作共建AI产业高地

3月2日上午,海淀区与清华大学共建人工智能产业高地战略合作签约仪式举行。根据协议,双方将围绕打造人工智能创新平台、开展关键核心技术攻关、推动重大科技成果转化、建设人工智能人才特区、厚植人工智能产业生态等五大方面开展合作,形成新质生产力。

双方协同建设人工智能产业高地,对于学校提升人工智能科技创新与成果转化、服务海淀推动智能产业升级与经济发展、助力北京市加快建设具有全球影响力的人工智能创新策源地具有重要意义。

23、清华将建设100门AI赋能教学试点课程

据清华大学公众号发文,2月29日下午,清华大学举行2024年全校教职工大会暨全校党员集中培训,校长李路明作学校工作报告,着重介绍了学校在AI深度融入教育教学方面的探索与布局,表示学校将建设100门AI赋能教学试点课程,并为每一位2024级新生配备“AI成长助手”。

24、摩根大通AI辅助现金流模型可减少90%人工工作

据彭博社昨日报道,美国最大金融服务机构之一摩根大通集团通过其基于AI的现金流管理工具,帮助其一些企业客户在分类和可视化支付流程方面减少了90%的人工工作,不过管理流动性的决策仍需由人类做出。自大约一年前推出至今,该公司现在有大约2500名客户使用该产品。摩根大通CEO Jamie Dimon称,这项技术最终可以让客户将每周工作时间缩短到3.5天。

25、谷歌创始人现身为Gemini图像生成问题认错

根据社交平台X,谷歌联合创始人谢尔盖·布林(Sergey Brin)周末现身了AI黑客马拉松会场,他承认Gemini的图像生成“一团糟(messed up)”,并称推出前没有做充分的测试。谢尔盖围绕Gemini开发内幕、AGI等话题进行了近40分钟演讲,当被问到对谷歌大模型Gemini绘画此前引发种族偏见问题的看法时,他说“模型中确实有我们还没有完全理解的部分”并进行了道歉。

26、OpenAI开发者关系负责人离职

OpenAI开发者关系负责人洛根·基尔帕特里克(Logan Kilpatrick)当地时间3月1日在社交平台X上发文,宣布他已经离开OpenAI,他刚刚度过了在OpenAI的最后一天。洛根此前领导OpenAI的开发人员关系,支持开发人员使用DALL-E、API和ChatGPT进行开发。在OpenAI之外,他是Julia编程语言的首席开发者社区倡导者,也是哈佛大学扩展学校课程CSCI E-33A的教员。洛根之前是苹果的应用机器学习工程师和软件工程师,以及Julia编程语言的社区经理。

27、AI报税聊天机器人翻车:测试题答错一半

据《华盛顿邮报》报道,经测试,TurboTax和H&R Block的AI报税聊天机器人AI Tax Assist很不靠谱,在16道测试题中答错了一半,回答出无用或出错的信息。这些表现释放了一个危险信号,对于准确性至关重要的产品来说,绝不能轻信AI工具给出的回答。

28、AMD对华销售AI芯片遇阻

据彭博社今日报道,据知情人士透露,AMD试图向中国市场销售一款定制AI芯片时,遇到美国政府的阻碍。AMD希望获得美国商务部的批准,向中国客户出售这款AI芯片,并表示这款芯片性能低于AMD在中国以外地区销售的芯片的性能,设计满足美国出口限制。但美国政府官员告知AMD,该芯片的性能仍然太强了,AMD必须获得美国商务部工业和安全局的许可,才能出售该芯片。

29、印度限制生成式AI工具发布

据路透社今日报道,印度信息技术部在上周五向各平台发布的一份咨询报告中表示,包括生成式AI在内的工具使用,及其“在印度互联网上对用户的可用性,必须得到印度政府的明确许可”。印度要求科技公司在公开发布“不可靠”或正在试用的AI工具之前寻求许可,并指出它们应该被贴上标签,因为这些工具有可能对用户的查询返回错误答案。