字节对话类AI产品内测;GPT-5或需5万张H100;智源最强开源语义向量模型上线丨AIGC大事日报

1、字节对话类AI产品Grace已开启内测

2、马斯克xAI创始成员国内首发声

3、GPT-5被预测需50000张H100

4、微软展示Rumi项目 用多模方式提高AI理解能力

5、亚马逊云全球副总裁:生成式AI正处于炒作周期

6、苹果招聘数十个大型语言模型岗位

7、传鸿海向苹果独家供应AI服务器

8、美团正式入股AI公司光年之外

9、智源最强开源语义向量模型BGE上线

10、报告称英伟达AI GPU产能会在2024年增加2.5倍

11、英伟达H100在eBay网站上涨到4.5万美元

12、网易互娱AI Lab图像生成论文被AI顶会接收

13、网易推荐算法技术获全球顶会冠军

14、联想浏览器推出小乐AI助手 接入文心一言

15、元象开源百亿参数通用大模型

16、汉王科技:预计10月发布汉王天地大模型

17、伊利蒙牛发布专属GPT

18、游戏评测媒体IGN将推出AI聊天机器人

19、梅安森:合作共建矿山安全大模型联合实验室

20、AI对菲律宾外包行业构成威胁

21、成都:上半年人工智能产业规模达424亿元

22、河南:加快建设中部算力高地 发放“算力券”

23、河南印发三年行动方案 构建中原智能算力网

24、深圳:到2025年累计开放数据集总量5000个以上

1、字节对话类AI产品Grace已开启内测

据Tech星球8月5日报道,字节跳动代号Grace的对话类AI项目已开启测试,测试界面曝光,测试网站已搭建好,或为后期官网。Tech星球向字节跳动方面进行求证,字节跳动相关负责人回复称:“目前产品还不成熟,还在内测阶段,与国外的领先模型相比,还有较大差距。”

据悉,Grace的测试网站为gracebot.cn,跳转该网址后,可以看到网站标题显示“Grace-你的AI伙伴”等字样,目前支持邮箱、Gmail、飞书账号登录,但需得到授权。登录成功后,即可跳转至Grace的聊天对话界面。除了文生文对话形式外,Grace还支持文生图。

2、马斯克xAI创始成员国内首发声

据量子位8月5日报道,近日,丘成桐弟子杨格(Greg Yang),成为第一个以“马斯克新AI公司xAI创始成员”身份在国内会议上发言的人。在国际基础科学大会的“基础科学与人工智能”论坛上,他发表了与AI和数学交叉学科有关的主题演讲,从数学角度出发,建立一种描述神经网络架构的统一编程语言Tensor Programs。该项目目标是开发大规模深度学习的“万物理论”,找到一种理论上的规则,可以真正理解AI大模型的行为。这项研究已经开源。

论文链接:https://arxiv.org/abs/2203.03466

3、GPT-5被预测需50000张H100

前特斯拉AI总监、现回归OpenAI的AI大神Andrej Karpathy在8月3日转发了一篇广为流传的博客文章。这篇文章探讨了英伟达GPU的短缺情况,认为小型和大型云供应商的大规模H100集群的容量正在耗尽;训练大型语言模型的初创企业、云服务供应商及其他大公司需要拥有超过1000张H100或A100,对大型开源模型进行重大微调的初创公司需要拥有超过100张H100或A100;预测H100短缺情况可能会持续到2024年。

该文章预测GPT-4可能在10000到25000张A100上进行了训练,Meta拥有约21000张A100,特斯拉拥有约7000张A100,Stability AI拥有约5000张A100,Falcon-40B在384张A100上进行了训练。Inflection在其GPT-3.5等效模型中使用了3500张H100。GPT-5可能需要30000-50000张H100。GCP拥有大约25000张H100。微软Azure可能有10000-40000张H100,Oracle应该类似。CoreWeave预订的H100数量约为35000-40000张。

对H100的需求方面,OpenAI可能需要50000张,Inflection需要22000张,Meta可能是需要25000张(有人称实际上Meta想要10万张甚至更多)。大型云可能每个需要30000张(Azure、谷歌、AWS、Oracle)。Lambda和CoreWeave以及其他私有云可能总共需要10万张。Anthropic、Helsing、Mistral、Character,每家可能需要10000张。

4、微软展示Rumi项目 用多模方式提高AI理解能力

据IT之家8月5日报道,微软研究院近日展示了Project Rumi项目,结合文本、音频和视频数据,通过多模方法,提高AI系统的理解能力,从而更能理解人类的意图。该项目包括两个主要部分:多模式副语言编码器和多模式副语言解码器。

5、亚马逊云全球副总裁:生成式AI正处于炒作周期

据澎湃新闻8月5日报道,亚马逊云科技生成式AI全球副总裁瓦西·菲罗明(Vasi Philomin)告诉澎湃科技:“我认为我们无法否认互联网泡沫曾经存在过,但它确实改变了每个人的生活,我们现在已经无法想象没有互联网的生活了。我相信生成式AI将改变每一个职业、每一个行业中的每一个企业。这需要时间。”当被问到我们现在是否处于炒作周期(Hype Cycle)中?菲罗明回答是的,”我们可能还没有达到顶峰,肯定还会有更多炒作。但同时,很多人在幕后悄悄建立着有用的东西,他们在幕后实现着真实的业务用例”。

6、苹果招聘数十个大型语言模型岗位

据英国《金融时报》8月5日报道,苹果正在增强其在生成式AI方面的专业知识,将大型语言模型等前沿技术引入移动领域。苹果正在加利福尼亚州、西雅图、巴黎和北京的办事处招聘从事大型语言模型工作的数十个职位,所有招聘广告均在4月至7月期间发布。

与大型科技公司合作的独立研究员和网络安全顾问Lukasz Olejnik说:“他们的短期目标是将(生成式AI)与现有产品集成,使其立即变得高效和有用。”苹果的多个团队,例如机器智能、神经设计(MIND)团队,正在招募研究人员和工程师,从事从巴黎实验室大型语言模型基础研究到压缩现有语言模型的各种工作,以便它们能在移动设备上高效运行。

7、传鸿海向苹果独家供应AI服务器

据台湾《经济日报》今日报道,传鸿海集团独揽苹果AI服务器大单,通过旗下工业富联位于越南的生产基地,独家出货AI服务器给苹果。消息人士透露,鸿海不仅是苹果iPhone最大组装厂,也是苹果数据中心服务器供应商,苹果冲刺AI应用,同步需要更多AI服务器支援,鸿海在AI服务器市场独占鳌头,又与苹果合作多年,自然成为苹果首选伙伴。

市调机构统计,鸿海目前在全球服务器市占率约43%,不仅是制造“一哥”,也是全球云服务巨头亚马逊最大供应商,除已供应ChatGPT与英伟达的AI服务器,其主力客户谷歌也快速抢进生成式AI,近期苹果亦积极布局生成式AI,均有利于鸿海服务器业务订单激增。

8、美团正式入股AI公司光年之外

据36氪今日报道,天眼查App显示,近日,北京光年之外科技有限公司发生工商变更,全资股东由王慧文变更为美团旗下天津三快科技有限公司。北京光年之外科技有限公司成立于2018年7月,法定代表人为王慧文,注册资本100万人民币,经营范围含技术服务、技术转让、技术开发、技术推广、技术咨询,销售自行开发的产品,计算机系统服务等。

9、智源最强开源语义向量模型BGE上线

据智源研究院微信公众号今日发文,为加快解决大模型的制约问题,近日,智源发布最强开源可商用中英文语义向量模型BGE(BAAI General Embedding),在中英文语义检索精度与整体语义表征能力均超越了社区所有同类模型,如OpenAI 的text embedding 002等。此外,BGE保持了同等参数量级模型中的最小向量维度,使用成本更低。将LangChain与智源BGE结合,可以轻松定制本地知识问答助手,而不需要花较高的成本训练垂类大模型。

本次BGE模型相关代码均开源于FlagOpen飞智大模型技术开源体系旗下FlagEmbedding项目,一个聚焦于Embedding技术和模型的新版块。智源研究院将持续向学术及产业界开源更为完整的大模型全栈技术。

同时,鉴于当前中文社区缺乏全面的评测基准,智源团队发布了当前最大规模、最为全面的中文语义向量表征能力评测基准C-MTEB(Chinese Massive Text Embedding Benchmark),包含6大类评测任务和31个数据集,为评测中文语义向量的综合表征能力奠定可靠的基础,全部测试数据以及评测代码已开源。

BGE模型链接:https://huggingface.co/BAAI/

BGE代码仓库:https://github.com/FlagOpen/FlagEmbedding

C-MTEB评测基准链接:https://github.com/FlagOpen/FlagEmbedding/tree/master/benchmark

10、报告称英伟达AI GPU产能会在2024年增加2.5倍

《科创板日报》7日讯,研究机构Aletheia报告指出,预估AI服务器市场规模将在2024年翻倍、2025年达到1350亿美元,是2022年规模的4.5倍。其中,GPU在AI服务器中成本占比最高,Aletheia认为,GPU市场到2025年将较2023年成长3倍。英伟达为了满足AI服务器市场庞大的需求,将着手大幅增加AI GPU产能,预估英伟达AI GPU产能会在2024年增加2.5倍;公司数据中心业务营收在2023-2026年的年复合成长率将达85%。

11、英伟达H100在eBay网站上涨到4.5万美元

据第一财经报道,目前GPU价格仍在上涨,作为人工智能基础设施的“硬通货”,海外已经有创业企业开始利用GPU进行抵押融资。这种新兴的融资途径凸显了此类硬件在资本密集型人工智能“军备竞赛”中的价值。查询eBay网站发现,H100的售价已经高达4.5万美元,这较今年4月份4万美元的价格涨幅超过10%,而且货源较上半年也显著减少。英伟达内部人士告诉第一财经记者,电商渠道的价格不受英伟达管控,“属私人在网上转售”。

12、网易互娱AI Lab图像生成论文被AI顶会接收

近日,网易互娱AI Lab的一篇关于图像生成的学术论文《General Image-to-Image Translation with One-Shot Image Guidance》被国际计算机视觉顶级学术会议ICCV 2023接收。网易互娱AI Lab提出了一种通用的基于单样本图像引导的图像编辑技术VCT(visual concept translator,视觉概念转换器),给单张参考图像,经过少量的优化步骤,即可把图中的物体或风格迁移至源图像,同时不改变源图像的整体结构。

VCT相较于以往的方案有以下优势:(1)应用泛化性:VCT不需要大量的数据进行训练,且生成质量和泛化性更好。其基于反演的思路,以在开放世界数据预训练好的高质量文生图模型为基础,实际应用时,只需要一张输入图和一张参考图就可以完成较好的图片编辑效果。(2)视觉准确性:相较于近期文字编辑图像的方案,VCT利用图片进行参考引导。 图片参考相比于文字描述,可以更加准确地实现对图片的编辑。(3)不需要额外信息:相较于近期的一些需要添加额外控制信息(如遮罩图或深度图)等方案来进行引导控制的方案,VCT直接从源图像和参考图像学习结构信息和语义信息来进行融合生成,不需要额外的限制。

13、网易推荐算法技术获全球顶会冠军

近日,ACM国际多媒体会议(ACM Multimedia 2023)举办的社交媒体UGC热度预测比赛(Social Media Prediction 2023)公布最终成绩。本次赛题涵盖了照片、用户信息、图像、文本、时间等多模态信息,对技术要求跨越了自然语言处理、计算机视觉、推荐系统等多个领域。其中,网易凭借多年在UGC业务中的技术积累和方案打磨,将业务中积累的算法模型迁移到比赛中,最终夺得冠军,超过去年阿里达摩院创造的记录,相关论文也被会议接收。据了解,网易从2017年开始在十余款游戏落地UGC推荐场景,针对多种UGC场景沉淀了具有业界领先水平的通用建模方案。

14、联想浏览器推出小乐AI助手 接入文心一言

据IT之家报道,联想浏览器今日发布9.0.2.7311正式版本,小乐AI助手测试版加入到侧边栏。IT之家实测,如果询问小乐AI助手测试版“你是文心一言吗”,会得到肯定的答复。据官方介绍,联想浏览器新版本具有三大特色功能:一是文案润色,总结提炼,邮件撰写;二是 AI 搜索功能,一次输入得到多种方案;三是 AI 对话强势结合搜索,让用户有问必有答复。

15、元象开源百亿参数通用大模型

据36氪今日报道,AI驱动的3D内容生产与消费一站式平台元象XVERSE宣布开源其百亿参数的高性能通用大模型XVERSE-13B,可免费商用。据悉,基于XVERSE-13B生成的服务包括文本生成、自动化写作、数据分析、知识问答等方面。

元象XVERSE于2021年在深圳成立,2022年3月完成A轮、A+轮共计1.2亿美元融资,投资方包括腾讯、高榕资本、五源资本、高瓴创投、红杉中国、淡马锡、CPE源峰等。

16、汉王科技:预计10月发布汉王天地大模型

国内OCR识别龙头汉王科技今日在互动平台上回应投资者问,称公司正在着力开发自己的行业专用模型,预计在金秋10月,会有汉王天地大模型(暂定名)及B端、C端的更多重磅新品发布;公司研发的数字员工等虚拟AI机器人已有落地项目,对双足和四足机器人实体机器人的多关节控制、机器人正逆运动、机器人软硬件结构等也在积极研究探索。紫东太初大模型是汉王科技第三大股东中国科学院自动化研究所的研究成果,汉王科技正在深度分析如何更好的转化“紫东太初”多模态大模型的应用成果,尤其是在“医疗影像”等专业领域的应用落地。

17、伊利蒙牛发布专属GPT

据中国证券报今日报道,在世界奶业大会期间,伊利和蒙牛都提到了AIGC(AI内容生成)技术的产业应用,并发布了应用于消费者服务的专属GPT。伊利集团推进AIGC技术的产业应用,并在3月正式发布上线全球乳业第一款数字化产品YILI-GPT,通过机器学习、运筹优化、智能交互等不断为消费者提供更多元的消费体验。蒙牛发布了全球首个营养健康领域模型MENGNIU.GPT,基于该模型的AI营养师可以为消费者提供专属营养健康服务。蒙牛的AIGC平台覆盖100+智能化业务场景,让员工在AI赋能下变身“超级员工”。

18、游戏评测媒体IGN将推出AI聊天机器人

据IT之家今日报道,根据游戏评测媒体IGN的最新消息,IGN即将推出自家的AI聊天机器人IGN Guides Chatbot Alpha。IGN正在《塞尔达传说:王国之泪》指南中进行测试,如果用户登录了IGN 账户,就可以通过指南页面底部的聊天窗口询问有关游戏的问题,它将使用IGN指南中包含的知识,再加上自然语言处理,为用户的特定问题提供答案。

据悉,该机器人是根据数十名IGN指南作者和贡献者编写的游戏指南和攻略内容进行培训的。由于这是一个Alpha版本的实验,所以可能回答质量并不是很好。只有当使用IGN帐户登录时,聊天窗口才会出现在指南页面的底部。在最初Alpha期间,聊天机器人只适用于《塞尔达传说:王国之泪》指南,目前限时免费试用。

19、梅安森:合作共建矿山安全大模型联合实验室

“西部矿山安全第一股”重庆梅安森8月4日晚间发布公告称,梅安森与上海人工智能研究院有限公司于8月4日签署《共建“矿山安全大模型联合实验室”的合作协议》,合作有效期至2026年12月31日。双方将紧密围绕AI大模型在煤炭领域的垂直行业应用,主要包括煤矿知识大脑、AI智能安全隐患排查系统、AI智能调度系统、自动化报表与智能排产等方向的应用课题项目。分阶段完成煤炭工业大模型底座模型微调与私域知识增强的工程化落地、AI智能安全隐患排查系统、报表自动化生成系统、智能矿长与智能调度系统、智能排产系的建立以及日志分析与软件开发运维等项目。

20、AI对菲律宾外包行业构成威胁

据彭博社今日报道,近年AI驱动的机器人抢走了越来越多的外包工作,对全球第二大外包服务提供者菲律宾造成冲击。菲律宾培养的具有所需沟通和技术技能水平的毕业生“比例较低”,可能会失去未来五年新增80万个就业岗位的机会。据亚洲开发银行预测,到2030年,AI和类似技术预计将取代菲律宾外包行业近1/4的人口。

21、成都:上半年人工智能产业规模达424亿元

据成都市人民政府官网8月6日发文,2022年成都市人工智能产业规模为616亿元,位列全国第7,产业增速位居全国第1,综合实力排名全国第6,今年上半年产业规模达424亿元,同比增长36.9%。成都是继上海之后全国第二个投运超算和智算双中心的城市,在全国首创算力券,旨在推动算力普惠。截至目前,成都智算中心算力利用率持续达到95%以上,已孵化出多个科研大模型。其中,“蓉城·夔牛”短临气象预报基础模型为成都大运会天气预报提供有力保障。成都超算中心已和1000余个用户建立合作,涵盖基础科学、人工智能、城市治理等30余个领域,累计完成超4100万个作业数。

22、河南:加快建设中部算力高地 发放“算力券”

河南省人民政府8月4日发布关于印发《河南省支持重大新型基础设施建设若干政策》的通知,提到加快建设中部算力高地,支持算力应用,建立以“算力券”为核心的算力平台运营结算分担机制,每年发放总规模不超过5000万元的“算力券”,支持企业、科研机构、高校等使用国家超算郑州中心、算力规模100P FLOPS(每秒浮点运算次数)以上的人工智能计算中心、1000个标准机架以上的数据中心算力资源,按照算力资源使用费用的20%予以奖励,每个使用单位年享受奖励不超过100万元“算力券”,所需资金由省、市级财政按照1∶1的比例共同分担。

23、河南印发三年行动方案 构建中原智能算力网

河南省人民政府官网8月4日发布关于印发《河南省重大新型基础设施建设提速行动方案(2023—2025年)》的通知,目标到2025年河南省新型基础设施建设水平争取进入全国前5位。本行动方案提到实施高性能算力提升工程,加快建设郑州、洛阳等全栈国产化智能计算中心,构建中原智能算力网;持续提升国家超算郑州中心超算能力,建设智算中心和郑州城市算力网调度中心,综合算力性能保持国际前列,资源利用率达到70%;到2025年智算和超算算力规模超过2000P FLOPS(每秒浮点运算次数),高性能算力占比超过30%。

24、深圳:到2025年累计开放数据集总量5000个以上

据深圳特区报今日报道,深圳市委、市政府近日同意并正式印发《深圳市优化市场化营商环境工作方案(2023—2025年)》。该方案提出加快培育数据要素市场,健全深圳市公共数据开放平台,2023年出台深圳市公共数据开放管理办法,到2025年累计开放数据集总量5000个以上;2023年出台数据产权登记管理暂行办法,保护数据要素市场参与主体合法权益,促进数据要素开放流动和开发利用;开展数据跨境传输(出境)安全管理工作,探索建立数据安全管理相关机制;2024年在企业登记监管、卫生健康、交通运输、气象、金融、电力等重点领域开展公共数据授权运营试点。