智东西(公众号:zhidxcom)
作者 | 云鹏
编辑 | 漠影

刚刚,国产版“贾维斯”,真的进家了!

辛苦一天,深夜推开家门,耳边响起:“加班辛苦了,早点休息,有需要随时叫我!”

妻子生日当天,一进家门灯光氛围直接拉满、电视播放祝福画面,音箱响起:“亲爱的老婆生日快乐!”

智能家居终于“智能”了!有记忆、能认人的“贾维斯”,小米先交卷了

当我沉迷世界杯球赛时,耳边突然响起:“厨房的水烧开了,要尽快关火哦!”

智能家居终于“智能”了!有记忆、能认人的“贾维斯”,小米先交卷了

当我在书房伏案加班、长时间紧盯屏幕时,亲切的提醒声道来:“注意坐姿哦,不然又要腰痛啦!”

智能家居终于“智能”了!有记忆、能认人的“贾维斯”,小米先交卷了

AI大管家不仅懂我的生活作息、知我的健康状况,还会主动关心我,随时感知我在各类场景的状态。

今天,这样的体验,已经成为现实。

就在昨天,小米正式发布并开源了Xiaomi Miloco 2.0,一套面向未来的全屋智能AI开源方案。直观来看,小米给Agent时代的智能家居装上了新的“AI大脑”,把超级AI管家带进了智能家居生态中。

客观来看,这也是目前业内第一个能够实现AI主动服务、有家庭记忆的智能家居解决方案。

智能家居终于“智能”了!有记忆、能认人的“贾维斯”,小米先交卷了

▲Xiaomi Miloco 2.0 GitHub首页

当前,以各类Claw为代表的Agent(智能体)成为AI赛道的核心焦点,其在生产力提效方面作用显著。然而在“AI进家”这一关键场景,仍然缺乏一个关键系统,把基于大模型、通用性极强、多模态交互能力极强的各类Claw与智能家居设备生态彻底打通、连接起来,让Agent可以真正“懂家”。

Xiaomi Miloco 2.0,就是这样一个核心系统,可以化作Agent的“眼睛、耳朵、记忆”,各类米家设备作为全模态感知入口,Miloco 2.0通过视觉、声音、环境感知实现全屋理解,将用户需求传达给Agent,真正完成AI在家庭场景提供服务的闭环,而所有用户数据都保存在端侧,原始数据与Agent完全隔离,30天自动清理,隐私安全问题得到妥善解决。

这背后不仅是小米大模型底层能力的升级,更是一套系统级全屋智能AI框架的成熟。

全屋智能设备在安全基础之上摆脱了传统手动设置规则的束缚,更高效地接入AI生态,更能主动理解、服务人的需求,Xiaomi Miloco 2.0真正成为了一个有记忆、能认人,还能流畅执行复杂任务的AI智能管家,全屋智能在Agent时代的拐点,已经来了。

一、深度拆解Miloco架构:让Agent真正“懂家”,掐紧隐私安全底线

今天,距离Miloco 1.0正式开源仅仅过去7个月,Miloco 1.0主打端云协同与跨设备自然语言交互,而Miloco 2.0的开源直接将智能家居的AI生态协同体验带到了一个新的高度。

如果说1.0解决了AI与设备的联动,搭好了框架,那么2.0则真正实现了全屋智能的“Agent化”。

从架构上来看,端侧Miloco 2.0系统与主AI Agent之间实现了高效的协同配合:

Miloco部署在本地,利用米家设备作为入口,调用云端的omni(全模态)感知大模型进行视觉、声音、环境的全屋理解与身份识别,把感知、处理后的关键结构化信息发送给主Agent,随后主Agent调用云端大模型模型进行全局任务规划与决策,规划出执行步骤后,再向Miloco发起调用,最终Miloco联动全屋米家智能设备完成AI服务的闭环。

智能家居终于“智能”了!有记忆、能认人的“贾维斯”,小米先交卷了

值得一提的是,想要实现这一套看似极为超前的“次世代智能家居AI体验”,门槛已经大大降低,普通小白用户也可以很轻松的上手体验,完成部署。

你最少只需要:

·一台能跑OpenClaw的电脑(跨平台支持Mac/Windows/Linux);

·一个绑定了家里米家设备的小米账号;

·一台米家摄像头作为视觉感知入口;

·一个多模态大模型的API Key(当然小米官方推荐的是其自家的MiMo)

目前Miloco 2.0已经接入了Agent圈受众最为广泛的OpenClaw,根据官方信息,后续Miloco也会陆续适配更多Claw类产品。

对于用户来说,Miloco 2.0已经做了大量优化简化,你只需要给OpenClaw发送指令,它会自动帮你完成环境准备、绑定账号和模型,全程几乎不需要更多操作,可以说极大地拉近了AI前沿技术与消费级场景的距离。

虽然部署上大幅简化,但在用户最关心的安全方面,Miloco却一点都没省:

所有摄像头、各类传感器收集的原始数据“用完即弃”,数据完全本地保存,绝不留存云端,随时可清空,即便忘记,30天后也会自动清理。用户还可以给摄像头设黑名单、给家庭设白名单,可以说数据完全由用户掌控。

值得一提的是,这些原始数据与OpenClaw完全隔离,Agent能获取的信息只有Miloco系统判断完所给出的“发生了什么”的语义结果。

安全这道“底线”,小米狠狠掐住,不留任何风险。

二、四项核心能力升级,给Agent装上“眼耳口”,智能家居体验大不同

说了这么多理论技术层面的改变,Miloco 2.0在实际家庭场景中,到底有哪些新的技能,到底可以实现怎样不同的AI体验,背后的关键技术实现逻辑又是怎样的?当我们深入官方发布的多个功能演示视频就会发现,当Agent真正懂家、懂你后,家居场景所迸发出的AI应用价值空间是巨大的。

纵观此次小米开源的Miloco 2.0,多模态感知、主动智能、持续任务和家庭记忆是其四个最核心的功能升级。

多模态感知方面,案例视频中的“水烧开无人时主动提醒”令人印象深刻,米家摄像头通过视觉看到水壶上的蒸汽,声音传感器监测到锅具的蜂鸣,判断水已烧开,而此时主人并未在厨房内,因此推断需要提醒。随后摄像头查看到主人正在观看电视,因此选择沙发两侧距离人最近的音箱播放音频提醒,整个流程自然高效、符合逻辑。

智能家居终于“智能”了!有记忆、能认人的“贾维斯”,小米先交卷了

生活中类似的场景实际还有很多,例如老人独自在家中如果不小心跌倒或遇到特殊情况需要帮助、孩子独自哭泣,系统可以结合摄像头的视觉识别以及声音传感器识别综合判断老人、孩子状态,即时给主人发送提示,或者远程启动家中家电给予帮助。未来,这些都可以通过Miloco 2.0的能力实现。

主动智能方面,当摄像头感知到主人回家,会结合家庭记忆进行判断,发现到家时间晚于平均,推测主人可能加班了,因此主动给予慰问。

智能家居终于“智能”了!有记忆、能认人的“贾维斯”,小米先交卷了

一大早醒来,AI根据家庭记忆发现今天是你的生日,伴着清晨第一缕阳光给你送上温馨生日祝福;当AI发现你情绪低落,就会主动询问是否要为你播放一些轻松抒情的常听曲目,并与你聊天缓解情绪——主动智能让AI更有温度。

持续任务也是非常实用的一项升级,在演示视频中,当系统收到我们的家人生日提醒指令后,就会自动思考,主动编排家中可以用到的设备,比如各类灯、电视、音箱,生成生日惊喜方案,随后就开始持续“待命”,等待条件触发。当系统监测到家人归来,就会调动设备执行编排好的方案。

智能家居终于“智能”了!有记忆、能认人的“贾维斯”,小米先交卷了

这种时刻在线、感知触发的持续任务能力在生活中还大有用武之地:

比如持续监测孩子的坐姿,视觉模型持续对比孩子落座后的骨骼姿态,一旦触发不良姿态条件就会进行语音或其他形式的提醒干预;系统还可以后台计时、联动电视状态数据,持续监测孩子看电视的时间,并在达到指定观看时长后进行提醒或关机;系统还可以持续观察并记录家中老人的夜间动向,如果老人夜里长时间没回房间,系统就会主动提醒用户。

最后一项核心升级是家庭记忆功能,这也是贯穿许多能力的一项基础功能升级。

正如演示视频中所展示的,当摄像头识别到有人书房落座,就会根据其身份回溯家庭记忆,根据其喜好调整灯光,比如男主人喜欢在阅读电脑时用明亮暖光,女主人则喜欢在写笔记时用柔和的中性光。

智能家居终于“智能”了!有记忆、能认人的“贾维斯”,小米先交卷了

摄像头识别到女主人坐姿不佳的时候,也会根据家庭记忆联想到她腰部不适的病史,并即时提醒注意坐姿,在识别到女主人运动的时候,也会即时提醒她动作幅度要注意,避免腰部过度用力。

智能家居终于“智能”了!有记忆、能认人的“贾维斯”,小米先交卷了

这种家庭记忆能力是让AI真正懂你、能够提供个性化贴心服务的关键技术支撑。根据病历和药方提醒老人按时吃药、根据主人的喜好调节各类家电的参数、根据孩子的年龄推荐适合的学习读物和学习姿势,家庭记忆让AI真的像你的“家人”。

纵观四大核心功能升级,我们不难发现,这些能力几乎都是相互交融、共同作用在不同场景中,可以说是实现次世代智能家居体验的“基石”能力。

从单一视觉升级到多模态感知,系统能同时处理空间内的画面变化、人物变化、声音语调、温度等多维数据,感知更为精准和立体。

从规则驱动到主动智能,系统凭借大模型强大的常识推理能力,主动观察用户场景状态,基于用户的日常作息与设备使用习惯,自主进行判断并主动提供服务。

从单点执行到长期任务,相比传统的“一句话一执行”,AI真正可以实现随时在线、多时段持续跟踪。

从宽泛上下文理解到专属家庭记忆,AI直接“精准识别家庭成员身份信息”, 将通用常识知识与长期沉淀下来的专属“家庭档案”进行结合,针对性匹配其专属、个性化的智能服务。

总体来看,在Miloco 2.0的加持下,曾经对家庭场景是一片“盲区”的Agent,终于可以借助新的眼睛、耳朵和各类感知能力,去懂用户、懂用户的家,懂用户在家的一系列复杂状态和需求,进而提供真正主动有温度的智能服务。

Agent时代的智能家居体验,被彻底革新。

三、抢先用AI Agent变革智能家居,下一个十年小米能否继续领跑赛道?

回望过去十几年,小米一直是智能家居赛道的生态王者,十年前,米家基于过硬的产品力、极致性价比、远超行业的统一互联体验,定义了智能家居领域的“互联互通时代”。

而在今天的Agent时代,小米有望重新定义智能家居发展的新范式和方向。从Miloco 1.0到今天的2.0,AI时代、大模型和Agent加持下的智能家居到底要怎么做、如何跑通,小米已经交出了一份蓝本式的答卷。

从摄像头、传感器、灯具到家电,米家生态中庞大的硬件资源被重新整合,成为大模型的“眼耳口鼻”,让Agent可以真正操控物理世界,在家庭场景完成服务闭环。

“懂家”的Miloco与能力强大的Agent结合,AI进家这件事,又向前迈了一大步:Miloco 2.0并不是一次简单的软件迭代,而是全屋智能向“系统级Agent”方向进化的一次关键技术迭代。

为什么是小米先做成了这件事?这离不开小米在“AI家”这一方向上的长期坚定投入、技术深耕。

“人车家全生态”是小米当前的核心战略,“家”自然是其中的核心一环,在这一战略下,小米在AI领域持续加大投入,2026年预计投入至少160亿元,其创始人兼CEO雷军曾提到,未来三年小米在AI领域将投入600亿元。

智能家居终于“智能”了!有记忆、能认人的“贾维斯”,小米先交卷了

小米今年4月底开源的MiMo-V2.5系列模型重点提升了Agent能力,在各类基准测试中位居全球开源模型阵营头部。随后这一模型家族的语音模型、视觉模型相继迭代升级,取得出色表现。小米MiMo大模型也是此次Miloco 2.0的智能核心。

毫无疑问,这些扎实的底层模型能力,以及在AI领域的持续大力投入、对家庭这一场景的持续深耕,都是小米此次能够交出Miloco 2.0这一“划时代”解决方案的关键支撑。

与此同时,我们也看到,小米这家公司做“把Agent与智能家居结合”这件事时,展现出了行业其他厂商难以望其项背的“生态护城河”优势。

当前小米生态中的AIoT设备连接数量已经接近12亿,小米有着全球独一无二的庞大用户生态,这样的IoT基座提供了极其丰富的硬件生态,让Miloco的成长天然有着最肥沃的土壤。

客观来说,这是小米在AI领域几乎“不可复制”的生态护城河。

当十多亿设备真正接入AI时,智能家居领域真正的“GPT时刻”,或许就会到来。

结语:Agent加速进家,AI普惠再提速

好的技术离不开生态的加持,小米AI一直积极拥抱开源,此次Miloco 2.0的开源,必然会显著降低三方硬件厂商和开发者切入全屋Agent的门槛,吸引更多开发者加入到小米Miloco生态中,这也会进一步加速智能家居行业向Agent时代的全面进化。

展望未来,“贾维斯”式的超级AI管家必然会加速走进每一个普通用户家中,并且是以更亲民的价格和更低的部署门槛。“你不用顾家,家会顾你”不再是一句“玩笑话”,而是会成为看得见摸得到、享受得到的现实体验。