01 为什么我要做AI接入物理世界
很多人是通过 AR、空间计算、MR 这些方向认识我的。
过去这些年,我一直在这个领域里。
从 2012 年在 HiAR 做国内最早的AR SDK,到2015年国内第一款 AR 眼镜开始,到联想研究院的 daystAR系列软硬件、C919 航电 AR 辅助装配,再到工信部工业空间计算白皮书和 mixx.space 的 MR 博物馆项目。
这条主线一直很清楚:让数字能力融入现实世界。构建混合环境,混合感官。
所以当我要认真做一个AI内容方向时,我没有去追每一个模型热点,而是顺着同一条线继续往前走。
我现在关注的是:AI到底怎么进入现实世界,实现混合感官和混合智力。
做 AI 工具、研究 prompt 工程,这些工作本身也很有价值。
但我同时注意到另一个现象:很多人学了一身AI的技艺,却还不知道用它们来解决什么真实问题。技术越来越强,场景却还模糊着。
所以我不是教你用工具,而是和你一起研究——AI 到底能帮你完成什么现实中的事。
过去这些年我在 AR 和现实交互领域的经验,让我越来越确信一件事:真正重要的创新,常常不发生在纯粹的数字世界里,而发生在原子世界和电子世界的混合地带。
人要去看展、去旅行、去做饭、去找路、去照顾家人、去理解一个陌生环境。
这些都不是“一个个字节IO”就能解决的事。
这些是现实任务。它们发生在空间里,发生在时间里,发生在手忙脚乱、信息不完整、情境不断变化的过程里。
而多模态 AI 的真正价值,也许恰恰在这里。
不是更会聊天。
不是更会写文案。
而是更能看见你眼前的环境,听懂你的处境,理解你的任务,并在合适的时候给你帮助。
所以我特别也想尝试几个方向:看展搭子、旅行搭子、盲人导视搭子、做饭搭子等,现实场景里的陪伴式 AI。
这些方向在我看来,背后都不是一个小功能,而是一种新的产品范式:
AI不再只是工具,而是开始成为现实任务中的协同者。
这和具身智能不是一个方向,依然是做AR产品的核心价值观:以人为本,赋能予人。 因为现实太复杂,噪声太多,我不太相信三五年内机器人可以帮我剥个毛豆,或者炒个鱼香肉丝什么的。
但我非常相信 人脑 + AI 的协同。
AI 来看、来听、来提醒、来检索、来结构化,做外脑智力支持。
人来判断、来承担、来选择、来行动。
这才是我理解的“人机环境智能系统”当下更优解。
也是我想持续讲下去的内容主线。
我不只想谈趋势,也想用产品去验证。
所以我做了 厨房搭子CookPal,把它当作一个现实世界 AI 的实验场。
它对我来说不是一个孤立的 App,而是一个问题的开始:
如果 AI 真能接入物理世界,它最先应该帮助人的,到底是哪一步?
接下来我会持续写这几个方向:
- AI 接入物理世界的产品机会
- 多模态 AI 在真实场景中的价值
- 人脑 + AI 协同的方法论
- 我自己做
CookPal的一线复盘
如果你也对这个方向感兴趣,欢迎一起交流。