桌面上一只悬浮的小水母——用「Enter 键意图捕获」把屏幕上下文 事件化,只在你真正有意图的瞬间出手。
AirJelly 最关键的判断是:不必不间断地截屏。
传统录屏式 Agent 不停截取屏幕画面——成本高、数据冗余、噪音多。AirJelly 反其道而行:只在你按下 Enter 键的瞬间捕获屏幕上下文。 一次 Enter,就是一个明确的意图信号。
它把这个瞬间建模为一个 Event,再转化为可追踪的 Task。工程数据很直接:Enter 键触发把截图量从 MineContext 时期的日均约 1500 张,降到约 300 张——成本降到约五分之一。
AirJelly 的主动推送是一条完整的流水线:从一次按键开始,到一条推送结束。 中间每一步——分析、建模、推断、触发——都是为了把「你按下 Enter 的那一刻 在做什么」翻译成「你接下来会需要什么」。
Token 消耗量——证明 Agent 真的在替用户干活; Proactive 接收率——用户是否愿意接受推送,代表整条链路的方向 是否正确。这套「成本 + 接受度」的双指标,是值得整个品类借鉴的度量范式。
创始人柏特(黄柏特),00 后,西安电子科技大学人工智能专业;曾参与 SwanLab、 DataWhale 等开源项目,2025 年加入字节跳动任产品经理,主导开发 MineContext——一款上下文工程产品,也是 AirJelly 的技术 脚手架。公司主体名为「持续低熵」,团队 11 人,全部在北京线下办公。
转型路径很清楚:2025 年团队尝试把 MineContext 接入 OpenClaw 的 Pi 框架, 发现「Context + Agent 执行」能产生 1+1>2 的效果; 2026 年 2 月确定方向,转型为主动式 Agent,4 月 22 日正式上线,目前为邀请制 内测。
融资方面,AirJelly 获五源资本投资,这是它的第一笔融资, 具体金额与轮次未公开披露。
与其不停截屏、再用视觉模型大海捞针,不如只在用户有明确意图的 瞬间捕获上下文。
「Enter 键触发」是一个聪明的工程取舍:用一个用户本来就会做的显式动作,换来 一份干净、低成本的上下文切片。相比 ColaOS,AirJelly 更像一个全天候和你一起 用电脑的 Agent,「操作台」也更丰富。但小水母以悬浮窗形态的「窥屏」存在感, 如何把控干扰性与主动性之间的平衡,是它绕不开的边界问题。