主动式 Agent 调研/ 档案 02
档案 02 / 05 主动式 Agent 调研 屏幕即上下文

AirJelly

桌面上一只悬浮的小水母——用「Enter 键意图捕获」把屏幕上下文 事件化,只在你真正有意图的瞬间出手。

定位
桌面端主动式 AI 助手
形态
悬浮窗桌面上的小水母
阶段
2026·04·22 上线邀请制内测
平台
macOS
团队
持续低熵11 人 · 北京
融资
五源资本金额未披露
§ 01

屏幕,就是上下文

AirJelly 最关键的判断是:不必不间断地截屏。

传统录屏式 Agent 不停截取屏幕画面——成本高、数据冗余、噪音多。AirJelly 反其道而行:只在你按下 Enter 键的瞬间捕获屏幕上下文。 一次 Enter,就是一个明确的意图信号。

它把这个瞬间建模为一个 Event,再转化为可追踪的 Task。工程数据很直接:Enter 键触发把截图量从 MineContext 时期的日均约 1500 张,降到约 300 张——成本降到约五分之一。

§ 02

一次 Enter,一条主动链路

AirJelly 的主动推送是一条完整的流水线:从一次按键开始,到一条推送结束。 中间每一步——分析、建模、推断、触发——都是为了把「你按下 Enter 的那一刻 在做什么」翻译成「你接下来会需要什么」。

感知 / SENSE 建模 / MODEL 行动 / ACT Enter 截图 分析 建模 归纳 推断 触发 执行 推送 Event Task Next Step Proactive Agent 给用户
主动推送链路 —— 一次 Enter 触发的八步流水线。AirJelly 用「Token 消耗量」 与「Proactive 接收率」两个指标,检验这条链路是否真的在创造价值。
两个核心指标

Token 消耗量——证明 Agent 真的在替用户干活; Proactive 接收率——用户是否愿意接受推送,代表整条链路的方向 是否正确。这套「成本 + 接受度」的双指标,是值得整个品类借鉴的度量范式。

§ 03

从 MineContext 到主动式 Agent

创始人柏特(黄柏特),00 后,西安电子科技大学人工智能专业;曾参与 SwanLab、 DataWhale 等开源项目,2025 年加入字节跳动任产品经理,主导开发 MineContext——一款上下文工程产品,也是 AirJelly 的技术 脚手架。公司主体名为「持续低熵」,团队 11 人,全部在北京线下办公。

转型路径很清楚:2025 年团队尝试把 MineContext 接入 OpenClaw 的 Pi 框架, 发现「Context + Agent 执行」能产生 1+1>2 的效果; 2026 年 2 月确定方向,转型为主动式 Agent,4 月 22 日正式上线,目前为邀请制 内测。

融资方面,AirJelly 获五源资本投资,这是它的第一笔融资, 具体金额与轮次未公开披露。

§ 04 — 报告评述

我们的判断

屏幕即上下文 · AirJelly

与其不停截屏、再用视觉模型大海捞针,不如只在用户有明确意图的 瞬间捕获上下文。

「Enter 键触发」是一个聪明的工程取舍:用一个用户本来就会做的显式动作,换来 一份干净、低成本的上下文切片。相比 ColaOS,AirJelly 更像一个全天候和你一起 用电脑的 Agent,「操作台」也更丰富。但小水母以悬浮窗形态的「窥屏」存在感, 如何把控干扰性与主动性之间的平衡,是它绕不开的边界问题。

Enter 键捕获 Event → Task 悬浮窗 MineContext 双指标度量 五源资本