PokeClaw – 开源的全本地离线运行手机 AI Agent 应用
PokeClaw,一款由开发者 Nicole 倾力打造的开源 Android AI 自动化应用,以前所未有的方式重新定义了手机智能助理。它以 PocketClaw 为全称,是业界首个实现完全本地离线运行的手机 AI 代理。其核心技术基于 Google Gemma 4 模型,通过 LiteRT-LM 运行时在设备端进行高效推理,这意味着您无需联网、无需注册账户、更无需担心 API 密钥的泄露,便可实现手机的自主操控。
PokeClaw 的运作机制堪称精妙。它借助 Android 的无障碍服务(Accessibility Service),能够深入读取屏幕的 UI 树状结构。基于这些信息,AI 代理能够自主执行诸如点击、滑动、输入文本、发送消息等一系列操作,从而构建了一个真正的闭环代理系统。所有的数据处理都在本地完成,极大地保障了用户的隐私安全。此外,PokeClaw 还提供了可选的云端模型增强功能,允许用户接入 OpenAI、Anthropic 等第三方服务,以应对更复杂的任务需求。目前,它已支持 WhatsApp 的上下文感知自动回复、通知的智能汇总、以及跨应用的自动化操作等实用功能,并且仅需 Android 9 及以上版本和 8GB 的内存即可流畅运行。
PokeClaw 的核心亮点
- 本地至上的 AI 体验:得益于 Google Gemma 4 模型在设备端的直接推理,PokeClaw 实现了真正的离线运行。无需网络连接、账户信息或 API 密钥,您的所有数据都将安全地保留在手机内部。
- 弹性云端能力拓展:如果您需要处理更具挑战性的任务,PokeClaw 支持无缝连接 OpenAI、Anthropic、Google 等云端 AI 服务,并实时显示 token 消耗及相关费用,让您对成本了如指掌。
- 全能型手机自动化:通过 Android 无障碍服务,PokeClaw 能够精准地解析屏幕 UI,并自主完成点击、滑动、输入、发送消息、启动应用等一系列自动化操作。
- 智能对话回复:PokeClaw 能够智能监控 WhatsApp 等应用的消息通知,主动打开界面,深入理解历史对话上下文,从而生成更贴切、更智能的回复。
- 强大的技能系统:应用内置了预设的可复用工作流,用户可以将通用工具组合成特定的任务序列,例如自动回复、每日晨报、智能消息转发等,极大地提升了效率。
- 全面的系统洞察:PokeClaw 能够实时为您报告电池状态、存储空间、手机温度、蓝牙连接情况、已安装应用列表以及 Android 版本等关键系统信息。
- 多语言与广泛兼容:PokeClaw 的界面支持英语、印地语、日语、德语和繁体中文,并且适配了包括 Tensor G3/G4、骁龙 8 Gen 2+、天玑 9200+ 在内的多种高性能芯片平台。
如何开启您的 PokeClaw 之旅
- 便捷安装与模型下载:前往 GitHub Releases 页面(https://github.com/agents-io/PokeClaw)下载并安装 APK 文件。首次启动应用时,它会自动下载约 2.6GB 的本地模型。
- 授予必要权限:为确保应用正常运行,请务必开启无障碍服务权限(用于屏幕读取和操作),并推荐开启通知访问权限(用于后台消息监控)。
- 选择您的运行模式:本地模式无需任何额外配置即可立即使用。若您倾向于利用云端模型的强大能力,只需在设置中填入您 OpenAI、Anthropic 或 Google 的 API 密钥即可。
- 自然语言交互:在应用底部的输入框中,直接用自然语言输入您的指令。
- 任务卡片便捷操作:在任务界面,您可以轻松点击诸如“监控 WhatsApp 消息”或“发送消息”等技能卡片,填写必要的联系人信息和内容后即可执行。
- 后台智能运行:启用自动回复监控后,只需让应用在后台保持运行,PokeClaw 便会主动检测新消息,并自动执行回复流程。
PokeClaw 的独特优势
- 极致的本地离线体验:基于 Google Gemma 4 模型在设备端直接运行,PokeClaw 实现了真正的离线自主操作。无需网络、账户或 API 密钥,您的所有数据处理都在手机本地完成,从根本上杜绝了隐私泄露的风险。
- 以隐私为核心的设计理念:在本地模式下,您的屏幕内容、记录及所有个人数据都不会被传输到任何外部服务器。敏感信息始终安全地保留在您的设备上,真正实现了数据。
- 深刻的上下文理解能力:其自动回复功能不仅能监控消息通知,更能主动进入界面,全面阅读对话历史,基于前文语境生成恰当且智能的回复,而非简单地触发预设模板。
- 灵活的技能系统:PokeClaw 将诸如点击、滑动、输入等基础工具巧妙地组合成可复用的工作流(如自动回复、晨间简报)。这使得即便是小型模型也能可靠地执行复杂的多步任务,并且支持用户自定义扩展。
- 成本透明且可控:在云端模式下,应用会实时显示 token 消耗和运行费用,并支持设置软/硬预算上限,让用户在执行复杂任务时能够随时掌握资源的使用情况。
- 零门槛的部署与使用:PokeClaw 无需 root 权限,无需开发者账号,只需安装 APK 文件即可使用。它兼容 Android 9 及以上版本,以及 8GB 内存以上的主流设备,并支持 Tensor、骁龙、天玑等多种芯片平台。
PokeClaw 的关键信息与使用门槛
- 项目性质:一款开源的 Android AI 自动化应用,遵循 Apache 2.0 协议,由开发者 Nicole 主导开发和维护,代码托管于 GitHub (agents-io/PokeClaw)。
- 核心定位:全球首个实现完全本地离线运行的手机 AI 代理(On-device AI Agent),无需云端连接即可自主控制 Android 设备执行复杂任务。
- 技术基石:核心技术基于 Google Gemma 4 模型,通过 LiteRT-LM 运行时进行推理,支持原生工具调用(Tool Calling)。模型文件大小约 2.6GB,纯 CPU 设备即可运行,无需 GPU 加速。
- 运行模式选择:PokeClaw 采用本地优先架构,默认离线运行以保障隐私。同时,它也支持接入 OpenAI、Anthropic、Google 等云端 API,以增强复杂任务的处理能力,并支持在会话中无缝切换模型。
- 控制机制:通过 Android 无障碍服务(Accessibility Service)获取屏幕 UI 信息,AI 能够自主决策并执行点击、滑动、输入、发送消息等操作,形成完整的代理流程。
- 核心功能集:包括上下文感知自动回复(支持 WhatsApp)、通知汇总、剪贴板内容分析、系统信息查询、跨应用操作,以及基于 Skills 架构的可复用工作流系统。
- 系统要求:需要 Android 9.0 或更高版本,arm64 架构芯片,最低 8GB RAM(推荐 12GB+),以及至少 3GB 的可用存储空间(用于首次下载模型)。无需 root 权限。
- 硬件性能考量:纯 CPU 设备也能运行,但启动可能需要约 45 秒。推荐使用搭载 Tensor G3/G4(如 Pixel 8/9)、骁龙 8 Gen 2+、天玑 9200+ 等高性能芯片的设备,以获得秒级响应速度。
- 必要权限授予:必须授予无障碍服务权限(用于屏幕读取和自动化操作),并建议授予通知访问权限(用于后台消息监控和自动回复功能)。
- 首次配置流程:安装 APK 文件后,首次选择本地模式时会自动下载约 2.6GB 的模型文件。如果选择云端模式,则需要在设置中配置相应的 API 密钥(如 OpenAI、Anthropic、Google 等)。
- 语言支持:应用界面支持英语、印地语、日语、德语和繁体中文。其技能系统能够处理任意语言的指令输入和应用操作。
- 网络连接需求:本地模式完全无需网络连接。云端模式则需要网络连接以访问相应的 API 服务。模型下载需要稳定的网络连接,并支持断点续传。
PokeClaw 与同类产品的比较分析
| 对比维度 | PokeClaw | HeyBro | Google Project Astra |
|---|---|---|---|
| 开发方 | Nicole / agents.io(开发者) | iamvaar-dev(开发者) | Google DeepMind(大厂) |
| 开源协议 | Apache 2.0 | 未明确标注(Flutter/Kotlin 项目) | 闭源(Google 内部项目) |
| 运行模式 | 本地优先(Gemma 4 离线运行)+ 可选云端 | 仅云端(需 Google AI Studio API 密钥) | 云端为主(集成 Gemini)+ 端侧推理 |
| 手机控制方式 | Android 无障碍服务读取 UI 树并执行操作 | 悬浮窗权限 + 无障碍服务控制屏幕 | 系统级深度集成,自主控制应用和设置 |
| 模型支持 | Google Gemma 4(本地)+ OpenAI/Anthropic/Google(云端) | 依赖 Google AI Studio 云端模型 | Gemini 系列模型(云端+端侧) |
| 隐私保护 | 本地模式完全离线,数据不出设备 | 需上传屏幕数据至 Google AI Studio | 数据上传至 Google 云端处理 |
| 功能范围 | WhatsApp 自动回复、通知汇总、跨应用操作、技能系统 | 通用设备自动化(基于自然语言指令) | 实时环境理解、视觉辅助、跨应用任务、主动建议 |
| 硬件要求 | Android 9+,8GB+ RAM,arm64,3GB 存储 | Android 设备(Flutter 跨平台),需悬浮窗权限 | 未公开具体配置,需较新 Android 设备 |
PokeClaw 的应用场景展望
- 消息自动化管理:无论是驾车、开会等不便手动回复的场景,还是需要管理高频社交沟通,PokeClaw 都能通过监控 WhatsApp 等应用特定联系人的消息,进行上下文感知的自动回复。它甚至能在错过电话后自动发送跟进短信。
- 设备状态智能监控:PokeClaw 能够实时监测电池健康度、存储空间占用、手机温度、蓝牙连接状态以及已安装应用列表。它还能智能分析并提供清理建议,是设备维护、性能优化和故障排查的得力助手。
- 跨应用信息检索与整合:在 YouTube 上搜索视频、查看 Twitter/X 上的热门话题、在 Reddit 上查找内容、复制邮件主题进行 Google 搜索…… PokeClaw 能够高效地完成这些跨应用的信息获取任务,特别适合调研和信息收集场景。
- 个性化日程与信息简报:PokeClaw 可以执行每日晨间简报流程,自动打开天气应用读取实时温度,查看日历获取当日行程,并统计未读邮件数量生成摘要,帮助用户高效开始新的一天。
- 隐私至上的数据处理:在完全离线模式下,PokeClaw 能够安全地分析剪贴板内容、汇总通知信息、处理个人敏感数据。这对于对隐私有极高要求的商务、医疗或法律场景至关重要,确保敏感信息绝不离开设备。
- 无障碍操作辅助:通过自然语言指令,PokeClaw 能够让 AI 自主完成点击、滑动、输入等操作,为行动不便或视力障碍的用户提供极大的便利,有效降低了智能手机的使用门槛。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...



粤公网安备 44011502001135号