OpenLess – 开源 AI 语音输入法,口语自动转为结构化文本
OpenLess,一款基于 Rust、Tauri、React 和 TypeScript 全面开源的跨平台语音输入解决方案,为 macOS 和 Windows 用户带来了革新性的输入体验。它巧妙地将录音、自动语音识别(ASR)转写以及人工智能(AI)润色融为一体,只需按下全局快捷键,便能让口语转化为精准的文本,并直接插入当前光标位置。OpenLess 的出现,旨在挑战 Typeless、Wispr Flow、Lazy、Superwhisper 等商业订阅制语音输入工具的市场地位。
OpenLess 的核心亮点
- 全局无缝语音输入:无论您身处 ChatGPT、Claude、Cursor、Notion、邮件客户端还是任何窗口,OpenLess 都能通过全局快捷键激活录音。松开按键后,系统将自动完成文本处理并精准插入到输入框中。
- AI Prompt 精炼模式:这是 OpenLess 的独到之处。它不仅仅是简单的语音转文本,更能将零散的口语,转化为结构化、有约束、富含上下文的 AI Prompt,可以直接用于 ChatGPT、Claude、Cursor 等 AI 工具,极大地提升了与 AI 交互的效率。
- 多样的文本输出风格:用户可以在「原文」、「轻度润色」、「清晰结构(AI Prompt 模式)」和「正式表达」这四种模式之间切换,以满足不同场景下的表达需求。
- 灵活的录音方式:OpenLess 支持「切换式」和「按住说话」两种录音模式,提供极大的便利性。在任何阶段,按下
Esc键即可随时取消操作。 - 智能剪贴板辅助:当直接插入文本到目标应用的光标位置受阻时,OpenLess 会自动将识别结果复制到剪贴板,确保您的内容绝不丢失。
- 词典与热词增强:通过自定义专有名词、产品名、人名等词典,OpenLess 能够将这些词汇作为 ASR 的热词注入,并在 AI 润色阶段进行语义优化,显著提高识别和表达的准确性。
- 应用内自动更新:借助 Tauri 的更新机制,OpenLess 能够自动检测并下载安装最新版本,始终保持最新状态。
如何轻松上手 OpenLess
- 安装指引:请从 GitHub Releases 页面下载对应您操作系统的安装包。macOS 用户将
.dmg文件拖入/Applications目录;Windows 用户则运行.exe安装程序。 - 首次启动设置:macOS 用户需要在首次启动时授予「麦克风」和「辅助功能」权限,然后退出并重新打开应用(辅助功能权限需要重启后生效)。Windows 用户在授予麦克风权限后,请在设置中确认全局快捷键已激活。
- 配置 API 凭据:在应用设置中,您需要填入火山引擎流式 ASR 的相关凭据(APP ID、Access Token、Resource ID),以及润色模型的 API Key(支持 Ark、DeepSeek、OpenAI 兼容 API)、Model ID 和 Endpoint。
- 开始您的语音输入之旅:将光标置于任意输入框,按下预设的全局快捷键即可开始录音。您可选择「切换式」或「按住说话」模式。自然发声,OpenLess 将实时完成录音和 ASR 转写。松开按键后,AI 润色将自动进行,并根据您选择的模式处理文本。
- 流畅的文本插入与撤销:润色完成后,文本将自动插入当前光标位置。如遇目标应用阻止插入,结果将自动复制到剪贴板。在录音、润色或插入的任何阶段,您都可以通过按下
Esc键来取消当前操作。 - 灵活切换输出模式:在主窗口,您可以轻松切换「原文」、「轻度润色」、「结构化(AI Prompt 模式)」、「正式表达」四种输出模式,以满足多样化的书面表达需求。
- 个性化词典管理:在「词典」页面,您可以添加专有名词、产品名、人名等,这些词汇将被系统识别为 ASR 热词,并在润色过程中根据上下文进行智能修正。
- 开发者构建指南:如果您是开发者,可以克隆仓库,进入
openless-all/app/目录,执行npm ci安装依赖,然后运行npm run tauri dev即可进入开发调试模式。
OpenLess 的官方渠道
- 官网:https://openless.top/
- GitHub 仓库:https://github.com/appergb/openless
OpenLess 的关键特性与使用门槛
- 市场定位:OpenLess 是一款面向 macOS 和 Windows 的开源语音输入工具,旨在提供媲美 Typeless、Wispr Flow、Superwhisper 等闭源付费产品的体验。
- 核心工作流程:按下全局快捷键 → 录音 → ASR 转写 → LLM 润色 → 自动插入光标。其最大的亮点在于“AI Prompt 模式”,能够将口语直接转化为结构化的 Prompt。
- 技术架构:基于 Tauri 2(Rust 后端)配合 React 和 TypeScript 构建。
- 当前版本:v1.2 版本支持切换式/按住说话录音方式,提供原文、轻度润色、结构化(AI Prompt 模式)和正式表达四种输出模式,界面支持中英双语,并具备应用内自动更新功能。
- 服务依赖:用户需要自行配置火山引擎流式 ASR 服务以及 Ark、DeepSeek 或兼容 OpenAI 格式的 Chat Completions 服务。
- 许可协议:MIT 协议,允许使用和修改。
OpenLess 的独特优势
- 完全开源与本地优先:代码公开在 GitHub,数据处理在本地进行,不绑定特定模型或 ASR 服务提供商,用户拥有更多自。
- 灵活的云服务配置:用户可自主配置火山引擎 ASR 和兼容 OpenAI 格式的 Chat Completions 服务,确保数据隐私与安全。
- 专注文本处理,避免“越界”:润色模型仅负责文本整理,不涉及问答、任务执行或项目分析,避免了 AI 的“越俎代庖”。
- 多语言用户界面:支持简体中文和英文界面,并可根据系统语言自动适配,提供更友好的用户体验。
OpenLess 与竞品对比分析
| 对比维度 | OpenLess | Typeless | Wispr Flow |
|---|---|---|---|
| 开源/闭源 | 完全开源(MIT License) | 闭源商业软件 | 闭源商业软件 |
| 支持平台 | macOS、Windows | Mac、Windows、iOS、Android、Web | Mac、Windows、iOS、Android |
| 定价模式 | 免费 | 免费版 4,000–8,000 词/周;Pro $30/月 或 $144/年 | 免费版 2,000 词/周;Pro $15/月 或 $144/年;Teams $12/用户/月 |
| ASR/LLM 处理方式 | 自备火山引擎流式 ASR + Ark / DeepSeek / OpenAI 兼容 Chat Completions | 云端 AI 统一处理 | 云端处理(OpenAI、Meta 等) |
| 隐私架构 | 本地优先,数据本地存储,无供应商锁定 | 纯云端,音频上传至服务器,未明确是否用于模型训练 | 纯云端;存在截图传输隐私顾虑 |
| 核心差异化功能 | AI Prompt 模式,自定义词典热词,剪贴板兜底 | 跨平台覆盖最广,免费额度慷慨 | 上下文感知格式化,Command Mode,Whisper Mode |
| 离线能力 | 否(需联网) | 否(纯云端) | 否(纯云端) |
| 语言支持 | 中英双语 UI | 多语言自动检测 | 100+ 语言,支持代码切换 |
| 录音限制 | 无明确时长限制 | 单次录音上限 6 分钟 | 未明确公开时长限制 |
OpenLess 的应用场景拓展
- 为 AI 生成结构化 Prompt:将模糊的需求口述,OpenLess 即可将其转化为清晰、有条理的 Prompt,直接用于与 AI 互动。
- 高效起草文档与邮件:将日常口语转化为规范的书面表达,自动修正标点和段落,用于撰写邮件、需求文档等。
- 加速代码注释与 PR 描述撰写:把开发思路直接转化为规范、简洁的文本,快速插入 IDE 或 Git 工具。
- 解放双手的文字输入需求:适用于填写表单、撰写社交媒体帖子、会议速记整理等任何不便打字的场景,只需按下快捷键即可完成。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...



粤公网安备 44011502001135号