声忆

AI工具4分钟前更新 AI工具集
0 0 0

声忆 – AI 语音输入法,支持本地 ASR 离线识别

声忆,一款专为 macOS 用户量身打造的语音输入利器,以“口述胜于敲键”为核心理念,彻底革新您的文字输入体验。只需长按右侧 Option 键,倾诉您的想法,松开后,短短 1.4 秒内,您的声音便化作精准的文字,瞬时填补光标所在之处。它无缝支持中英混合输入,更能依托本地 ASR 技术实现离线识别,让您的隐私滴水不漏。

声忆的魅力远不止于此。它内置了一个强大且可搜索、可导出的“记忆层”,让您说的每一句话都自动归档,便于日后查阅。更令人惊喜的是,其强大的 AI 智能整理功能与中文排版引擎,能在本地毫秒级完成标点符号的校正、空格的优化以及品牌名称大小写的智能纠错,例如将“Cursor”这类专有名词准确呈现,而非被误转为“苦色”。所有数据均安稳驻留您的 Mac 本地,隐私安全毋庸置疑。基础功能永久免费,而 Pro 版本则解锁了云端无限识别的强大能力。

声忆的核心功能亮点

  • 闪电语音输入 (L1 / SPEAK):通过长按右 Option 键(亦可自定义为 Fn 或右 ⌘ 键),即可启动语音录入。松开按键后,1.4 秒内即可完成语音到文字的转换,并自动将文本插入当前光标位置。无论是中英夹杂的语句,还是同音字、口头禅的自然流露,声忆都能在后台智能处理,无需您频繁切换窗口或手动校对。
  • AI 智能优化:您可以选择接入豆包、DeepSeek、Kimi 或 OpenAI 等主流大语言模型,声忆将仅针对同音字、口头禅及标点进行智能优化,确保不偏离您原意。当识别置信度低于 0.5 时,原文将被保留。若想临时跳过 AI 处理,只需双击右 Option 键即可。
  • 记忆与回顾 (L2 / RECALL):您输入的每一句话都会被自动归档至本地记忆层,详细记录其来源应用、输入时间及自定义标签。强大的全文搜索和过滤功能,让您轻松找回所需信息,并支持导出为 Markdown、JSON 或 CSV 等多种格式。
  • 智能洞察 (L3 / REFLECT):基于 Big5 等先进模型,声忆能够为您生成每周画像、MBTI 分析及金句提炼,从七个不同维度深度解读您一周的表达与思考。
  • 中文排版优化引擎:这款本地化引擎能够以低于 5 毫秒的速度,智能处理空格、标点、大小写以及品牌名称的自动修正,遵循 pangu.js、GB/T 15834-2011 等权威标准,全程无需网络调用。
  • AI 翻译与对照模式:支持超过 50 种语言的实时翻译。通过菜单栏一键切换“整理”、“翻译”或“对照”模式,满足您多样的跨语言沟通需求。
  • 学习型输入闭环:您对 AI 修正结果的每一次手动编辑,都会被系统智能捕捉并转化为候选规则,您可在菜单栏一键采纳,从而构建一个越用越精准的个人化输入系统。
  • 目标窗口锁定:录音时,声忆会自动锁定当前应用程序,确保文字精准插入至预设位置。若遇窗口切换,则可选择 fallback 至剪贴板并以 toast 提示,避免误操作。

声忆的使用流程

  • 获取与安装:访问声忆官方网站 https://voiceinput.app/zh/,下载 22.6 MB 的 DMG 文件。声忆支持 macOS 14.0 及以上版本的 Apple Silicon 和 Intel Mac 电脑,通过 Sparkle 实现自动更新。
  • 初次授权:首次启动时,请按照引导页的提示,一次性授予麦克风、输入监控和辅助功能三项必要的权限。授权完成后,点击“一键重启”即可使所有设置生效。
  • 启动语音输入:长按右 Option 键(或 Fn / 右 ⌘ 键)开始说话。松开按键后,1.4 秒内,您的语音将转化为文本并自动填充至当前光标处。中英混输、同音字及口头禅的处理均在后台自动完成。
  • 配置 AI 智能整理 (可选):在设置菜单中,您可填写兼容的 OpenAI API Key(支持 DeepSeek、Kimi、OpenAI 及本地服务),即可激活智能纠错、去除口头禅和添加标点等功能。Pro 版本根据使用量,月费约在 ¥5–20 之间。
  • 运用翻译/对照模式:在菜单栏中,轻松切换至“整理”、“翻译”或“对照”模式,即可实现 50+ 种语言的实时翻译,或进行原文与译文的双语并排显示。
  • 查阅记忆与回顾记录:所有输入内容都将自动归档至本地记忆层,按应用、时间、标签进行分类。您可以通过全文搜索、过滤功能快速定位,并支持导出为 Markdown、JSON 或 CSV 格式。
  • 获取智能洞察分析:基于 Big5 模型,智能层会自动生成周画像、MBTI 分析和金句提炼,帮助您回顾和反思个人表达与思维模式。
  • 个性化规则训练:当您手动编辑 AI 的修正结果后,系统会自动提取这些编辑内容作为候选规则,您可在菜单栏一键采纳,逐步完善您的输入体验。
  • 临时跳过 AI 优化:若需直接输出原始语音识别结果,只需双击右 Option 键,即可绕过 AI 整理环节。
  • 数据迁移便捷性:您只需将数据库文件复制到新 Mac 的相同路径,即可无缝迁移所有历史记录和配置信息。

声忆的突出优势

  • 中文场景的极速表现:1.4 秒即可完成文字转换,相较于 TypeLess、Wispr Flow 等竞品动辄 3-10 秒的响应时间,声忆在中文输入场景下优势显著。
  • 超越输入法的价值:声忆不仅仅是一个输入工具,它将每一次对话沉淀为可搜索的记忆层,赋予您强大的数据回顾与智能洞察能力。
  • 隐私至上的设计理念:所有语音及文字数据均存储于 App 专属的本地目录,并进行启动前自动备份。API Key 安全地保存在系统 Keychain 中,卸载 App 即可彻底清除所有数据。
  • 轻巧高效的运行体验:DMG 文件体积仅 22.6 MB,兼容 macOS 14.0 及以上版本,并同时支持 Apple Silicon 和 Intel 架构的 Mac。

声忆与同类竞品之比较

对比维度声忆 (VoiceInput)TypeLessWispr Flow
产品定位macOS 语音输入法 + 本地记忆层跨平台 AI 语音听写工具跨平台 AI 语音输入层
支持平台macOS 14.0+(Apple / Intel)macOS、Windows、iOS、AndroidmacOS、Windows、iOS、Android
中文输入速度1.4 秒成文,深度优化中文场景约 220 字/分钟,云端处理约 184 字/分钟,云端 AI 重写
定价模式本地免费版 / 自带 Key $0 / Pro $9/月或$49一次性免费额度 2,000–8,000 字/周 / Pro $12/月(年付)或$30/月免费额度 2,000 字/周 / Pro $15/月 / Team $12/人/月
离线识别能力✅ 内置三套本地 ASR,完全离线❌ 依赖云端处理,无离线模式❌ 依赖云端 AI,需联网
记忆与回顾功能✅ L2 数据层归档 + L3 智能洞察(MBTI/周画像)⚠️ 提供本地历史记录,但无智能分析⚠️ 提供仪表盘统计 + 语音笔记
隐私保护策略100% 本地化处理,数据不离机,密钥存于 Keychain零数据留存,本地历史记录,不用于模型训练隐私模式下,内容云端处理后不留存
中文排版优化✅ 本地引擎 <5ms,遵循 pangu.js/GB/T 15834 标准❌ 通用 AI 清理,缺乏中文排版专项优化❌ 通用 AI 重写,缺乏中文排版专项优化
核心差异点将每句话沉淀为可搜索的记忆层,提供远超输入法的价值跨平台支持最广,AI 自动编辑与语调适配支持实时句子内编辑(mid-sentence 改口),长会话处理能力强

声忆的典型应用场景

  • 日常高效文字输入:在各类工具、邮件客户端、社交媒体平台,只需按下快捷键,1.4 秒内即可完成输入,比传统打字更为迅捷,尤其适合长句表达和即时回复。
  • 写作与内容创作的灵感加速器:在撰写文章、博客、笔记时,通过语音输入捕捉灵感。AI 自动清理口头禅、修正同音字,中文排版引擎则负责标点与空格的规范化,让创作者能全情投入于内容本身,而非格式细节。
  • 编程与开发工作的得力助手:快速输入代码注释、技术文档、API 设计说明。内置的 200+ 开发热词(如 Cursor、Kimi、DeepSeek)能够被精准识别,避免了专有名词的误转。
  • 会议与访谈记录的忠实伙伴:实时将会议内容转化为文字,并自动归档至本地记忆层,支持按应用和时间进行搜索回顾,极大地简化了会后纪要的整理工作。
  • 翻译与跨语言沟通的桥梁:在翻译或对照模式下,您的语音可直接输出为 50+ 种语言的译文,或实现原文与译文的并排显示,为跨国协作和多语言内容生产提供便利。
  • 个人知识管理与日记的数字化助手:利用记忆层记录日常思考,通过全文搜索找回过往灵感。智能层还能自动生成周画像和金句提炼,帮助您梳理个人成长轨迹。
阅读原文
© 版权声明

相关文章

AI聚合视觉工厂

暂无评论

暂无评论...