语音识别 - OpenI

WPS接入DeepSeek，秒变办公神器！

WPS 大家经常用来日常写作，虽然本身提供了AI功能，但可惜需要会员，本文教你三分钟接入最火的DeepSeek，让WPS秒变办公神器。 DeepSeek API申请地址：http:/...

阅读原文

AI教程

1年前 (2025)

AI赚钱副业~AI生成影视解说，半个月涨粉变现3.5W+！

这两年大家都在感叹生活不易，然而我想说的是，机会还是有的，但问题不在于有没有，而在于你是否能够认准机会，然后抓住它。接触过很多咨询项目的人，发现...

使用教程

2年前 (2024)

StepAudio 2.5 ASR

StepAudio 2.5 ASR 是阶跃星辰推出的新一代自动语音识别模型，专为语音转写、会议纪要与长音频处理设计。模型采用 Audio Encoder + Linear Adapter + 4B LLM ...

阅读原文

AI工具

2个月前

Fun-ASR1.5

Fun-ASR1.5是阿里通义团队推出的端到端语音识别大模型的新一代版本，单模型支持30种语言高精度识别，覆盖中文七大方言体系及二十余种地方口音，专项优化古诗...

阅读原文

AI工具

2个月前

Mobvoi MCP Server

Mobvoi MCP Server 是出门问问推出的一站式集成各项 AI 能力的工具，Mobvoi MCP Server集成语音生成、声音克隆、图片驱动数字人、视频配音等多项多模态 AI 能...

阅读原文

AI工具

1年前 (2025)

Largo

Largo是基于AI技术加速影视内容开发的创新平台。平台分析海量影视数据（包括超过40万部电影和电视剧、95万名演员、5.9万个剧本等），为影视制作提供数据驱动...

阅读原文

AI工具

1年前 (2025)

CoGenAV

CoGenAV - 通义联合深圳技术大学推出的多模态语音表征模型

阅读原文

AI工具

1年前 (2025)

幻舟AI

幻舟AI是一站式AI短片创作平台，支持批量生成广告片、宣传片、动画片等。基于Midjourney、Runway等全球领先的AI模型，实现剧本创作、角色设计、分镜生成及视...

阅读原文

AI工具

1年前 (2025)

SOM AI

SOM AI 是 AI 辅助学术写作工具，帮助学生轻松完成毕业论文（Skripsi）和学术研究。工具基于自然语言交互，提供研究主题头脑风暴、段落释义、简化复杂内容等...

阅读原文

AI工具

1年前 (2025)

Unmute

Unmute 是 Kyutai 推出的低延迟语音交互系统，专注于低延迟语音转文字（Speech-to-Text）和文字转语音（Text-to-Speech）。Unmute 基于先进的 AI 模型，为用...

阅读原文

AI工具

1年前 (2025)

LLaDA-V

LLaDA-V是中国人民大学高瓴人工智能学院、蚂蚁集团推出的多模态大语言模型（MLLM），基于纯扩散模型架构，专注于视觉指令微调。模型在LLaDA的基础上，引入视...

阅读原文

AI工具

1年前 (2025)

Context7

Context7 是 Upstash 推出的AI工具，为大型语言模型（LLMs）和 AI 代码编辑器提供最新、版本特定的文档和代码片段。通过解析文档、丰富内容、向量化和重新排...

阅读原文

AI工具

1年前 (2025)

豆包·语音播客模型

豆包·语音播客模型是字节跳动旗下火山引擎推出的语音播客模型。模型基于流式模型构建，可将文本秒级转化为双人对话式播客，具有低成本、高时效、强互动特点。...

阅读原文

AI工具

1年前 (2025)

Notato

Notato 是AI笔记应用，专为高效学习和工作设计。能将音频、视频、文档或网页链接快速转换为清晰的笔记、总结、闪卡和测验，帮助用户轻松整理和复习关键信息。

阅读原文

AI工具

1年前 (2025)

DICE-Talk

DICE-Talk是复旦大学联合腾讯优图实验室推出的新颖情感化动态肖像生成框架，支持生成具有生动情感表达且保持身份一致性的动态肖像视频。DICE-Talk引入情感关...

阅读原文

AI工具

1年前 (2025)

Speech-02

Speech-02 是 MiniMax 推出的新一代文本到语音（TTS）模型。模型基于回归 Transformer 架构，实现零样本语音克隆，仅需几秒参考语音能生成高度相似的目标语音...

阅读原文

AI工具

1年前 (2025)

AI智能体

AI工具集收录了最新最全的AI智能体工具，包括通用型AI Agent、AI编程、AI设计、AI数据分析、AI智能体开发等。

阅读原文

未分类

1年前 (2025)

标签：语音识别