语音识别 - 第 4 页

面灵AI

面灵AI是基于DeepSeek大模型的AI面试助手，专为求职者设计，提升面试表现。具备实时面试辅助功能，能在面试中快速解析问题并给出专业回答建议，能根据简历和...

阅读原文

AI工具

1年前 (2025)

OThink-MR1

OThink-MR1是OPPO研究院和香港科技大学（广州）联合推出的多模态语言模型优化框架。基于动态调整Kullback-Leibler（KL）散度策略（GRPO-D）和奖励模型，提升...

阅读原文

AI工具

1年前 (2025)

PaddleSpeech

PaddleSpeech 是百度飞桨团队开源的语音处理工具，提供全面的语音处理功能，包括语音识别、语音合成、声纹识别、语音翻译等。PaddleSpeech提供命令行界面、服...

阅读原文

AI工具

1年前 (2025)

Mureka V6

Mureka V6是昆仑万维推出的AI音乐创作平台的基座模型，支持纯音乐生成以及10种语言的AI音乐创作。引入自研的ICL（in-context learning）技术，使声场更加开阔...

阅读原文

AI工具

1年前 (2025)

MCP.so

MCP.so 是MCP资源平台，专注于收集和整理第三方 MCP（Model Context Protocol）服务器。MCP.so将资源分为三类，MCP Servers（目前有2995个）、MCP Clients，...

阅读原文

AI工具

1年前 (2025)

AndroidGen

AndroidGen 是智谱技术团队推出增强基于大语言模型（LLM）的 Agent 能力的框架，特别是在数据稀缺的情况下。框架通过收集人类任务轨迹基于这些轨迹训练语言模...

阅读原文

AI工具

1年前 (2025)

瀚海智语

瀚海智语（OceanDS）是国家海洋环境预报中心联合海洋出版社和三六零数字安全科技共同推出的国内首个海洋垂直领域大语言模型，模型以360智脑13B和Deepseek-R1-...

阅读原文

AI工具

1年前 (2025)

龙猫LongCat

LongCat（龙猫）是美团自主研发的生成式AI大模型，通过人工智能技术提升公司内部工作效率和创新能力。模型具备强大的多模态能力，能处理文本、图像等多种数据...

阅读原文

AI工具

1年前 (2025)

算了么

算了么是创新的算力共享平台，让用户通过共享闲置的GPU资源来支持科学研究和推动科技进步，同时还能从中获得收益。用户加入后，平台会自动利用电脑闲置算力进...

阅读原文

AI工具

1年前 (2025)

Marker

Marker 是开源的高精度文档转换工具，专注于将 PDF、Word 等多种文档格式快速、准确地转换为 Markdown、JSON 和 HTML 格式。通过深度学习技术，自动去除页眉...

阅读原文

AI工具

1年前 (2025)

Open-Sora 2.0

Open-Sora 2.0 是潞晨科技推出的全新开源SOTA（State-of-the-Art）视频生成模型。Open-Sora 2.0 用 20 万美元（224 张 GPU）成功训练出 11B 参数的商业级模型...

阅读原文

AI工具

1年前 (2025)

月匣

月匣是百度推出的AI互动应用，主打情感陪伴和沉浸式剧本体验。用户选择多种AI角色进行个性化对话，如温柔好友、霸道总裁或二次元角色等，享受深度情感交流。...

阅读原文

AI工具

1年前 (2025)

Tough Tongue AI 2.0

Tough Tongue AI 2.0 是多模态对话练习工具，帮助用户应对各种困难对话场景而设计。支持创建和分享多种对话场景，如面试、职场沟通、销售谈判等，提供智能对...

阅读原文

AI工具

1年前 (2025)

Wan

Wan是阿里推出的AI创意平台，平台搭载Wan2.1模型生成能力，专注于AI绘画和AI视频创作。AI绘画基于文字描述，快速生成具有艺术感的图像。AI视频支持将文本和图...

阅读原文

AI工具

1年前 (2025)

TicVoice 7.0

TicVoice 7.0 是出门问问推出的第七代高品质 TTS（语音合成）引擎，基于新一代语音生成模型 Spark-TTS 。TicVoice 7.0基于创新的 BiCodec 编码方式，将语音分...

阅读原文

AI工具

1年前 (2025)

标签：语音识别