标签:语音识别

Langotalk

Langotalk是一个创新的在线语言学习平台,基于AI技术为语言学习者提供个性化和沉浸式的学习体验。平台支持20多种语言,如英语、西班牙语、法语、德语、意大利...
阅读原文

FunASR

FunASR是由阿里巴巴达摩院开源的语音识别工具包,提供包括语音识别(ASR)、语音活动检测(VAD)、标点恢复、语言模型、说话人验证、说话人分离及多说话人ASR...
阅读原文

TANGO

TANGO 是一个由东京大学和 CyberAgent AI Lab 共同推出的开源框架,专注于生成与目标语音同步的全身手势视频。基于分层音频运动嵌入和扩散插值网络,将目标语...
阅读原文

Lingua

Lingua 是 Meta AI推出的一个轻量级且独立的代码库,旨在助力大规模训练语言模型。基于易于修改的 PyTorch 组件,便于研究人员尝试新的模型架构、损失函数和...
阅读原文

有挂

有挂是一款创新的浏览器AI插件,基于自然语言处理技术,使用户用简单的命令或对话修改网页内容,无需任何编程知识。插件支持Chrome、Edge和Arc浏览器,具备个...
阅读原文

麦芽岛

麦芽岛是由科大讯飞推出的一款AI虚拟角色互动聊天应用。用户可以创建和自定义虚拟角色,与之进行沉浸式对话,模拟情感陪伴和剧情互动。用户可以设定角色的外...
阅读原文

Act-One

Act-One 是 Runway推出的AI生成式角色表演工具,基于简单的视频输入生成富有表现力的角色表演。工具用生成式模型,将演员的现场表演转化为3D模型,适于动画流...
阅读原文

Kanana

Kanana是韩国即时通讯巨头Kakao推出的一款生成式AI助理,定位为用户的“AI伴侣”。能记住对话中的关键信息,根据上下文提供智能回应。Kanana分为两部分:Kana作...
阅读原文

语鲸

语鲸(LingoWhale)是基于深言科技大模型能力的一款AI阅读工具,通过智能总结、问答、思维导图等功能,帮助用户快速把握文章核心内容和结构。工具支持多端同...
阅读原文

Moonshine

Moonshine是专为资源受限设备优化的语音识别模型,提供快速且准确的实时语音转文本服务。适于需要即时响应的应用场景,例如现场转录和语音命令识别。Moonshin...
阅读原文

Voice Design

Voice Design是ElevenLabs推出的AI语音生成工具,用户只需描述所需声音的年龄、口音、性别、语调或音高,甚至是虚构角色如精灵、食人魔等,工具能快速生成独...
阅读原文

GLM-4-Voice

GLM-4-Voice是智谱AI推出的端到端情感语音模型,能直接理解和生成中英文语音,支持实时语音对话,能根据用户指令灵活调整语音的情感、语调、语速和方言等特征...
阅读原文

音控

音控是AI音乐创作平台,基于提供一系列工具和服务,让音乐爱好者和专业人士能轻松创作音乐。平台有AI作词、作曲、伴奏生成等功能,用户只需输入歌词或旋律,A...
阅读原文

Krikey AI

Krikey AI是创新的人工智能平台,基于AI技术简化3D动画和虚拟角色的生成过程。用户可以通过输入文本提示快速创建个性化的3D头像和动画,无需专业的3D设计经验...
阅读原文

Talkie

Talkie是中国大模型厂商MiniMax面向海外市场推出的AI虚拟伴侣应用,为用户提供高度个性化和沉浸式的互动体验。用户可以创建和定制虚拟角色,包括外观、声音和...
阅读原文
134567