标签:语音识别

Aether

Aether 是上海AI Lab开源的生成式世界模型,完全基于合成数据训练。Aether 首次将三维时空建模与生成式建模深度融合,具备 4D 动态重建、动作条件视频预测和...
阅读原文

扣子空间

扣子空间(Coze Space)是字节跳动推出的通用型 AI Agent,帮助用户快速搭建和管理 AI 应用。通过可视化界面,没有编程基础,用户也能轻松创建。 集成了超过 ...
阅读原文

EAP Talk

EAP Talk 是基于AI技术的英语口语测评应用,专注于学术英语(EAP)的学习与练习。基于大数据、语音识别、自然语言处理等技术,为学生提供实时自动打分和智能...
阅读原文

破壳AI口语

破壳AI口语是AI英语口语学习应用,基于AI技术为用户提供个性化口语练习体验。破壳AI口语涵盖生活、校园、旅游、职场等多场景对话,帮助用户提升流利度、语法...
阅读原文

小布助手

小布助手是OPPO推出的智能语音助手,内置在OPPO、一加、真我realme等机型中。具备语音交互、联网搜索、系统操作、信息查询等多种功能。小布助手网页版正式上...
阅读原文

心影大模型

心影大模型是心影随形顶尖AI团队研发的AI大模型,正式通过国家生成式人工智能服务备案。模型专注于游戏领域,深度融合游戏攻略与角色陪伴场景,全面应用于“逗...
阅读原文

SeniorTalk

SeniorTalk 是智源研究院联合南开大学计算机学院人类语言技术实验室(HLT Lab)推出的全球首个中文超高龄老年人对话语音数据集。数据集包含202位75岁及以上超...
阅读原文

口语精灵

口语精灵是AI口语学习软件,通过先进的人工智能技术和真人语音模拟,为用户提供1V1的对话练习体验。用户可以随时随地与AI老师互动,跨越国界,学习不同地区的...
阅读原文

ACTalker

ACTalker 是用于生成逼真说话人头部视频的端到端视频扩散框架。支持单信号或多信号控制,如音频、表情等。核心架构包括并行 Mamba 结构,通过多个分支利用不...
阅读原文

OmniTalker

OmniTalker 是阿里巴巴发布的实时文本驱动的说话头像生成技术,能同时处理文本、图像、音频和视频等多种模态输入,以流式方式生成自然语音响应。核心架构为 T...

枝页

枝页(iBleaf)是基于金字塔原理设计的AI笔记工具,帮助用户将碎片化的知识整理成清晰有序的知识体系。通过知识树的形式,让用户能以层级化的结构组织笔记,...
阅读原文

小猿AI

小猿AI是猿辅导集团旗下的智能教育产品,原名小猿口算,接入了DeepSeek满血版深度推理大模型,具备解题、翻译、写作、问答等多种功能,能为学生提供个性化的...

Augment Agent

Augment Agent 是Augment推出的AI编程助手,帮助软件工程师高效编写高质量代码。Augment Agent能深度理解大型代码库,随着用户工作自动学习和适应代码风格。
阅读原文

面灵AI

面灵AI是基于DeepSeek大模型的AI面试助手,专为求职者设计,提升面试表现。具备实时面试辅助功能,能在面试中快速解析问题并给出专业回答建议,能根据简历和...
阅读原文

OThink-MR1

OThink-MR1是OPPO研究院和香港科技大学(广州)联合推出的多模态语言模型优化框架。基于动态调整Kullback-Leibler(KL)散度策略(GRPO-D)和奖励模型,提升...
阅读原文
1234515