标签:语音识别

Gemini 2.5 Pro (I/O 版)

Gemini 2.5 Pro (I/O 版) 是 Google 推出的 Gemini 2.5 Pro 升级版多模态AI模型,具体版本号为 Gemini 2.5 Pro Preview 05-06。模型在编程能力上取得重大突破...
阅读原文

攻壳智能体

攻壳智能体是专注于智能体和 AI 工具的门户网站,为用户介绍最新、热门的智能体和 AI 工具,帮助用户快速找到适合自己的学习、工作、生活的 AI 利器。通过精...
阅读原文

Aero-1-Audio

Aero-1-Audio 是 LMMs-Lab 开发的轻量级音频模型,基于 Qwen-2.5-1.5B 构建,仅包含 1.5 亿参数。专为长音频处理设计,能支持长达 15 分钟的连续音频输入,无...
阅读原文

Spring.new

Spring.new 是基于人工智能的低代码/无代码构建平台,帮助用户快速构建和部署定制化的商业应用程序。通过自然语言输入,用户可以将想法转化为实际应用,无需...
阅读原文

URM

URM(Universal Recommendation Model)是阿里妈妈推出的世界知识大模型,基于知识注入和信息对齐,将LLM的通用知识与电商领域的专业知识相结合,解决传统LLM...
阅读原文

风宇

风宇是中国气象局联合南昌大学和华为共同推出的全球首个全链式空间天气大模型。模型基于创新的链式训练结构,结合卫星观测数据与数值模式数据,实现太阳风、...
阅读原文

Hyprnote

Hyprnote 是为会议设计的AI笔记应用。基于实时记录会议内容结合用户笔记,快速生成高质量的会议总结。Hyprnote 支持离线使用,所有数据存储在本地,确保隐私...
阅读原文

Miras

Miras是谷歌推出的用在深度学习架构设计的通用框架,特别是序列建模任务。Miras基于关联记忆和注意力偏差的概念,将Transformer、现代线性RNN等模型重新定义...
阅读原文

Aether

Aether 是上海AI Lab开源的生成式世界模型,完全基于合成数据训练。Aether 首次将三维时空建模与生成式建模深度融合,具备 4D 动态重建、动作条件视频预测和...
阅读原文

扣子空间

扣子空间(Coze Space)是字节跳动推出的通用型 AI Agent,帮助用户快速搭建和管理 AI 应用。通过可视化界面,没有编程基础,用户也能轻松创建。 集成了超过 ...
阅读原文

EAP Talk

EAP Talk 是基于AI技术的英语口语测评应用,专注于学术英语(EAP)的学习与练习。基于大数据、语音识别、自然语言处理等技术,为学生提供实时自动打分和智能...
阅读原文

破壳AI口语

破壳AI口语是AI英语口语学习应用,基于AI技术为用户提供个性化口语练习体验。破壳AI口语涵盖生活、校园、旅游、职场等多场景对话,帮助用户提升流利度、语法...
阅读原文

小布助手

小布助手是OPPO推出的智能语音助手,内置在OPPO、一加、真我realme等机型中。具备语音交互、联网搜索、系统操作、信息查询等多种功能。小布助手网页版正式上...
阅读原文

心影大模型

心影大模型是心影随形顶尖AI团队研发的AI大模型,正式通过国家生成式人工智能服务备案。模型专注于游戏领域,深度融合游戏攻略与角色陪伴场景,全面应用于“逗...
阅读原文

SeniorTalk

SeniorTalk 是智源研究院联合南开大学计算机学院人类语言技术实验室(HLT Lab)推出的全球首个中文超高龄老年人对话语音数据集。数据集包含202位75岁及以上超...
阅读原文
123415