标签:智能语音助手

灵犀 X2

灵犀X2是智元机器人推出的最新双足人形机器人。全身拥有28个自由度,搭载小脑控制器Xyber-Edge、域控制器Xyber-DCU和智能电源管理系统Xyber-BMS,机械结构上...
阅读原文

TicVoice 7.0

TicVoice 7.0 是出门问问推出的第七代高品质 TTS(语音合成)引擎,基于新一代语音生成模型 Spark-TTS 。TicVoice 7.0基于创新的 BiCodec 编码方式,将语音分...
阅读原文

Pinch

Pinch 是创新的实时 AI 语音翻译视频会议平台,专为打破语言障碍而设计,支持超过 30 种语言的即时语音翻译。提供两种翻译模式:口译模式和同声传译模式,分...
阅读原文

AVD2

AVD2(Accident Video Diffusion for Accident Video Description)是清华大学联合香港科技大学、吉林大学、南京理工大学、北京理工大学、复旦大学等机构推出...
阅读原文

Light-R1

Light-R1是360智脑开源的AI模型,专注于数学领域的长思维链推理,具体为 Light-R1-32B。模型基于Qwen2.5-32B-Instruct,用7万条数学数据和两阶段课程学习(SF...
阅读原文

All Voice Lab

All Voice Lab(趣丸千音)是全球领先的AI语音创作平台,提供一站式智能语音解决方案,基于趣丸科技与香港中文大学(深圳)联合研发的MaskGCT语音大模型开发...
阅读原文

Mercor

Mercor 是专注全球招聘的AI驱动平台,基于AI技术简化求职和招聘流程。求职者只需上传简历,完成20分钟的AI面试,Mercor能将用户的信息匹配到全球数千家公司的...
阅读原文

Long-VITA

Long-VITA 是腾讯优图实验室、南京大学、厦门大学开源的多模态模型,能处理超过100万tokens的长文本输入,在短文本任务中表现出色。Long-VITA基于分阶段训练...
阅读原文

Sa2VA

Sa2VA是字节跳动联合加州大学默塞德分校、武汉大学和北京大学共同推出的多模态大语言模型,是SAM2和LLaVA结合而成,能实现对图像和视频的密集、细粒度理解。S...
阅读原文

YAYI-Ultra

YAYI-Ultra 是中科闻歌研发的企业级大语言模型的旗舰版本,具备强大的多领域专业能力和多模态内容生成能力。支持数学、代码、金融、舆情、中医、安全等多个领...
阅读原文

Ola

Ola是清华大学、腾讯 Hunyuan 研究团队和新加坡国立大学 S-Lab 合作开发的全模态语言模型。通过渐进式模态对齐策略,逐步扩展语言模型支持的模态,从图像和文...
阅读原文

Eko

Eko是Fellou AI推出的生产就绪型JavaScript框架,基于自然语言驱动的方式,帮助开发者轻松创建从简单指令到复杂流程的可靠智能代理。Eko支持所有平台,包括计...
阅读原文

KAG

KAG(Knowledge Augmented Generation)是蚂蚁集团推出的专业领域知识服务框架,基于知识增强提升大型语言模型(LLMs)在特定领域的问答性能,为垂直领域的知...
阅读原文

SPAR

SPAR是智谱团队推出的自我博弈框架,能增强大型语言模型在遵循指令方面的能力。框架基于内部的生成者和完善者两个角色进行互动,生成者执行指令生成回复,完...
阅读原文

AI Stick

AI Stick是联想集团推出的AI桌面助手“如意”,集成人工智能技术,AI Stick可以连接到多种设备上,如电脑、手机等。AI Stick搭载了豆包大模型,提供了AI搜索、A...
阅读原文