标签:多语言支持

Qwen2.5-Omni

Qwen2.5-Omni 是阿里开源的 Qwen 系列旗舰级多模态模型,拥有7B参数,Qwen2.5-Omni具备强大的多模态感知能力,能处理文本、图像、音频和视频输入,支持流式文...
阅读原文

Cosmos-Reason1

Cosmos-Reason1 是 NVIDIA 推出的一系列多模态大型语言模型,基于物理常识和具身推理理解物理世界。Cosmos-Reason1包括两个模型:Cosmos-Reason1-8B 和 Cosmo...
阅读原文

Mureka O1

Mureka O1是昆仑万维发布的全球首款音乐推理大模型,全球首个引入“思维链”(Chain of Thought,CoT)技术的音乐模型,Mureka O1在推理过程中加入思考与自我批...
阅读原文

Browseragent

Browseragent是基于浏览器的AI自动化工具,直接在浏览器中创建和运行AI工作流,无需API调用费用,实现零成本的无限次执行。Browseragent基于无代码可视化编辑...
阅读原文

Fluently

Fluently 是 AI英语学习应用,帮助用户提升英语水平。Fluently基于评估用户的英语能力,生成个性化学习计划,涵盖发音、语法、词汇和流利度等方面。用户在真...
阅读原文

LHM

LHM(Large Animatable Human Reconstruction Model)是阿里巴巴通义实验室推出的从单张图像重建可动画化3D人体模型。基于多模态Transformer架构,融合3D几何...

Bobby

Bobby是新加坡金融科技公司RockFlow推出的全球首个金融AI投资伙伴。通过深度学习与自然语言交互技术,能理解用户的投资需求提供个性化服务。用户可以用自然语...
阅读原文

Motia

Motia 是专为软件工程师设计的 AI Agent 框架,简化 AI 智能体的开发、测试和部署过程。支持多种编程语言,如 Python、TypeScript 和 Ruby,开发者可以使用熟...
阅读原文

LongCat

LongCat(龙猫)是美团自主研发的生成式大语言模型,通过人工智能技术提升公司内部工作效率和创新能力。模型具备强大的多模态能力,能处理文本、图像等多种数...

gpt-4o-mini-transcribe

gpt-4o-mini-transcribe 是 OpenAI 推出的语音转文本模型,gpt-4o-transcribe的精简版。gpt-4o-mini-transcribe 基于 GPT-4o-mini 架构,用知识蒸馏技术从大...
阅读原文

福棠·百川

福棠·百川是是国家儿童医学中心、首都医科大学附属北京儿童医院联合百川智能、小儿方健康共同发布的全球首个儿科大模型。覆盖了儿童常见病及疑难病症的立体化...
阅读原文

gpt-4o-transcribe

gpt-4o-transcribe是 OpenAI 推出的高性能语音转文本模型。基于最新的语音模型架构,用海量多样化音频数据训练,精准捕捉语音细微差别,显著降低单词错误率(...
阅读原文

GPT-4o mini TTS

GPT-4o mini TTS 是 OpenAI 推出的轻量级文本转语音模型,支持将文本内容转换为自然流畅语音的同时,开发者能用指令控制语音的语调、情感和风格,例如“平静”“...

Dify-Plus

Dify-Plus 是基于 Dify 二次开发的企业级增强版项目,集成基于 gin-vue-admin 的管理中心。Dify-Plus在 Dify 基础上新增用户额度、密钥额度、Web 公开页登录...
阅读原文

Uthana

Uthana 是专注于3D角色动画生成的AI平台。平台基于简单的文字描述、参考视频或动作库搜索,快速为用户生成逼真的动画,支持适配任何骨骼结构的模型。Uthana ...
阅读原文
15678957