UnifoLM-WMA-0
UnifoLM-WMA-0 是宇树科技开源的跨多类机器人本体的世界模型 - 动作架构,专为通用机器人学习设计。核心是世界模型,能理解机器人与环境的物理交互,具备仿真...
GPT-5-Codex
GPT-5-Codex 是 OpenAI 推出的专为编程优化的模型,基于 GPT-5 进一步强化。模型聚焦于真实世界的软件工程任务,如从零搭建项目、代码重构、调试、测试和代码...
Grok 4 Fast
Grok 4 Fast是xAI推出的快速版人工智能模型,最大的特点是响应速度快,最高可达标准版的10倍,生成速度每秒75个token,能快速完成简单查询、基础代码生成等任...
ERNIE-4.5-21B-A3B-Thinking
ERNIE-4.5-21B-A3B-Thinking 是百度推出的专注于推理任务的大型语言模型。采用混合专家(MoE)架构,总参数量达210亿,每个token激活30亿参数,支持128K的长...
FunAudio-ASR
FunAudio-ASR 是阿里巴巴达摩院推出的端到端语音识别大模型,专为解决企业落地中的关键问题设计。通过创新的 Context 增强模块,有效优化了“幻觉”和“串语种”...
xiaohongshu-mcp
xiaohongshu-mcp是基于 Model Context Protocol (MCP) 协议开发的开源工具,帮助用户实现小红书平台的自动化操作。支持多种功能,包括登录小红书、发布图文、...
Stable Audio 2.5
Stable Audio 2.5 是 Stability AI 推出的最新音频生成模型,专为企业级声音制作设计。模型具备快速生成(三分钟音频仅需两秒)、动态音乐创作和音频修复功能。
Live Interpreter API
Live Interpreter API 是 Azure 语音翻译的新功能,能实现实时的多语言语音翻译。无需用户手动设置输入语言, Live Interpreter API 能自动连续识别正在使用...
MobileLLM-R1
MobileLLM-R1是Meta推出的一系列专为数学、编程和科学推理设计的高效推理模型。系列包含基础模型和最终模型,分别有1.4亿、3.6亿和9.5亿参数版本。模型并非通...