Ming-omni-tts
Ming-omni-tts 是蚂蚁集团开源的统一音频生成模型,采用自回归架构实现语音、音乐和音效的联合生成。模型支持通过自然语言指令对语速、音调、音量、情感和方...
Claude Sonnet 4.6
Claude Sonnet 4.6是Anthropic推出的最新一代AI模型,定位"高性能与高性价比"的平衡点。在编程、计算机操作、长文本推理和智能体规划等核心能力上...
SoulX-Singer
SoulX-Singer 是 Soul App 联合天津大学、西北工业大学开源的工业级零样本歌声合成模型。模型基于 4.2 万小时高质量多语言歌声数据训练,支持 MIDI 乐谱与 F0...
FireRed-Image-Edit
FireRed-Image-Edit是小红书Super Intelligence团队开源的通用图像编辑模型,基于扩散架构,支持文本引导的图像编辑、老照片修复、虚拟试穿等多功能。
MonsterClaw
MonsterClaw 是基于 OpenClaw 内核的本地AI执行系统,完全部署在用户本地计算机上运行,无需将数据上传至云端,从根本上保障隐私安全。安装后,MonsterClaw ...
Xiaomi-Robotics-0
Xiaomi-Robotics-0是小米开源的首代机器人VLA(视觉-语言-动作)大模型,拥有47亿参数,采用MoT混合架构,Qwen3-VL多模态模型作为"大脑"理解视觉语...
Ring-2.5-1T
Ring-2.5-1T是蚂蚁集团inclusionAI团队开源的万亿参数混合线性思考模型,采用Ling 2.5架构,以1:7比例融合MLA与Lightning Linear注意力机制。
Seedream 5.0 Lite
Seedream 5.0 Lite 是字节跳动 Seed 团队推出的新一代智能图像创作模型。相比Seedream 4.0,模型在理解、推理和生成方面全面提升,采用多模态统一架构,能深...
粤公网安备 44011502001135号