GigaWorld-1
GigaWorld-1 是极佳视界推出的具身世界模型,在 WorldArena 评测中登顶全球第一。模型采用 AC-WM(动作控制世界模型)架构,结合显式动作建模与可微分物理引...
MicroCoder
MicroCoder是微软亚洲研究院联合剑桥大学、普林斯顿大学推出的代码大模型训练优化项目,针对Qwen3等新一代模型训练瓶颈,从算法、数据、评估、经验四维度全面...
KAT-Coder-Pro V2
KAT-Coder-Pro V2是快手KwaiKAT团队推出的旗舰级AI编程模型,专为Agentic Coding场景深度优化。模型原生兼容Claude Code、Cline、OpenClaw等10余种主流AI编码...
Matrix-Game 3.0
Matrix-Game 3.0 是昆仑万维(Skywork AI)推出的实时交互式世界模型,支持720p@40FPS实时生成。模型采用误差缓冲机制实现自校正,结合相机感知记忆检索确保...
Star Office UI
Star Office UI 是开源的像素风格的 AI 可视化状态看板,支持将 AI 助手的工作状态实时可视化。Star Office UI 支持 6 种状态映射到不同办公区域,配备昨日工...
商汤输入法AudioClaw
商汤输入法AudioClaw是商汤科技基于日日新多模态大模型推出的智能语音输入工具。工具集语音转文字、智能润色、即时翻译、口语净化、AI会议助手于一体,支持毫...
SenseAudio
SenseAudio 是商汤科技推出的 AI 语音开放平台,主打"自然好听、富有情绪的 AI 语音"。平台集成 70+ 精品音色,提供文本转语音、声音克隆(3秒素材...
FeelFish 3.0 发布
当 AI 还在以「单智能体问答」的方式帮你改一句台词时,FeelFish 已经在思考一个更宏大的问题:如果每一个创作环节都有一位专属的 AI 专家坐镇,写作会变成什...
Voxtral TTS
Voxtral TTS 是 Mistral AI开源的文本转语音模型,基于 40 亿参数架构,支持 9 种语言。模型具备 90 毫秒超低延迟和 6 倍实时生成速度,仅需 3-5 秒音频可实...
粤公网安备 44011502001135号