AI项目和框架

MicroCoder

MicroCoder是微软亚洲研究院联合剑桥大学、普林斯顿大学推出的代码大模型训练优化项目,针对Qwen3等新一代模型训练瓶颈,从算法、数据、评估、经验四维度全面...
阅读原文

Mureka V9

Mureka V9 是昆仑万维推出的最新AI音乐大模型。模型在音乐旋律性、表现力、编配编曲等核心指标上全面超越Suno V5等竞品,登顶Artificial Analysis人声和乐器...
阅读原文

KAT-Coder-Pro V2

KAT-Coder-Pro V2是快手KwaiKAT团队推出的旗舰级AI编程模型,专为Agentic Coding场景深度优化。模型原生兼容Claude Code、Cline、OpenClaw等10余种主流AI编码...
阅读原文

Matrix-Game 3.0

Matrix-Game 3.0 是昆仑万维(Skywork AI)推出的实时交互式世界模型,支持720p@40FPS实时生成。模型采用误差缓冲机制实现自校正,结合相机感知记忆检索确保...
阅读原文

AnyClaw

AnyClaw 是专为 AI Agent 设计的开源智能转接头,扮演"Agent 互联网与传统互联网的连接器"角色。能将传统互联网分散的 API、脚本、网页自动化工作...
阅读原文

Star Office UI

Star Office UI 是开源的像素风格的 AI 可视化状态看板,支持将 AI 助手的工作状态实时可视化。Star Office UI 支持 6 种状态映射到不同办公区域,配备昨日工...
阅读原文

Voxtral TTS

Voxtral TTS 是 Mistral AI开源的文本转语音模型,基于 40 亿参数架构,支持 9 种语言。模型具备 90 毫秒超低延迟和 6 倍实时生成速度,仅需 3-5 秒音频可实...
阅读原文

MOCR

MOCR(Multimodal OCR)是华中科技大学与小红书hi lab联合推出的多模态文档解析模型,仅3B参数在文档解析和图形重建上实现突破性表现。
阅读原文

Suno v5.5

Suno V5.5 是Suno推出的 AI 音乐生成模型,标志着从"生成即完成"向"精细化制作"的重大转型。模型新增 Voices 声音定制、Custom Models ...
阅读原文

Gemini 3.1 Flash Live

Gemini 3.1 Flash Live是Google最新推出的高质量实时语音模型,专为自然流畅的对话交互设计。模型在语调理解、推理能力和响应速度上均有显著提升,能精准识别...
阅读原文

daVinci-MagiHuman

daVinci-MagiHuman 是上海创智学院 GAIR 实验室与 Sand.ai 联合开源的音视频联合生成基座模型。模型采用 150 亿参数的单流 Transformer 架构,统一建模文本、...
阅读原文

LongCat-Next

LongCat-Next是美团LongCat推出的多模态模型,核心创新是LoZA稀疏注意力机制。模型通过智能筛查模块重要性,将50%低重要模块替换为流式稀疏注意力,形成全局...
阅读原文

TurboQuant

TurboQuant 是 Google Research 推出的向量量化算法,可将大模型 KV Cache 从 32-bit 压缩至 3-bit,实现内存降低 6 倍、推理速度提升 8 倍,且精度零损失。
阅读原文

DataChef

DataChef是上海人工智能实验室与复旦大学联合开源的AI数据配方生成模型。模型通过强化学习自动生成大模型适配任务的完整数据处理流水线,包括数据选择、清洗...
阅读原文

Lyria 3 Pro

Lyria 3 Pro 是谷歌推出的 AI 音乐生成模型,支持创作最长 3 分钟的完整音轨,具备结构感知能力,可精准处理前奏、主歌、副歌、桥段等编曲要素。
阅读原文
11213141516192