AI项目和框架

GLM-5.1

GLM-5.1是智谱推出的全球最强开源模型,8小时长程任务执行。模型代码能力在SWE-Bench Pro基准测试中位列全球第一,超越GPT-5.4和Claude Opus 4.6。GLM-5.1是...
阅读原文

VoxCPM2

VoxCPM2是OpenBMB开源的2B参数语音合成模型。模型采用无分词器扩散自回归架构,支持30种语言及中文方言,输出48kHz录音室级音质。
阅读原文

OpenHarness

OpenHarness 是香港大学数据智能实验室(HKUDS)开源的轻量级 AI Agent 框架,用纯 Python 实现,仅 11,733 行代码(为 Claude Code 的 1/44 体积),复刻了...
阅读原文

LLM Wiki

LLM Wiki是Karpathy推出的自主运行的个人知识库,突破传统RAG"每次查询从零检索"的局限。LLM Wiki通过Schema文件指导LLM主动维护结构化Markdown Wi...
阅读原文

OmniWeaving

OmniWeaving是浙江大学联合腾讯混元、南洋理工大学推出的统一视频生成框架。框架突破传统开源模型单一任务限制,实现多模态自由组合与推理增强生成,能将交错...
阅读原文

MAI-Transcribe-1

MAI-Transcribe-1是微软Azure AI Foundry推出的企业级语音转文字模型,支持中英日法等25种语言,模型在FLEURS基准测试中全面领先Whisper-large-v3。
阅读原文

Wan2.7-Video

Wan2.7-Video是阿里通义实验室推出的AI视频创作大模型,支持文本、图像、视频、音频全模态输入。模型突破传统生成限制,实现"像修图一样修视频"的...
阅读原文

InternSVG

InternSVG是上海人工智能实验室等推出的面向统一SVG建模的“数据-评测-模型”综合套件,包含三大组件:超1600万样本的SAgoge数据集、标准化SArena评测基准,以...
阅读原文

JoyAI-Image-Edit

JoyAI-Image-Edit是京东开源的指令引导图像编辑模型,基于JoyAI-Image多模态基础模型构建。模型支持通过自然语言指令实现精确可控的空间操作与智能图像修改,...
阅读原文

Gemma 4

Gemma 4是Google开源的多模态大模型系列,基于Gemini 3架构。模型包含E2B/E4B(手机/树莓派可跑)、26B MoE(仅激活3.8B参数)和31B Dense(Arena评分开源第...
阅读原文

Qwen3.6-Plus

Qwen3.6-Plus是阿里通义实验室推出的 Agent 编程模型,主打编码智能体能力跃升。模型默认支持100万token超长上下文,在SWE-bench、Terminal-Bench等代码修复...
阅读原文

claw-code

claw-code 是Claude Code 源码泄露后推出的Clean-room Rewrite项目。作者为避免法律风险,使用 OpenAI Codex 的 OmX 工作流编排,仅用数小时将核心架构从 Typ...
阅读原文

GLM-5V-Turbo

GLM-5V-Turbo是智谱AI推出的原生多模态Coding基座模型,专为视觉编程和AI Agent设计。模型从预训练阶段深度融合视觉与文本能力,支持理解图片、视频、设计稿...
阅读原文

Wan2.7-Image

Wan2.7-Image是通义实验室推出的AI图像生成与编辑模型,支持深度自定义人物形象(脸型、眼型、骨相等),告别千篇一律的「AI标准脸」,可精准生成4000+字符及...
阅读原文

Lightpanda

Lightpanda 是专为 AI Agent 和自动化设计的开源无头浏览器,用 Zig 语言从零编写,不依赖 Chromium 或 WebKit。工具内存占用仅为 Chrome 的 1/16,执行速度...
阅读原文
12345183