AI项目和框架

MAI-Image-2

MAI-Image-2 是微软 AI Superintelligence 团队推出的第二代文生图模型,目前在 Arena.ai 排行榜位列全球前三。模型主打三大核心能力:增强的照片级真实感、...
阅读原文

New API

New API 是新一代 AI 网关与资产管理系统,作为 AI 基座平台,提供统一基础设施接入全球 30+ 主流 AI 服务(OpenAI、Claude、Gemini、DeepSeek 等)。
阅读原文

PrismAudio

PrismAudio 是阿里通义实验室推出的视频生成音频(Video-to-Audio)框架,可为无声视频自动配上环境音效。模型首创"分解式思维链"技术,让模型先思...
阅读原文

ChatClaw

ChatClaw是智麻开源的AI智能体,30MB极小安装包支持macOS/Windows/Linux。工具内置本地知识库、技能市场、MCP扩展、长期记忆和计划任务,可接入钉钉、飞书、...
阅读原文

Uni-1

Uni-1 是 Luma AI 推出的统一图像理解与生成模型,首次将视觉推理与图像生成整合到单一自回归 Transformer 架构中。模型能在生成前和生成过程中进行结构化内...
阅读原文

SoulX-LiveAct

SoulX-LiveAct 是Soul App AI团队开源的实时数字人生成框架,解决AR扩散模型流式生成的稳定性难题。核心创新包括:Neighbor Forcing技术对齐相邻帧扩散步数确...
阅读原文

gstack

gstack 是 YC CEO Garry Tan 开源的为 Claude Code 用的 AI 编程工作流,能将 AI 助手转化为虚拟工程团队。工具包含 15 个专家角色(如 CEO 审查、Staff 工程...
阅读原文

LongCat-Flash-Prover

LongCat-Flash-Prover 是美团开源的5600亿参数MoE模型,专注Lean4形式化数学推理。模型通过Agentic工具集成推理(TIR),将任务分解为自动形式化、草图生成和...
阅读原文

Qwen3.5-Max-Preview

Qwen3.5-Max-Preview 是阿里通义千问团队推出的旗舰大模型预览版。模型在LMArena评测平台以1464分跻身全球前五、国内第一,在基础能力评测中排名全球第六。
阅读原文

The Agency

The Agency 是开源 AI Agent 角色库,包含 144+ 个专业 AI 专家,覆盖工程、设计、市场、产品等 12 个部门。每个 Agent 都有独特个性、专业流程和明确交付标...
阅读原文

IndexCache

IndexCache 是清华与智谱团队推出的稀疏注意力加速技术,针对 DeepSeek 稀疏注意力(DSA)中索引器计算开销大的问题,通过跨层复用索引来减少冗余计算。
阅读原文

Composer 2

Composer 2 是 Cursor 推出的新一代 AI 编程模型,定位"智能与成本的最优平衡"。定价仅 $2.50/百万 token,在 CursorBench 测试中达到约 61% 得分...
阅读原文

YouClaw

YouClaw 是 Chat2DB 团队推出的极简 AI Agent 桌面客户端,定位为 AI 个人助理。工具主打零门槛。无需配置环境、无需代码,下载扫码即可使用。YouClaw支持文...
阅读原文

Granite-4.0-1b-speech

Granite-4.0-1b-speech 是 IBM开源的 10 亿参数多语言语音模型,支持英语、法语、德语、西班牙语、葡萄牙语、日语的语音识别及与英语的双向翻译,支持英语到...
阅读原文

EdgeClaw

EdgeClaw 是面壁智能联合清华、OpenBMB 推出的开源 AI 智能体框架,主打端云协同、本地部署、安全可控。框架首创三层数据安全协议(S1/S2/S3),让公开信息上...
阅读原文
145678183