AI项目和框架

OpenClacky

OpenClacky 是李亚飞团队开源的 AI Agent,支持一键安装与跨平台运行。工具通过精简工具集、智能上下文压缩和模型路由大幅降低使用成本,让专业人士能全天开...
阅读原文

Mellum2

Mellum2 是 JetBrains 开源的面向软件工程系统的新机器学习模型。模型每 token 仅激活 2.5B 参数,专为软件工程 AI 工作流优化,支持代码生成、智能路由、子 ...
阅读原文

ECC

ECC(Everything Claude Code)是跨平台 AI Agent 性能优化系统。系统为 Claude Code、Codex、Cursor 等 7+ 个 AI 编程工具提供 63 个专业 Agent、249 个按需...
阅读原文

Qwen3.7-Plus

Qwen3.7-Plus 是通义千问推出的新一代多模态大模型,将视觉与语言统一为一体化智能体基座。模型能感知真实世界场景、读取屏幕并操作 GUI、基于视觉参考生成代...
阅读原文

Dubbing v2

Dubbing v2 是 ElevenLabs 推出的 AI 配音模型,支持 29 种语言自动翻译配音,保留原始说话人音色与情感。模型提供双工作流模式,Auto Dub 快速生成预览,Dub...
阅读原文

Cosmos 3

Cosmos 3是英伟达推出的全球首款全开源全模态物理 AI 基础大模型,采用混合 Transformer 架构融合视觉推理、世界生成与动作预测能力。
阅读原文

Webwright

Webwright 是微软研究院开源的终端原生网页智能体框架,仅需约 1000 行代码可让 AI 模型在终端中编写 Playwright 代码、执行 bash 命令、查看日志并反复修正...
阅读原文

ControlFoley

ControlFoley是小米开源的可控视频音效生成模型,能解决V2A领域可控性难题。模型统一支持文本引导、文本控制与参考音频控制三类视频配音任务,通过自研时空音...
阅读原文

MiniMax M3

MiniMax M3是MiniMax推出的全新AI模型,具备领先的编程、Agent与长文本处理能力。模型采用创新的MSA稀疏注意力架构,支持1M超长上下文,效率提升20倍。
阅读原文

Qwen-VLA

Qwen-VLA 是通义实验室推出的通用视觉-语言-动作模型,以 Qwen3.5-4B 为视觉语言主干,搭配 1.15B 参数的 DiT 动作解码器。模型通过统一动作轨迹预测框架,将...
阅读原文

Hermes Desktop

Hermes Desktop 是开发者 sir1st 推出的 Hermes Agent 社区版桌面应用。将 Python 运行时、hermes-agent 核心与 hermes-web-ui 可视化界面打包为单一可执行文...
阅读原文

Gamma-World

Gamma-World 是 NVIDIA 推出的多智能体世界模型,能解决多个智能体在同一个模拟世界中平等交互、全局一致的问题。
阅读原文

美团GEO营销门户

美团 GEO 营销门户是美团推出的生成式引擎优化(GEO)平台,专为 AI 搜索时代设计,帮助品牌在豆包、DeepSeek、文心一言等主流大模型中提升曝光与推荐频次。...
阅读原文

SenseNova-U1-8B-MoT-Infographic

SenseNova-U1-8B-MoT-Infographic 是商汤科技开源的 8B 参数信息图增强模型,基于 SenseNova-U1-8B-MoT 统一架构,通过专项数据训练与 RL 强化学习,显著提升...
阅读原文

MAI-Image-2.5

MAI-Image-2.5 是微软研究院推出的旗舰级文生图模型,为 MAI-Image 系列最强版本。模型在 Arena 文生图排行榜以 1,254 分冲上第 3 名,较前代提升 72 分,打...
阅读原文
123194