AI项目和框架

Skywork-OR1

Skywork-OR1(Open Reasoner 1)是昆仑万维推出的开源高性能推理模型系列，模型突破大模型在逻辑推理和复杂任务求解方面的能力瓶颈。Skywork-OR1包含三款模型，...

阅读原文

AI工具

1年前 (2025)

UNO

UNO是字节跳动推出创新的AI图像生成框架，突破传统模型在多主体生成中的局限。通过“少到多”的泛化方法，能高质量地生成单主体和多主体图像，解决了多主体场景...

阅读原文

AI工具

1年前 (2025)

AgentPrune

AgentPrune 是同济大学、香港中文大学等机构联合提出的针对大型语言模型（LLM）驱动的多智能体系统通信优化框架，通过“剪枝”技术，剔除冗余或有害的通信内容...

阅读原文

AI工具

1年前 (2025)

心影大模型

心影大模型是心影随形顶尖AI团队研发的AI大模型，正式通过国家生成式人工智能服务备案。模型专注于游戏领域，深度融合游戏攻略与角色陪伴场景，全面应用于“逗...

阅读原文

AI工具

1年前 (2025)

FlexIP

FlexIP 是腾讯提出的面向图像合成的灵活主体属性编辑框架，平衡图像生成中的身份保持和个性化编辑。框架采用双适配器架构，将身份保持与个性化编辑解耦，通过...

阅读原文

AI工具

1年前 (2025)

明岐

明岐是上海交通大学计算机学院LoCCS实验室推出的首个精准诊断罕见病的医学多模态大模型。基于“大模型能力矩阵 + 专家路由协同”的双引擎驱动架构，整合医学影...

阅读原文

AI工具

1年前 (2025)

Fourier N1

Fourier N1 是通用机器人公司傅利叶发布的首款开源人形机器人。身高1.3米，体重38公斤，拥有23个自由度，采用铝合金与工程塑料复合结构，兼具强度与灵活性。...

阅读原文

AI工具

1年前 (2025)

Kimi-VL

Kimi-VL 是月之暗面开源的轻量级多模态视觉语言模型，基于 Mixture-of-Experts (MoE) 架构，总参数量为16B，推理时仅激活2.8B。Kimi-VL具备强大的多模态推理...

阅读原文

AI工具

1年前 (2025)

FantasyTalking

FantasyTalking 是阿里巴巴 AMAP 团队和北京邮电大学联合提出的新型框架，用于从单张静态肖像生成逼真的可动画化虚拟形象。基于预训练的视频扩散变换器模型，...

阅读原文

AI工具

1年前 (2025)

BrowseComp

BrowseComp 是 OpenAI 开源的用于评估 AI 代理网络浏览能力的基准测试。包含 1266 个极具挑战性的问题，覆盖电影、科学与技术、艺术、历史、体育、音乐、电子...

阅读原文

AI工具

1年前 (2025)

日日新SenseNova V6

日日新SenseNova V6是商汤推出的日日新第六代多模态融合大模型系列，基于6000亿参数的多模态MoE架构，实现文本、图像和视频的原生融合。日日新SenseNova V6在...

阅读原文

AI工具

1年前 (2025)

DevDocs

DevDocs 是专为程序员和开发者设计的开源技术文档爬取和处理工具，基于智能爬虫技术，快速爬取、整理技术文档，将理解文档的时间从数周缩短至几小时。DevDocs...

阅读原文

AI工具

1年前 (2025)

MoLing

MoLing 是无依赖的本地办公自动化助手，是基于计算机和浏览器使用的 MCP 服务器。MoLing 基于操作系统 API 实现系统交互，支持文件系统操作（如读写、合并、...

阅读原文

AI工具

1年前 (2025)

Multi-SWE-bench

Multi-SWE-bench 是字节跳动豆包大模型团队开源的首个多语言代码修复基准。在SWE-bench基础上，首次覆盖Python之外的7种主流编程语言，包括Java、TypeScript...

阅读原文

AI工具

1年前 (2025)

Gemini 2.5 Flash

Gemini 2.5 Flash 是 Google 推出的高效、低延迟的 AI 模型，基于 Gemini 2.5 模型构建。Gemini 2.5 Flash在保持低延迟和成本效益的同时，引入思考能力。

阅读原文

AI工具

1年前 (2025)

1…91 929394 95…196