AI项目和框架

The AI Scientist-v2

The AI Scientist-v2 是 Sakana AI 、不列颠哥伦比亚大学、Vector研究所等机构联合推出的完全自动生成科学发现的端到端人工智能系统,支持自主地提出科学假设...
阅读原文

Seed-Thinking-v1.5

Seed-Thinking-v1.5 是字节跳动推出的推理智能模型,采用混合专家(MoE)架构,总参数量为 200B,每次激活 20B 参数。模型在多个基准测试中表现出色,如在 AI...
阅读原文

HoloPart

HoloPart 是香港大学、VAST 团队推出的新型扩散模型,支持将 3D 物体分解为完整、可编辑的语义部件,即使部件被遮挡。
阅读原文

Skywork-OR1

Skywork-OR1(Open Reasoner 1)是昆仑万维推出的开源高性能推理模型系列,模型突破大模型在逻辑推理和复杂任务求解方面的能力瓶颈。Skywork-OR1包含三款模型,...
阅读原文

UNO

UNO是字节跳动推出创新的AI图像生成框架,突破传统模型在多主体生成中的局限。通过“少到多”的泛化方法,能高质量地生成单主体和多主体图像,解决了多主体场景...
阅读原文

AgentPrune

AgentPrune 是同济大学、香港中文大学等机构联合提出的针对大型语言模型(LLM)驱动的多智能体系统通信优化框架,通过“剪枝”技术,剔除冗余或有害的通信内容...
阅读原文

心影大模型

心影大模型是心影随形顶尖AI团队研发的AI大模型,正式通过国家生成式人工智能服务备案。模型专注于游戏领域,深度融合游戏攻略与角色陪伴场景,全面应用于“逗...
阅读原文

FlexIP

FlexIP 是腾讯提出的面向图像合成的灵活主体属性编辑框架,平衡图像生成中的身份保持和个性化编辑。框架采用双适配器架构,将身份保持与个性化编辑解耦,通过...
阅读原文

明岐

明岐是上海交通大学计算机学院LoCCS实验室推出的首个精准诊断罕见病的医学多模态大模型。基于“大模型能力矩阵 + 专家路由协同”的双引擎驱动架构,整合医学影...
阅读原文

Fourier N1

Fourier N1 是通用机器人公司傅利叶发布的首款开源人形机器人。身高1.3米,体重38公斤,拥有23个自由度,采用铝合金与工程塑料复合结构,兼具强度与灵活性。...
阅读原文

Kimi-VL

Kimi-VL 是月之暗面开源的轻量级多模态视觉语言模型,基于 Mixture-of-Experts (MoE) 架构,总参数量为16B,推理时仅激活2.8B。Kimi-VL具备强大的多模态推理...
阅读原文

FantasyTalking

FantasyTalking 是阿里巴巴 AMAP 团队和北京邮电大学联合提出的新型框架,用于从单张静态肖像生成逼真的可动画化虚拟形象。基于预训练的视频扩散变换器模型,...
阅读原文

BrowseComp

BrowseComp 是 OpenAI 开源的用于评估 AI 代理网络浏览能力的基准测试。包含 1266 个极具挑战性的问题,覆盖电影、科学与技术、艺术、历史、体育、音乐、电子...
阅读原文

日日新SenseNova V6

日日新SenseNova V6是商汤推出的日日新第六代多模态融合大模型系列,基于6000亿参数的多模态MoE架构,实现文本、图像和视频的原生融合。日日新SenseNova V6在...
阅读原文

DevDocs

DevDocs 是专为程序员和开发者设计的开源技术文档爬取和处理工具,基于智能爬虫技术,快速爬取、整理技术文档,将理解文档的时间从数周缩短至几小时。DevDocs...
阅读原文
189101112114