AI项目和框架

GPT-5.1-Codex-Max

GPT-5.1-Codex-Max 是 OpenAI 推出的智能编程模型,专为复杂、长周期的开发任务设计。模型基于更新的推理架构,通过“压缩”技术跨越多个上下文窗口,能处理数...
阅读原文

LoopTool

LoopTool 是上海交通大学和小红书团队推出的自动化、模型感知、迭代式的数据进化框架,能提升大语言模型(LLM)在工具调用任务上的性能。框架通过闭环优化,...
阅读原文

SAM 3D

SAM 3D 是 Meta 推出的先进 3D 重建模型,包含 SAM 3D Objects 和 SAM 3D Body 两个子模型。SAM 3D Objects 能从单张图像重建物体和场景的 3D 模型,支持多视...
阅读原文

Argus 1.0

Argus 1.0 是如视发布的全球首个支持全景图输入的空间大模型。基于如视积累的近百万套真实高清空间数据训练而成,采用 Transformer 架构,具备毫秒级实时重建...
阅读原文

Generative UI

Generative UI 是谷歌推出的创新 AI 技术,能让 AI 根据用户的自然语言提示即时生成完整的、可交互的用户界面。界面可以是网页、工具、游戏或教育应用,完全...
阅读原文

MemOS

MemOS 是开源的 AI 记忆管理操作系统,能为智能体和 AI 应用提供长期记忆能力。MemOS通过统一的记忆抽象层,支持多种记忆类型(如文本记忆、激活记忆、参数记...
阅读原文

Skywork R1V4-Lite

Skywork R1V4-Lite 是昆仑万维推出的轻量级多模态智能体。Skywork R1V4-Lite 集成视觉操作、深度推理与任务规划三大能力,能通过主动图像操作(如裁切、放大...
阅读原文

Gemini 3

Gemini 3 是谷歌最新推出的AI模型,被誉为全球最先进的多模态理解与推理模型。模型具备强大的推理能力,刷新多项基准测试记录,如在 LMArena Leaderboard 上...
阅读原文

ChatTutor

ChatTutor是全新一代的可视化交互式AI教师系统,通过实时同步画板实现“边讲解、边绘制、边推演”的类人教学体验。覆盖数学、物理、逻辑电路、编程和思维导图等...
阅读原文

WeatherNext 2

WeatherNext 2是谷歌旗下DeepMind与Google Research联合推出了新一代AI天气预报模型。模型采用Functional Generative Network(FGN)架构,运算速度较前代提...
阅读原文

EverMemOS

EverMemOS 是陈天桥领导的盛大团队推出的开源长期记忆操作系统,为 AI 助手提供持久、可检索的记忆能力。受人脑记忆机制启发,采用四层架构设计,包括代理层...
阅读原文

DPAI Arena

DPAI Arena 是 JetBrains 与 Linux 基金会合作推出的开放式 AI 编码智能体基准测试平台,能衡量 AI 工具在多语言、多框架和多工作流中的实际开发效率,基于多...
阅读原文

Lumine

Lumine是字节跳动推出的在3D开放世界游戏中实时感知、推理和行动的通用AI智能体。Lumine基于Qwen2-VL-7B-Base模型,通过类人交互范式,将感知、思考和行动整...
阅读原文

Bee

Bee是清华大学和腾讯混元团队联合推出的高质量多模态大语言模型(MLLM)项目,解决开源模型因数据质量不足导致的性能瓶颈。项目的核心贡献包括:Honey-Data-1...
阅读原文

InfinityStar

InfinityStar 是字节跳动推出的高效视频生成模型,通过统一的时空自回归框架,实现了高分辨率图像和动态视频的快速合成。模型采用时空金字塔结构,将视频分解...
阅读原文
123156