AI项目和框架

MiMo-Embodied

MiMo-Embodied 是小米发布的全球首个开源的跨领域具身大模型,整合了自动驾驶和具身智能两大领域的任务,实现了在环境感知、任务规划、空间理解等多方面的卓...
阅读原文

HunyuanVideo 1.5

HunyuanVideo 1.5 是腾讯混元团队开源的轻量级视频生成模型,参数规模为8.3B。模型基于Diffusion Transformer架构,支持通过文字描述或图片生成5-10秒的高清...
阅读原文

Seekdb

Seekdb是OceanBase开源的AI原生数据库,解决AI应用开发中多模态数据融合与实时处理的痛点。支持向量检索、全文搜索与结构化数据过滤的融合查询,一条SQL即可...
阅读原文

SAM 3

SAM 3(Segment Anything Model 3)是 Meta AI 最新推出的先进计算机视觉模型,能通过文本、示例和视觉提示检测、分割和跟踪图像及视频中的对象。
阅读原文

GPT-5.1-Codex-Max

GPT-5.1-Codex-Max 是 OpenAI 推出的智能编程模型,专为复杂、长周期的开发任务设计。模型基于更新的推理架构,通过“压缩”技术跨越多个上下文窗口,能处理数...
阅读原文

LoopTool

LoopTool 是上海交通大学和小红书团队推出的自动化、模型感知、迭代式的数据进化框架,能提升大语言模型(LLM)在工具调用任务上的性能。框架通过闭环优化,...
阅读原文

SAM 3D

SAM 3D 是 Meta 推出的先进 3D 重建模型,包含 SAM 3D Objects 和 SAM 3D Body 两个子模型。SAM 3D Objects 能从单张图像重建物体和场景的 3D 模型,支持多视...
阅读原文

Argus 1.0

Argus 1.0 是如视发布的全球首个支持全景图输入的空间大模型。基于如视积累的近百万套真实高清空间数据训练而成,采用 Transformer 架构,具备毫秒级实时重建...
阅读原文

Generative UI

Generative UI 是谷歌推出的创新 AI 技术,能让 AI 根据用户的自然语言提示即时生成完整的、可交互的用户界面。界面可以是网页、工具、游戏或教育应用,完全...
阅读原文

MemOS

MemOS 是开源的 AI 记忆管理操作系统,能为智能体和 AI 应用提供长期记忆能力。MemOS通过统一的记忆抽象层,支持多种记忆类型(如文本记忆、激活记忆、参数记...
阅读原文

Skywork R1V4-Lite

Skywork R1V4-Lite 是昆仑万维推出的轻量级多模态智能体。Skywork R1V4-Lite 集成视觉操作、深度推理与任务规划三大能力,能通过主动图像操作(如裁切、放大...
阅读原文

Gemini 3

Gemini 3 是谷歌最新推出的AI模型,被誉为全球最先进的多模态理解与推理模型。模型具备强大的推理能力,刷新多项基准测试记录,如在 LMArena Leaderboard 上...
阅读原文

ChatTutor

ChatTutor是全新一代的可视化交互式AI教师系统,通过实时同步画板实现“边讲解、边绘制、边推演”的类人教学体验。覆盖数学、物理、逻辑电路、编程和思维导图等...
阅读原文

WeatherNext 2

WeatherNext 2是谷歌旗下DeepMind与Google Research联合推出了新一代AI天气预报模型。模型采用Functional Generative Network(FGN)架构,运算速度较前代提...
阅读原文

EverMemOS

EverMemOS 是陈天桥领导的盛大团队推出的开源长期记忆操作系统,为 AI 助手提供持久、可检索的记忆能力。受人脑记忆机制启发,采用四层架构设计,包括代理层...
阅读原文
123156