AI项目和框架

豆包1.5·UI-TARS

豆包1.5·UI-TARS是字节豆包推出的面向图形界面交互(GUI)的Agent模型。模型基于感知、推理和动作执行等类人能力,与图形界面进行连续、流畅的交互。模型将视...
阅读原文

Codex CLI

Codex CLI 是 OpenAI 推出的轻量级终端运行编码智能体。Codex CLI基于自然语言指令帮助开发者高效生成代码、执行文件操作和进行版本控制。Codex CLI 支持代码...
阅读原文

Neural4D 2o

Neural4D 2o 是 DreamTech 推出的全球首个支持多模态交互的 3D 大模型。模型基于文本、图像、3D 和运动数据的联合训练,实现 3D 生成的上下文一致性、高精准...
阅读原文

BlenderMCP

BlenderMCP是将Blender与Claude AI基于模型上下文协议(MCP)集成的工具。BlenderMCP用socket服务器实现Blender与AI的双向通信,支持创建、修改和删除3D对象...
阅读原文

OpenAI o4-mini

OpenAI o4-mini 是OpenAI推出的小型推理模型,专为快速、经济高效的推理而优化。OpenAI o4-mini 在数学、编程和视觉任务方面表现出色,是 AIME 2024 和 2025 ...
阅读原文

Magnitude

Magnitude 是开源的视觉 AI Agents驱动的端到端测试框架。Magnitude基于自然语言构建测试用例,用强大的推理代理规划和调整测试流程,基于快速的视觉代理执行...
阅读原文

Kimina-Prover

Kimina-Prover是月之暗面与Numina团队合作推出的大型数学定理证明模型,模型采用大规模强化学习训练,能以类似人类的方式进行推理,在Lean 4语言中严谨地证明...
阅读原文

GLM-Z1-32B

GLM-Z1-32B是智谱公司开源的新一代推理模型,具体参数版本为GLM-Z1-32B-0414 。GLM-Z1-32B基于 GLM-4-32B-0414 基座模型开发,基于深度优化训练,在数学、代...
阅读原文

交交

交交是上海交通大学听觉认知与计算声学实验室推出的全球首个纯学术界自研的口语对话情感大模型。交交具备多人对话、多语言交流、方言理解、角色扮演、情感互...
阅读原文

可灵2.0

可灵2.0是快手推出的新一代 AI 视频生成模型,现已上线可灵AI视频平台。平台更新包含可灵2.0(大师版)和可图2.0两大基础模型。可图2.0大幅提升图片生成质量...
阅读原文

MedReason

MedReason是美国加州大学圣克鲁斯分校、加拿大不列颠哥伦比亚大学、新加坡南洋理工大学等机构推出的医学推理框架,基于知识图谱提升大型语言模型(LLMs)在医...
阅读原文

Seaweed-7B

Seaweed-7B 是字节跳动团队推出的视频生成模型,拥有约 70 亿参数。Seaweed-7B具备强大的视频生成能力。模型支持从文本描述、图像或音频生成高质量的视频内容...
阅读原文

Agent Development Kit

Agent Development Kit(ADK)是谷歌开源的首个AI智能体开发工具包,是一个代码优先的Python工具包,简化复杂AI代理的构建、评估和部署过程。ADK支持多智能体...
阅读原文

MiniMax MCP Server

MiniMax MCP Server 是 MiniMax 稀宇科技推出的基于模型上下文协议(MCP)的多模态生成服务器。通过简单的文本输入,可调用视频生成、图像生成、语音生成及声...
阅读原文

BiliNote

BiliNote 是开源的 AI 视频笔记助手,支持基于哔哩哔哩、YouTube 等视频链接,自动提取视频内容生成结构清晰、重点明确的 Markdown 格式笔记。
阅读原文
12425262728131