AI工具

Responses API

Responses API 是 OpenAI 推出的用在构建 AI Agents 的核心接口,Responses API是 Chat Completions API 的升级版,结合 Assistants API 的工具调用能力,支...
阅读原文

MHA2MLA

MHA2MLA是复旦大学、华东师范大学、上海AI Lab等机构联合推出的数据高效的微调方法,基于引入DeepSeek的多头潜在注意力机制(MLA),优化任何基于Transformer...
阅读原文

GaussianAnything

GaussianAnything 是南洋理工大学 S-Lab 联合上海 AI Lab 等机构推出的 3D 生成框架。GaussianAnything 基于交互式的点云结构化潜空间和级联的流匹配模型,实...
阅读原文

DeepSeek百宝箱

DeepSeek百宝箱是 DeepSeek 团队维护的 GitHub 项目,展示如何将 DeepSeek API 集成到各种流行软件中。项目列出了一系列支持 DeepSeek 的工具和应用,涵盖了...

Anus

Anus(Autonomous Networked Utility System)是 Manus 生成的开源自主智能体项目,复刻 Manus 的部分功能。Anus支持自然语言指令执行、多代理协作、网络交互...
阅读原文

绘蛙·创意文生图

绘蛙·创意文生图是阿里绘蛙推出的AI图像生成工具。基于提供详细的文本提示(Prompt),帮助用户生成具有特定风格、场景和氛围感的图像。绘蛙-创意文生图用精...
阅读原文

MeshPad

MeshPad 是基于草图输入的交互式艺术化网格生成与编辑工具,能将简单的二维草图迅速转化为高质量的 3D 网格模型,支持实时编辑。用户在草图上添加或删除线条...
阅读原文

StudyX

StudyX是面向学生的AI学习助手,基于AI技术帮助学生高效完成作业和提升学习效率。StudyX支持多学科的即时作业解答,提供分步解析和详细解释,尤其在数学解题...
阅读原文

TrajectoryCrafter

TrajectoryCrafter 是腾讯PCG ARC Lab和香港中文大学推出的,用在单目视频的相机轨迹重定向方法,支持在后期自由调整视频的相机位置和角度,轻松改变视频中的...
阅读原文

LanPaint

LanPaint 是 为Stable Diffusion 模型设计的高质量图像修复工具,无需额外训练实现精准的图像修复和替换。LanPaint基于多轮迭代推理优化修复效果,支持无缝且...
阅读原文

Macro PDF

Macro PDF 是 AI PDF 编辑器,专为学术、法律和金融领域的专业人士设计。通过强大的 AI 技术,将复杂的 PDF 文档转化为智能文档,帮助用户快速提取关键信息、...
阅读原文

START

START(Self-Taught Reasoner with Tools)是阿里巴巴集团和中国科学技术大学推出的新型工具增强型推理模型,结合外部工具(如Python代码执行器)提升大型语...
阅读原文

SeedFoley

SeedFoley 是字节跳动豆包大模型语音团队开发的端到端视频音效生成模型,为视频创作提供智能音效生成服务。通过融合时空视频特征与扩散生成模型,实现音效与...
阅读原文

R1-Omni

R1-Omni 是阿里通义推出的基于强化学习(RLVR)的全模态大语言模型,专注于情感识别任务。通过结合视觉和音频信息,能清晰地解释情感识别的推理过程,展现出...
阅读原文

灵犀 X2

灵犀X2是智元机器人推出的最新双足人形机器人。全身拥有28个自由度,搭载小脑控制器Xyber-Edge、域控制器Xyber-DCU和智能电源管理系统Xyber-BMS,机械结构上...
阅读原文
12627282930208