AI项目和框架 - 第 49 页

Jamba Reasoning 3B

Jamba Reasoning 3B 是 AI21 Labs 推出的轻量级高效推理模型，拥有 30 亿参数和 256K 的超长上下文处理能力。模型用混合 Transformer-Mamba 架构，结合注意力...

阅读原文

AI工具

8个月前

UserLM-8b

UserLM-8b是微软推出的用户语言模型（User Language Model），专门用在模拟对话中的“用户”角色，不是常见的“助手”角色。

阅读原文

AI工具

8个月前

Imagine v0.9

Imagine v0.9 是 xAI 公司推出的最新视频生成模型。模型能在不到20秒内生成6秒左右的视频，支持运动控制、动态相机效果、自然对话添加等功能，且配备语音优先...

阅读原文

AI工具

8个月前

OpenAgents

OpenAgents 是用在构建AI Agent网络的开源框架，将Agent连接到网络实现开放式协作。框架通过创建持久化的Agent网络，让Agent能像人类一样长期在线、相互协作...

阅读原文

AI工具

8个月前

Ling-1T

Ling-1T 是蚂蚁集团开源的万亿参数语言模型，定位为“旗舰级非思考模型”。基于 MoE（Mixture of Experts）架构，拥有 1 万亿参数，每次推理激活约 510 亿参数...

阅读原文

AI工具

8个月前

Gemini 2.5 Computer Use

Gemini 2.5 Computer Use 是谷歌 DeepMind 推出的基于 Gemini 2.5 的计算机使用模型。模型能让 AI 直接控制浏览器，执行点击、滚动和输入等操作。

阅读原文

AI工具

8个月前

DeepScientist

DeepScientist 是西湖大学等机构提出的自主科研系统，实现从假设生成到实验验证、再到结果分析与论文撰写的全流程自动化。通过多智能体架构与强化学习策略，...

阅读原文

AI工具

8个月前

SceneGen

SceneGen是上海交通大学研究团队开发的高效开源3D场景生成框架。能从单张场景图像及其对应的物体分割掩码出发，通过一次前向传播，直接生成包含完整几何结构...

阅读原文

AI工具

8个月前

Ming-UniAudio

Ming-UniAudio 是蚂蚁集团开源的音频多模态模型，统一语音理解、生成和编辑任务。核心是 MingTok-Audio，一个基于 VAE 框架和因果 Transformer 架构的连续语...

阅读原文

AI工具

8个月前

Agent Kit

Agent Kit 是 OpenAI 推出的一套完整的智能体开发工具包，帮助开发者将 AI 代理从原型快速推进至生产环境。包含三大核心组件：Agent Builder可视化画布工具，...

阅读原文

AI工具

8个月前

Code2Video

Code2Video是新加坡国立大学Show Lab团队开发的AI教学视频生成框架，通过Python代码自动生成高质量教育视频。核心创新在于采用三智能体协作模式：Planner负责...

阅读原文

AI工具

8个月前

OpenLens AI

OpenLens AI 是清华大学自动化系推出的专为医学研究设计的全自主人工智能研究助手，通过多智能体协作，实现从文献综述、实验设计、数据分析到论文生成的全流...

阅读原文

AI工具

8个月前

ReceiptHero

ReceiptHero 是开源的 AI 记账工具，能通过拍照将收据快速转化为数字化账单。工具基于先进的 AI 图像识别技术，用高达 95% 的准确率提取收据上的日期、金额、...

阅读原文

AI工具

8个月前

AIMangaStudio

AIMangaStudio是开源的AI漫画创作工具，为创作者提供了一套完整的漫画创作流水线，包括剧情生成、分镜设计、角色设定等功能，能简化从脚本到漫画页面的制作流...

阅读原文

AI工具

8个月前

TRUEBench

TRUEBench（Trustworthy Real-world Usage Evaluation Benchmark）是三星电子推出的 AI 基准测试工具，用在评估人工智能在实际工作场景中的生产力，解决现有A...

阅读原文

AI工具

8个月前