AI项目和框架

Maestro

Maestro是用在移动和Web应用的端到端自动化测试框架。基于内置的容错能力和延迟容忍机制，解决传统测试中常见的不稳定性和等待问题。Maestro基于声明式语法，...

阅读原文

AI工具

1年前 (2025)

OLMo 2 32B

OLMo 2 32B 是 Allen Institute for AI（Ai2）推出的最新开源语言模型，是 OLMo 2 系列的重要成果。拥有 320 亿参数，是首个在多技能学术基准测试中超越 GPT-...

阅读原文

AI工具

1年前 (2025)

UniFluid

UniFluid 是谷歌 DeepMind 和麻省理工学院联合推出的，统一的自回归框架，用在联合视觉生成和理解任务。基于连续视觉标记处理多模态图像和文本输入，生成离散...

阅读原文

AI工具

1年前 (2025)

Multi-Speaker

Multi-Speaker是AudioShake推出的全球首个高分辨率多说话人分离模型。支持将音频中的多个说话人精准分离到不同轨道，解决传统音频工具在处理重叠语音时的难题...

阅读原文

AI工具

1年前 (2025)

UniAct

UniAct 是新型的具身基础模型框架，解决不同机器人之间行为异构性的问题。通过学习通用行为，捕捉不同机器人共享的原子行为特征，消除因物理形态和控制接口差...

阅读原文

AI工具

1年前 (2025)

ReCamMaster

ReCamMaster 是浙江大学、快手科技等联合推出的视频重渲染框架，能根据新的相机轨迹重新生成视频内容。通过预训练模型和帧维度条件机制，结合多相机同步数据...

阅读原文

AI工具

1年前 (2025)

Stable Virtual Camera

Stable Virtual Camera 是 Stability AI 推出的 AI 模型，能将 2D 图像转换为具有真实深度和透视感的 3D 视频。用户可以通过指定相机轨迹和多种动态路径（如...

阅读原文

AI工具

1年前 (2025)

Cube 3D

Cube 3D 是 Roblox 推出的AI 3D生成大模型，基于 AI 技术高效生成 3D 模型和环境。Cube 3D支持直接从文本描述生成完整的 3D 对象，与游戏引擎兼容。Cube 3D能...

阅读原文

AI工具

1年前 (2025)

SmolDocling

SmolDocling（SmolDocling-256M-preview ）是高效轻量级的多模态文档处理模型。能将文档图像端到端地转换为结构化文本，支持文本、公式、图表等多种元素识别...

阅读原文

AI工具

1年前 (2025)

GR00T N1

GR00T N1 是英伟达推出的全球首个开源基础模型，专为通用人形机器人设计。基于多模态输入（如语言和图像）实现多样化环境中的操作任务。GR00T N1 基于大规模...

阅读原文

AI工具

1年前 (2025)

LangManus

LangManus 是 AI 自动化框架，基于分层多智能体系统设计。包含多种智能体，如协调员、规划员、研究员、程序员等，各司其职，协同完成复杂任务。框架支持多种...

阅读原文

AI工具

1年前 (2025)

Claude 3.7 Max

Claude 3.7 Max 是 Cursor 推出的专为复杂代码任务设计的最新 AI 模型，称为史上最强代码助手。基于 Claude 3.7 思考模型，具备 200k 超大上下文窗口，支持处...

阅读原文

AI工具

1年前 (2025)

Skywork R1V

Skywork R1V是昆仑万维开源的首款工业界多模态思维链推理模型，具备强大的视觉链式推理能力。Skywork R1V能对视觉输入进行多步逻辑推理，解决复杂的视觉任务...

阅读原文

AI工具

1年前 (2025)

Chirp 3

Chirp 3 是谷歌云推出的高清语音合成模型，专为生成自然、生动的语音而设计。支持 248 种声音和 31 种语言，能捕捉人类语调的细微差别，语音输出更加贴近真实...

阅读原文

AI工具

1年前 (2025)

I2V3D

I2V3D是香港城市大学和微软 GenAI创新的图像到视频生成框架，支持将静态图像转换为动态视频，基于3D几何引导实现精确的动画控制。I2V3D结合传统计算机图形学...

阅读原文

AI工具

1年前 (2025)

1…99 100101102 103…196