AI项目和框架 - 第 2 页

LingBot-Vision

LingBot-Vision 是蚂蚁灵波科技开源的通用视觉基座模型，业内首创以边界结构为预训练目标，采用几何建模方式实现空间感知训练范式突破。

阅读原文

AI工具

6天前

motion-anything

motion-anything 是 Open Design 团队开源的本地优先动效引擎，定位为免费版 Figma Motion + 无水印动效视频工坊。工具让动效直接活在真实运行的网页上，所见...

阅读原文

AI工具

6天前

SayIt

SayIt 是开源的 AI 语音输入法，基于 Rust 构建，支持 Windows 桌面端。用户按住快捷键说话，可将口语实时转为可直接使用的书面文字。

阅读原文

AI工具

6天前

Nemotron-Labs-Diffusion

Nemotron-Labs-Diffusion 是 NVIDIA 推出的三模式语言模型，在单一架构内统一自回归、扩散和自我推测解码。通过联合 AR-扩散目标训练，模型可在不同并发场景...

阅读原文

AI工具

6天前

MoWorld

MoWorld 是魔芯科技推出的全球首个高帧率交互式世界模型，基于纯国产华为昇腾 NPU 全栈优化，实现最高 50 FPS 实时推理，成本较 GPU 降低 70%。

阅读原文

AI工具

6天前

LingBot-Depth 2.0

LingBot-Depth 2.0 是蚂蚁灵波科技发布的面向真实场景的深度补全模型，同步开源视觉基座模型 LingBot-Vision。训练数据从 300 万扩充至 1.5 亿，在 16 项深度...

阅读原文

AI工具

7天前

MemGUI-Agent

MemGUI-Agent 是浙大与快手联合推出的长程手机GUI智能体，专为跨App、多步骤、长链条的移动端自动化任务设计。

阅读原文

AI工具

7天前

InternAgentS

InternAgentS 是上海AI实验室开源的国产科研智能体工作台，面向 AI for Science 场景，将论文阅读、实验分析、代码迭代、远程计算、科研写作等分散环节整合到...

阅读原文

AI工具

7天前

OpenScience

OpenScience 是 Synthetic Sciences 推出的开源AI 科研工作台，面向机器学习、生物学、物理学和化学研究。平台支持从文献综述、假设生成、代码编写、实验执行...

阅读原文

AI工具

1周前

GenEvolve

GenEvolve 是香港科技大学（广州）、美团与新加坡国立大学联合推出的自演进图像生成 Agent。GenEvolve 将开放式图像生成形式化为工具编排的视觉轨迹，Agent ...

阅读原文

AI工具

1周前

GPT-Realtime-2.1

GPT-Realtime-2.1是OpenAI推出的新一代实时语音模型。2.1旗舰版显著提升了字母数字识别、静音噪音处理及中断响应能力，支持语音、文本和图像输入，具备强大推...

阅读原文

AI工具

1周前

Fun-ASR-Realtime

Fun-ASR-Realtime 是阿里千问推出的流式实时语音识别大模型。模型通过 WebSocket 流式协议实现边说边出字，首字延迟百毫秒，尾字延迟同样极低。

阅读原文

AI工具

1周前

Hy3

Hy3 是腾讯混元开源的 295B 参数混合专家（MoE）模型。模型在 Agent 能力、推理与长上下文任务上显著进步，多项基准比肩参数规模 2-5 倍的旗舰模型。

阅读原文

AI工具

1周前

Claude

FuckClaude 是轻量、SEO 友好、中英双语的单页浏览器检测工具，用于扫描用户的浏览器环境并判断其是否会被 Claude Code 标记为"中国用户"。点击运...

阅读原文

AI工具

1周前

Elements Claw

ElementsClaw 是阿里达摩院联合中国人民大学、中国科学院大学推出的行业首个超导材料发现 AI 智能体，采用专通融合架构，将 10 亿参数原子基础模型 Elements ...

阅读原文

AI工具

1周前