AI项目和框架

Claudable

Claudable是基于Next.js的开源Web应用构建器,结合了Claude Code和Cursor CLI的先进AI代理能力,以及Lovable简单直观的应用构建体验。用户只需用自然语言描述...
阅读原文

FineVision

FineVision 是 Hugging Face 推出的开源视觉语言数据集,训练先进的视觉语言模型。包含 1730 万张图像、2430 万个样本、8890 万轮对话和 95 亿个答案标记。数...
阅读原文

EmbeddingGemma

EmbeddingGemma是谷歌开源的多语言文本嵌入模型,专为端侧AI设计,支持在笔记本、手机等设备上部署。模型拥有3.08亿参数,基于Gemma 3架构打造,支持100多种...
阅读原文

OneCAT

OneCAT是美团推出的新型统一多模态模型,采用纯解码器架构,能无缝集成多模态理解、文本到图像生成和图像编辑功能。模型摒弃了传统多模态模型中依赖外部视觉...
阅读原文

mobile-use

mobile-use是移动端AI Agents工具,支持自然语言控制Android和iOS设备,帮助用户操作手机。用户用日常语言下达指令,工具自动完成任务,如打开应用、填写表单...
阅读原文

InfinityHuman

InfinityHuman 是字节跳动与浙江大学联合团队推出的商用级长时序音频驱动人物视频生成模型,开启 AI 数字人实用化新篇章。
阅读原文

Super Agent Party

Super Agent Party 是开源的3D AI桌面伴侣软件,将桌宠、智能助手、知识库、机器人控制等多种功能集于一体。用户能通过Docker或源码快速部署到Windows、macOS...
阅读原文

Kimi K2-0905

Kimi K2-0905是月之暗面科技有限公司推出的AI大模型最新版本。模型在原有基础上进行增强,特别是在编程能力上,支持高达256K的上下文长度,远超之前的128K。
阅读原文

Apertus

Apertus是瑞士EPFL、ETH Zurich和瑞士国家超级计算中心(CSCS)联合推出的瑞士首个大规模开放、多语言的大型语言模型,有70B和8B两个参数版本。
阅读原文

RealDevWorld

RealDevWorld 是 MetaGPT 团队开发的新一代自动化测试工具。基于多智能体框架,通过模拟真实开发团队的工作流程,将需求分析、测试用例生成、代码调试到最终...
阅读原文

Prompt Tools

Prompt Tools 是开源的桌面应用程序,能帮助用户高效管理 AI 提示词(Prompt)。工具支持跨平台运行(Windows、macOS、Linux),提供快速、安全的体验。
阅读原文

编码面试解题助手

编码面试解题助手是面向中文用户的编程辅助工具,能通过快捷键抓取屏幕上的编程题目,实时借助AI生成解题思路和代码。
阅读原文

USO

USO(Unified Style-Subject Optimized)是字节跳动 UXO 团队推出的 AI 绘画模型。能将任何主题与任何风格在任何场景中自由组合,生成具有高度主体一致性、强...
阅读原文

AgentScope 1.0

AgentScope 1.0 是阿里通义开源的多智能体开发框架,通过三层技术架构,AgentScope核心框架、AgentScope Runtime 和 AgentScope Studio,提供从开发到部署的...
阅读原文

HunyuanWorld-Voyager

HunyuanWorld-Voyager(简称混元Voyager)是腾讯推出的业界首个支持原生3D重建的超长漫游世界模型。是新颖的视频扩散框架,能从单张图片生成用户定义相机路径...
阅读原文