AI项目和框架 - 第 58 页

EmbeddingGemma

EmbeddingGemma是谷歌开源的多语言文本嵌入模型，专为端侧AI设计，支持在笔记本、手机等设备上部署。模型拥有3.08亿参数，基于Gemma 3架构打造，支持100多种...

阅读原文

AI工具

9个月前

OneCAT

OneCAT是美团推出的新型统一多模态模型，采用纯解码器架构，能无缝集成多模态理解、文本到图像生成和图像编辑功能。模型摒弃了传统多模态模型中依赖外部视觉...

阅读原文

AI工具

9个月前

mobile-use

mobile-use是移动端AI Agents工具，支持自然语言控制Android和iOS设备，帮助用户操作手机。用户用日常语言下达指令，工具自动完成任务，如打开应用、填写表单...

阅读原文

AI工具

9个月前

InfinityHuman

InfinityHuman 是字节跳动与浙江大学联合团队推出的商用级长时序音频驱动人物视频生成模型，开启 AI 数字人实用化新篇章。

阅读原文

AI工具

9个月前

Super Agent Party

Super Agent Party 是开源的3D AI桌面伴侣软件，将桌宠、智能助手、知识库、机器人控制等多种功能集于一体。用户能通过Docker或源码快速部署到Windows、macOS...

阅读原文

AI工具

9个月前

Kimi K2-0905

Kimi K2-0905是月之暗面科技有限公司推出的AI大模型最新版本。模型在原有基础上进行增强，特别是在编程能力上，支持高达256K的上下文长度，远超之前的128K。

阅读原文

AI工具

9个月前

Apertus

Apertus是瑞士EPFL、ETH Zurich和瑞士国家超级计算中心（CSCS）联合推出的瑞士首个大规模开放、多语言的大型语言模型，有70B和8B两个参数版本。

阅读原文

AI工具

9个月前

RealDevWorld

RealDevWorld 是 MetaGPT 团队开发的新一代自动化测试工具。基于多智能体框架，通过模拟真实开发团队的工作流程，将需求分析、测试用例生成、代码调试到最终...

阅读原文

AI工具

9个月前

Prompt Tools

Prompt Tools 是开源的桌面应用程序，能帮助用户高效管理 AI 提示词（Prompt）。工具支持跨平台运行（Windows、macOS、Linux），提供快速、安全的体验。

阅读原文

AI工具

9个月前

编码面试解题助手

编码面试解题助手是面向中文用户的编程辅助工具，能通过快捷键抓取屏幕上的编程题目，实时借助AI生成解题思路和代码。

阅读原文

AI工具

9个月前

USO

USO（Unified Style-Subject Optimized）是字节跳动 UXO 团队推出的 AI 绘画模型。能将任何主题与任何风格在任何场景中自由组合，生成具有高度主体一致性、强...

阅读原文

AI工具

9个月前

AgentScope 1.0

AgentScope 1.0 是阿里通义开源的多智能体开发框架，通过三层技术架构，AgentScope核心框架、AgentScope Runtime 和 AgentScope Studio，提供从开发到部署的...

阅读原文

AI工具

9个月前

HunyuanWorld-Voyager

HunyuanWorld-Voyager（简称混元Voyager）是腾讯推出的业界首个支持原生3D重建的超长漫游世界模型。是新颖的视频扩散框架，能从单张图片生成用户定义相机路径...

阅读原文

AI工具

9个月前

AudioStory

AudioStory 是腾讯 ARC 实验室发布的音频生成技术，能根据自然语言描述生成高质量的长篇叙事音频。采用分而治之策略，将复杂叙事请求拆解为有序子任务，通过...

阅读原文

AI工具

10个月前

Open-Fiesta

Open-Fiesta 是开源的多模型 AI 聊天平台，基于 Next.js 14 构建。平台支持多种 AI 提供商（如 Gemini、OpenRouter 等）和多种模型，用户能同时选择 5 种模型...

阅读原文

AI工具

10个月前