AI项目和框架

Kimi K2-0905

Kimi K2-0905是月之暗面科技有限公司推出的AI大模型最新版本。模型在原有基础上进行增强,特别是在编程能力上,支持高达256K的上下文长度,远超之前的128K。
阅读原文

Apertus

Apertus是瑞士EPFL、ETH Zurich和瑞士国家超级计算中心(CSCS)联合推出的瑞士首个大规模开放、多语言的大型语言模型,有70B和8B两个参数版本。
阅读原文

RealDevWorld

RealDevWorld 是 MetaGPT 团队开发的新一代自动化测试工具。基于多智能体框架,通过模拟真实开发团队的工作流程,将需求分析、测试用例生成、代码调试到最终...
阅读原文

Prompt Tools

Prompt Tools 是开源的桌面应用程序,能帮助用户高效管理 AI 提示词(Prompt)。工具支持跨平台运行(Windows、macOS、Linux),提供快速、安全的体验。
阅读原文

编码面试解题助手

编码面试解题助手是面向中文用户的编程辅助工具,能通过快捷键抓取屏幕上的编程题目,实时借助AI生成解题思路和代码。
阅读原文

USO

USO(Unified Style-Subject Optimized)是字节跳动 UXO 团队推出的 AI 绘画模型。能将任何主题与任何风格在任何场景中自由组合,生成具有高度主体一致性、强...
阅读原文

AgentScope 1.0

AgentScope 1.0 是阿里通义开源的多智能体开发框架,通过三层技术架构,AgentScope核心框架、AgentScope Runtime 和 AgentScope Studio,提供从开发到部署的...
阅读原文

HunyuanWorld-Voyager

HunyuanWorld-Voyager(简称混元Voyager)是腾讯推出的业界首个支持原生3D重建的超长漫游世界模型。是新颖的视频扩散框架,能从单张图片生成用户定义相机路径...
阅读原文

AudioStory

AudioStory 是腾讯 ARC 实验室发布的音频生成技术,能根据自然语言描述生成高质量的长篇叙事音频。采用分而治之策略,将复杂叙事请求拆解为有序子任务,通过...
阅读原文

Open-Fiesta

Open-Fiesta 是开源的多模型 AI 聊天平台,基于 Next.js 14 构建。平台支持多种 AI 提供商(如 Gemini、OpenRouter 等)和多种模型,用户能同时选择 5 种模型...
阅读原文

Step-Audio 2 mini

Step-Audio 2 mini 是阶跃星辰发布的开源端到端语音大模型。突破传统语音模型结构,采用真端到端多模态架构,直接将原始音频输入转化为语音响应输出,时延更...
阅读原文

MobileCLIP2

MobileCLIP2是苹果公司研究人员推出的高效端侧多模态模型,是MobileCLIP的升级版本。在多模态强化训练方面进行了优化,通过在DFN数据集上训练性能更优的CLIP...
阅读原文

MAI-1-preview

MAI-1-preview 是微软人工智能团队推出的端到端训练的基础模型,为用户提供遵循指令和回答日常查询的能力。
阅读原文

InternVL3.5

InternVL3.5(书生·万象3.5)是上海人工智能实验室开源的多模态大模型,模型在通用能力、推理能力和部署效率上全面升级,提供从10亿到2410亿参数的九种尺寸版...
阅读原文

MAI-Voice-1

MAI-Voice-1 是微软人工智能团队推出的首个具有高度表现力和自然的语音生成模型。模型能在单个 GPU 上不到一秒钟内生成一分钟的音频,是目前最高效的语音系统...
阅读原文
13031323334170