AI项目和框架

AgentCPM-Explore

AgentCPM-Explore 是清华大学、中国人民大学、面壁智能和 OpenBMB 开源社区联合推出的开源智能体模型。模型基于仅 4B 参数,在多个长程任务评测基准上超越同...
阅读原文

ArenaRL

ArenaRL 是通义 DeepResearch 团队联合高德开源的,面向开放域智能体的对比式强化学习方法。ArenaRL通过引入锦标赛机制,将传统的绝对打分转变为组内相对排序...
阅读原文

Step-Audio-R1.1

Step-Audio-R1.1 是阶跃星辰推出的全球首个开源原生语音推理模型。模型以96.4%的准确率登顶全球权威语音推理榜单,超越众多一线模型。模型具备深度语音推理、...
阅读原文

MedGemma 1.5

MedGemma 1.5 是谷歌开源的多模态AI医学模型,专为处理医学影像和文本数据设计。模型支持高维医学影像(如CT和MRI)、全切片病理影像、纵向影像分析、解剖定...
阅读原文

司农

司农(司农大语言模型)是南京农业大学推出的面向农业领域的垂直大模型。模型依托南农的学科优势,收集了涵盖多农业学科的超40亿token数据,包括书籍、论文、...
阅读原文

OctoCodingBench

OctoCodingBench是MiniMax开源的针对Coding Agent的指令遵循能力的评测集。OctoCodingBench通过模拟真实软件开发场景,从系统约束、用户指令、项目规范、技能...
阅读原文

GLM-Image

GLM-Image 是智谱联合华为开源的新一代多模态图像生成模型,基于昇腾 Atlas 800T A2 设备和昇思 MindSpore 框架训练,是首个全流程国产芯片训练的 SOTA 模型。
阅读原文

VidBee

VidBee 是开源的视频下载工具,基于强大的 yt-dlp 引擎开发。工具能帮助用户轻松下载全球 1000 多个网站的音视频内容,包含热门的 YouTube、Bilibili,和小众...
阅读原文

BabyVision

BabyVision是 UniPat AI团队推出的多模态理解评测集,评估多模态语言模型(MLLMs)和图像生成模型在视觉推理任务上的表现。包含两个主要赛道:MLLM评估和生成...
阅读原文

PixVerse R1

PixVerse R1 是爱诗科技(PixVerse)推出的全球首个通用实时世界模型,标志着AI视频生成从“预录制”迈向“实时动态生成”的重大突破。R1通过三大核心技术实现创...
阅读原文

Baichuan-M3

Baichuan-M3是百川智能正式发布的新一代开源医疗增强大语言模型。模型在问诊能力、医疗幻觉控制以及Healthbench和Healthbench Hard评测中均排名第一,超越了O...
阅读原文

女娲智能体OS

女娲智能体OS(Nuwax Agent OS)是全球首个产品级开源的通用智能体操作系统。女娲智能体OS支持将AI从单纯的对话工具转变为企业的智能执行者,通过自主执行引...
阅读原文

Oh My OpenCode

Oh My OpenCode 是为 AI 编程助手设计的开源增强插件,能让 AI (如OpenCode )像真正的开发团队一样高效协作,提升编程体验。工具通过集成多种 AI 模型(如 ...
阅读原文

Spirit-v1.5

Spirit-v1.5 是千寻智能推出的具身智能基础模型。模型采用多样化、开放式的数据采集方式,摒弃传统“干净数据”的限制,让模型在预训练阶段接触更丰富的动作和...
阅读原文

Obsidian-skills

Obsidian-skills 是 Obsidian 团队开发的一组开源工具,帮助用户更好地将 AI 工具(如 Claude Code)与 Obsidian 笔记系统结合使用。包含三大核心技能:obsid...
阅读原文
123166