AI项目和框架

Prompt Manager

Prompt Manager (PromptX)是高效管理 AI 提示词的工具,专为提升 AI 工作效率设计。工具支持个人提示词的创建、编辑、分类和版本管理。通过智能分类和全局...
阅读原文

FrogBoss

FrogBoss 是微软研究院推出的系列编程模型。模型通过创新的复杂漏洞生成方法(BugPilot)进行训练,该方法通过让语言模型代理(LLM)在代码库中添加新功能来...
阅读原文

OpenWork

OpenWork 是开源的桌面应用程序,为知识工作者提供类似 “Claude Cowork” 风格的工作流程。OpenWork 基于 OpenCode构建,提供简洁的引导式操作界面。
阅读原文

TranslateGemma

TranslateGemma 是谷歌推出的基于 Gemma 3 的新一代开源系列翻译模型。模型通过监督微调和强化学习相结合的方式,支持 55 种语言的高质量翻译,显著提升翻译...
阅读原文

FLUX.2 [klein]

FLUX.2 [klein] 是 Black Forest Labs 开源的高效图像生成与编辑模型。模型具备亚秒级推理速度,能在 0.5 秒内完成高质量图像生成和编辑,支持文生图、图生图...
阅读原文

AgentCPM-Explore

AgentCPM-Explore 是清华大学、中国人民大学、面壁智能和 OpenBMB 开源社区联合推出的开源智能体模型。模型基于仅 4B 参数,在多个长程任务评测基准上超越同...
阅读原文

ArenaRL

ArenaRL 是通义 DeepResearch 团队联合高德开源的,面向开放域智能体的对比式强化学习方法。ArenaRL通过引入锦标赛机制,将传统的绝对打分转变为组内相对排序...
阅读原文

Step-Audio-R1.1

Step-Audio-R1.1 是阶跃星辰推出的全球首个开源原生语音推理模型。模型以96.4%的准确率登顶全球权威语音推理榜单,超越众多一线模型。模型具备深度语音推理、...
阅读原文

MedGemma 1.5

MedGemma 1.5 是谷歌开源的多模态AI医学模型,专为处理医学影像和文本数据设计。模型支持高维医学影像(如CT和MRI)、全切片病理影像、纵向影像分析、解剖定...
阅读原文

司农

司农(司农大语言模型)是南京农业大学推出的面向农业领域的垂直大模型。模型依托南农的学科优势,收集了涵盖多农业学科的超40亿token数据,包括书籍、论文、...
阅读原文

OctoCodingBench

OctoCodingBench是MiniMax开源的针对Coding Agent的指令遵循能力的评测集。OctoCodingBench通过模拟真实软件开发场景,从系统约束、用户指令、项目规范、技能...
阅读原文

GLM-Image

GLM-Image 是智谱联合华为开源的新一代多模态图像生成模型,基于昇腾 Atlas 800T A2 设备和昇思 MindSpore 框架训练,是首个全流程国产芯片训练的 SOTA 模型。
阅读原文

VidBee

VidBee 是开源的视频下载工具,基于强大的 yt-dlp 引擎开发。工具能帮助用户轻松下载全球 1000 多个网站的音视频内容,包含热门的 YouTube、Bilibili,和小众...
阅读原文

BabyVision

BabyVision是 UniPat AI团队推出的多模态理解评测集,评估多模态语言模型(MLLMs)和图像生成模型在视觉推理任务上的表现。包含两个主要赛道:MLLM评估和生成...
阅读原文

PixVerse R1

PixVerse R1 是爱诗科技(PixVerse)推出的全球首个通用实时世界模型,标志着AI视频生成从“预录制”迈向“实时动态生成”的重大突破。R1通过三大核心技术实现创...
阅读原文
12627282930193