AI项目和框架

WorldScore

WorldScore 是斯坦福大学提出的用于世界生成模型的统一评估基准。将世界生成分解为一系列的下一个场景生成任务,通过明确的基于相机轨迹的布局规范来实现不同...
阅读原文

SWEET-RL

SWEET-RL是Meta推出的多轮强化学习框架,专门用在训练大型语言模型(LLM)代理进行协作推理任务。SWEET-R基于训练时的额外信息(如参考解决方案)优化“批评者...
阅读原文

OThink-MR1

OThink-MR1是OPPO研究院和香港科技大学(广州)联合推出的多模态语言模型优化框架。基于动态调整Kullback-Leibler(KL)散度策略(GRPO-D)和奖励模型,提升...
阅读原文

DeepSite

DeepSite 是基于 DeepSeek-V3 模型的在线开发工具,用户无需配置环境或安装软件,在网页上直接输入需求,快速生成游戏、应用或网页的代码,支持实时预览效果。
阅读原文

EasyControl Ghibli

EasyControl Ghibli 是基于 EasyControl 框架开发的 AI 模型,已上线 Hugging Face 平台,专注于将普通图像转换为吉卜力风格的图像。仅用100张亚洲人脸照片及...
阅读原文

Dolphin

Dolphin是清华大学电子工程系语音与音频技术实验室联合海天瑞声共同推出的面向东方语言的语音大模型。支持40个东方语种的语音识别,中文语种涵盖22种方言(含...
阅读原文

PaperBench

PaperBench是OpenAI开源的AI智能体评测基准,支持评估智能体复现顶级学术论文的能力。PaperBench要求智能体从理解论文内容到编写代码、执行实验,全面展现从...

AutoAgent

AutoAgent 是香港大学推出的零代码、自动化 LLM 智能体框架。基于自然语言交互,让用户无需编程即可创建智能助手,适用于智能搜索、数据分析、报告生成等场景...
阅读原文

Amodal3R

Amodal3R 是条件式 3D 生成模型,能从部分可见的 2D 物体图像中推测并重建完整的 3D 形态和外观。模型基于“基础”3D 生成模型 TRELLIS 构建,通过引入掩码加权...
阅读原文

Amazon Nova Act

Amazon Nova Act是亚马逊 AGI Labs推出的通用AI代理,用于在网页浏览器中执行任务。Amazon Nova Act支持开发者基于配套的 SDK 构建智能体应用原型,完成如提...
阅读原文

Runway Gen-4

Runway Gen-4 是 AI 初创公司 Runway推出的高保真AI视频生成模型。支持在多个场景中保持人物、物体和环境的一致性,无需额外精调或训练。用户提供一张参考图...
阅读原文

Neo-1

Neo-1 是 VantAI 推出的全球首个将从头分子生成与原子级结构预测统一的AI模型。能预测生物分子结构,生成全新的分子,在设计分子胶等新型治疗药物方面表现出...
阅读原文

GLM-Z1-Air

GLM-Z1-Air 是智谱公司推出的基于 GLM-4-Air-0414 的深度思考模型。GLM-Z1-Air在预训练阶段引入更多推理类数据,在对齐阶段深度优化通用能力,展现出强大的数...
阅读原文

AI-ClothingTryOn

AI-ClothingTryOn 是基于 Python 的桌面应用程序,用 Google Gemini AI 技术实现虚拟试衣功能。AI-ClothingTryOn支持分别上传人物照片和服装照片,基于 AI 技...
阅读原文

GLM-4-Air-0414

GLM-4-Air-0414是智谱公司推出的拥有320亿参数的基座模型,是AutoGLM沉思背后的模型。GLM-4-Air-0414在预训练阶段加入更多代码类、推理类数据,针对智能体能...
阅读原文
12021222324123