AI项目和框架

通古大模型

通古大模型是华南理工大学深度学习与视觉计算实验室（SCUT-DLVCLab）推出的专注于古籍文言文处理的人工智能语言模型。基于百川2-7B-Base进行增量预训练，使用...

阅读原文

AI工具

1年前 (2025)

Sa2VA

Sa2VA是字节跳动联合加州大学默塞德分校、武汉大学和北京大学共同推出的多模态大语言模型，是SAM2和LLaVA结合而成，能实现对图像和视频的密集、细粒度理解。S...

阅读原文

AI工具

1年前 (2025)

WebLI-100B

WebLI-100B是Google DeepMind推出的包含1000亿图像-文本对的超大规模数据集，用在预训练视觉语言模型（VLMs）。WebLI-100B是WebLI数据集的扩展版本，基于从网...

阅读原文

AI工具

1年前 (2025)

OpenThinker-32B

OpenThinker-32B 是斯坦福、UC 伯克利、华盛顿大学等机构联合开发的开源推理模型，拥有 328 亿参数，支持 16,000 token 的上下文长度。模型仅使用 114k 数据...

阅读原文

AI工具

1年前 (2025)

Social Media Agent

Social Media Agent是智能的社交媒体内容管理工具，基于输入的URL内容生成Twitter和LinkedIn帖子。Social Media Agent用人机交互流程，处理社交媒体平台认证...

阅读原文

AI工具

1年前 (2025)

Matrix-Zero

Matrix-Zero是昆仑万维推出的世界模型，包含两款子模型：3D场景生成大模型和可交互视频生成大模型。Matrix-Zero能将用户输入的图片转化为可自由探索的真实3D...

阅读原文

AI工具

1年前 (2025)

GAS

GAS（Generative Avatar Synthesis from a Single Image）是卡内基梅隆大学、上海人工智能实验室和斯坦福大学的研究人员提出的从单张图像生成高质量、视角一...

阅读原文

AI工具

1年前 (2025)

Magic 1-For-1

Magic 1-For-1是北京大学、Hedra Inc. 和 Nvidia 推出的高效视频生成模型，基于优化内存消耗和推理延迟快速生成高质量视频片段。模型将复杂的文本到视频生成...

阅读原文

AI工具

1年前 (2025)

Goedel-Prover

Goedel-Prover（哥德尔证明器）是普林斯顿大学、清华大学、清华大学等机构推出的开源大型语言模型（LLM），用在自动化数学问题的形式证明生成。基于将自然语...

阅读原文

AI工具

1年前 (2025)

RWKV-7-2.9B

RWKV-7-2.9B模型（RWKV-7-World-2.9B-V3）是RWKV 基金推出的先进 RNN 大语言模型。基于 RWKV World V3 数据集训练，具有 29 亿参数，支持世界所有语言。模型...

阅读原文

AI工具

1年前 (2025)

AxBench

AxBench 是斯坦福大学推出的评估语言模型（LM）控制方法的基准测试框架。基于合成数据生成训练和评估数据，比较不同模型控制技术在概念检测和模型转向两个方...

阅读原文

AI工具

1年前 (2025)

Lumina-Video

Lumina-Video是上海 AI Lab 和香港中文大学推出的视频生成框架，基于Next-DiT架构，针对视频生成中的时空复杂性进行优化。基于多尺度Next-DiT架构，用不同大...

阅读原文

AI工具

1年前 (2025)

Pippo

Pippo是Meta Reality Labs推出的图像到视频生成模型，能从单张照片生成1K分辨率的多视角高清人像视频。模型基于多视角扩散变换器，预训练了30亿张人像图像，...

阅读原文

AI工具

1年前 (2025)

Animate Anyone 2

Animate Anyone 2 是阿里巴巴集团通义实验室推出的高保真角色图像动画生成技术，通过结合环境信息生成更具真实感的角色动画。与传统方法不同，能从视频中提取...

阅读原文

AI工具

1年前 (2025)

AuraFusion360

AuraFusion360是用于360°无边界场景修复的新型基于参考的方法，主要用于虚拟现实和建筑可视化等领域的三维场景修复。通过高斯散射表示的3D场景，实现了高质量...

阅读原文

AI工具

1年前 (2025)

1…115 116117118 119…196