AI工具

WebLI-100B

WebLI-100B是Google DeepMind推出的包含1000亿图像-文本对的超大规模数据集,用在预训练视觉语言模型(VLMs)。WebLI-100B是WebLI数据集的扩展版本,基于从网...
阅读原文

OpenThinker-32B

OpenThinker-32B 是斯坦福、UC 伯克利、华盛顿大学等机构联合开发的开源推理模型,拥有 328 亿参数,支持 16,000 token 的上下文长度。模型仅使用 114k 数据...
阅读原文

Social Media Agent

Social Media Agent是智能的社交媒体内容管理工具,基于输入的URL内容生成Twitter和LinkedIn帖子。Social Media Agent用人机交互 流程,处理社交媒体平台认证...
阅读原文

Trickle

Trickle 是零代码网页应用开发工具,用自然语言输入的方式,让用户无需编程知识快速创建功能丰富的网页应用。用户只需描述需求,Trickle 能自动生成前端页面...
阅读原文

Matrix-Zero

Matrix-Zero是昆仑万维推出的世界模型,包含两款子模型:3D场景生成大模型和可交互视频生成大模型。Matrix-Zero能将用户输入的图片转化为可自由探索的真实3D...
阅读原文

GAS

GAS(Generative Avatar Synthesis from a Single Image)是卡内基梅隆大学、上海人工智能实验室和斯坦福大学的研究人员提出的从单张图像生成高质量、视角一...
阅读原文

Magic 1-For-1

Magic 1-For-1是北京大学、Hedra Inc. 和 Nvidia 推出的高效视频生成模型,基于优化内存消耗和推理延迟快速生成高质量视频片段。模型将复杂的文本到视频生成...
阅读原文

Goedel-Prover

Goedel-Prover(哥德尔证明器)是普林斯顿大学、清华大学、清华大学等机构推出的开源大型语言模型(LLM),用在自动化数学问题的形式证明生成。基于将自然语...
阅读原文

Readdy

Readdy 是基于AI技术的产品设计工具,能将用户的想法快速转化为精美的设计稿,生成能直接使用的前端代码。用户只需用自然语言描述需求,Readdy 能在几分钟内...
阅读原文

RWKV-7-2.9B

RWKV-7-2.9B模型(RWKV-7-World-2.9B-V3) 是RWKV 基金推出的先进 RNN 大语言模型。基于 RWKV World V3 数据集训练,具有 29 亿参数,支持世界所有语言。模型...
阅读原文

FaceMimic

FaceMimic是基于人工智能技术的在线头像生成工具。能将普通自拍照片快速转换为高质量的专业头像。用户只需上传一张自拍,选择所需的风格,系统能在短时间内生...
阅读原文

AxBench

AxBench 是斯坦福大学推出的评估语言模型(LM)控制方法的基准测试框架。基于合成数据生成训练和评估数据,比较不同模型控制技术在概念检测和模型转向两个方...
阅读原文

Lumina-Video

Lumina-Video是上海 AI Lab 和香港中文大学推出的视频生成框架,基于Next-DiT架构,针对视频生成中的时空复杂性进行优化。基于多尺度Next-DiT架构,用不同大...
阅读原文

ImageToVideo AI

ImageToVideo AI是基于人工智能技术将静态图像转换为动态视频的工具。通过分析图像内容结合用户提供的文本提示或指令,为图像添加动画效果、转场效果、背景音...
阅读原文

Pippo

Pippo是Meta Reality Labs推出的图像到视频生成模型,能从单张照片生成1K分辨率的多视角高清人像视频。模型基于多视角扩散变换器,预训练了30亿张人像图像,...
阅读原文
14546474849207