标签:自动标签生成

easypic

EasyPic 是免费的在线 AI 抠图工具,专为快速去除图片背景而设计。基于先进的人工智能技术,高效识别并分离图像主体与背景,几秒钟内可完成高质量的抠图。用...
阅读原文

R1-Onevision

R1-Onevision 是开源的多模态大语言模型,专注于复杂视觉推理任务。基于 Qwen2.5-VL 微调而成,通过整合视觉和文本数据,能精准地进行多模态信息解释。在数学...
阅读原文

SigLIP 2

SigLIP 2 是Google DeepMind 提出先进的多语言视觉-语言模型 ,是 SigLIP 的升级版本,提升图像与文本之间的对齐能力。通过改进的训练方法和架构,显著增强了...
阅读原文

MolyPix.AI

Molypix.AI是AI驱动的在线图形设计平台,支持用户通过简单的文字提示快速生成专业级别的视觉内容。平台提供丰富的模板,包括海报、邀请函、明信片等,让设计...
阅读原文

video-analyzer

video-analyzer是开源的视频分析工具,结合Llama的11B视觉模型和OpenAI的Whisper模型来提取视频关键帧、转录音频内容,并生成视频的详细描述。工具支持完全本...
阅读原文

iFoto:提升跨境电商销售的高品质时装模特效果解决方案

iFoto是创新的在线AI照片编辑平台,专为电子商务领域设计。提供一系列强大的功能,包括AI时尚模特生成、背景移除和智能背景替换等,帮助用户快速创建专业水准...
阅读原文

TIP-I2V:创新智能家居助手提升生活品质与便利性

TIP-I2V是大规模真实文本和图像提示数据集,用在图像到视频生成领域。TIP-I2V包含超过170万独特的用户文本和图像提示,及五种SOTA图生视频模型生成的相应视频...
阅读原文

MOFA-Video

MOFA-Video是由腾讯AI实验室和东京大学的研究人员开源的一个可控性的图像生成视频的模型,该技术利用生成运动场适应器对图像进行动画处理以生成视频。
阅读原文

PhotoPrism

PhotoPrism 是一个开源的AI照片管理工具,用 Go 语言编写,旨在为用户提供一个去中心化的照片存储和组织解决方案。支持用户在自己的硬件上运行,完全控制自己...
阅读原文