标签:自动标签生成
R1-Onevision
R1-Onevision 是开源的多模态大语言模型,专注于复杂视觉推理任务。基于 Qwen2.5-VL 微调而成,通过整合视觉和文本数据,能精准地进行多模态信息解释。在数学...
video-analyzer
video-analyzer是开源的视频分析工具,结合Llama的11B视觉模型和OpenAI的Whisper模型来提取视频关键帧、转录音频内容,并生成视频的详细描述。工具支持完全本...
iFoto:提升跨境电商销售的高品质时装模特效果解决方案
iFoto是创新的在线AI照片编辑平台,专为电子商务领域设计。提供一系列强大的功能,包括AI时尚模特生成、背景移除和智能背景替换等,帮助用户快速创建专业水准...
TIP-I2V:创新智能家居助手提升生活品质与便利性
TIP-I2V是大规模真实文本和图像提示数据集,用在图像到视频生成领域。TIP-I2V包含超过170万独特的用户文本和图像提示,及五种SOTA图生视频模型生成的相应视频...
PhotoPrism
PhotoPrism 是一个开源的AI照片管理工具,用 Go 语言编写,旨在为用户提供一个去中心化的照片存储和组织解决方案。支持用户在自己的硬件上运行,完全控制自己...