标签:图像识别

moonshot-v1-vision-preview

moonshot-v1-vision-preview 是月之暗面推出的多模态图片理解模型,模型完善了 moonshot-v1 模型系列的多模态能力,具备强大的图像识别能力,能精准区分复杂...
阅读原文

MultiBooth

MultiBooth是清华大学深圳国际研究生院、 Meta、香港科技大学等机构推出的多概念图像生成方法,能从文本中生成包含多个用户指定概念的图像。MultiBooth将生成...
阅读原文

R2R

R2R是先进的AI检索系统,专注于Retrieval-Augmented Generation(增强型检索生成)。R2R集成多模态内容摄取、混合搜索、知识图谱构建、GraphRAG聚类分析、用...
阅读原文

百度AI搜

百度AI搜是百度基于文心大模型打造的桌面端AI搜索引擎。整合了百度搜索引擎、百度健康、百度律临、百度文库、百度教育等多个内容生态,确保搜索结果的可靠性...
阅读原文

VITRON

VITRON是Skywork AI、新加坡国立大学和南洋理工大学联合推出的像素级视觉大型语言模型(LLM),能全面理解和处理静态图像与动态视频,对图像和视频进行理解、...
阅读原文

Tempo Labs

Tempo Labs是AI驱动的平台,能帮助设计师和开发者基于单一真实来源进行协作,加速React应用的开发。Tempo Labs提供拖放式编辑器进行代码设计,支持视觉编辑组...
阅读原文

MolyPix.AI

Molypix.AI是AI驱动的在线图形设计平台,支持用户通过简单的文字提示快速生成专业级别的视觉内容。平台提供丰富的模板,包括海报、邀请函、明信片等,让设计...
阅读原文

Vision Parse

Vision Parse是开源的PDF文档转换工具,基于视觉语言模型(Vision LLMs)将PDF文件转换成Markdown格式。Vision Parse能智能识别和提取PDF中的文本和表格,且...
阅读原文

Lookie

Lookie是AI穿搭应用,支持用户上传照片创建数字分身,试穿各种潮流服饰,并提供穿搭建议。Lookie拥有近30种风格的服饰库,覆盖实用穿搭、职场、生活、约会等...
阅读原文

Emoji AI:个性化AI表情包生成器,让你的情感随时随地生动表达

Emoji AI是AI驱动的表情包制作应用,主打卡通风格,提供搜索和文生图功能,让用户能快速创建个性化表情。Emoji AI特别推出节日主题表情,适应不同文化和节日...
阅读原文

什么是狭义人工智能(Artificial Narrow Intelligence, ANI):智能家居助理提升生活便利性与舒适度

狭义人工智能(Artificial Narrow Intelligence, ANI)也被称为“弱人工智能”,是指被设计和训练来执行特定任务或狭窄范围内任务的人工智能系统。与拥有类似人...
阅读原文

图趣AI:多风格AI绘画应用助你轻松创作独特视觉艺术

图趣AI是基于AI技术的绘画软件,能根据用户的文字描述,创作出各种风格和主题的艺术画作。用户只需输入创意灵感,AI能模拟出相应的视觉内容,包括风景、奇幻...
阅读原文

Qwen2vl-Flux:多模态图像生成模型赋能创意无限,支持多样化生成模式

Qwen2VL-Flux是多模态图像生成模型,结合Qwen2VL的视觉语言理解和FLUX框架,基于文本提示和图像参考生成高质量的图像。模型支持多种生成模式,包括变体生成、...
阅读原文