标签:图像分析

Ideogram 2a

Ideogram 2a 是 AI 图像生成公司 Ideogram 最新发布的文生图模型,模型在 Ideogram 2.0 的基础上进行了优化,主打高效性和实用性,生成速度显著提升,成本降...
阅读原文

AddressCLIP

AddressCLIP 是基于 CLIP 技术构建的端到端图像地理定位模型,由中科院自动化所和阿里云联合开发。模型能通过一张照片实现街道级精度的定位,直接预测图像拍...
阅读原文

Vision Search Assistant:结合视觉语言模型与网络代理搜索技术的开源框架研究

Vision Search Assistant(VSA)是结合视觉语言模型(VLMs)和网络代理的框架,提升模型对未知视觉内容的理解能力。基于互联网检索,使VLMs处理和回答有关未...
阅读原文