标签:图像分析
Ideogram 2a
Ideogram 2a 是 AI 图像生成公司 Ideogram 最新发布的文生图模型,模型在 Ideogram 2.0 的基础上进行了优化,主打高效性和实用性,生成速度显著提升,成本降...
AddressCLIP
AddressCLIP 是基于 CLIP 技术构建的端到端图像地理定位模型,由中科院自动化所和阿里云联合开发。模型能通过一张照片实现街道级精度的定位,直接预测图像拍...
Vision Search Assistant:结合视觉语言模型与网络代理搜索技术的开源框架研究
Vision Search Assistant(VSA)是结合视觉语言模型(VLMs)和网络代理的框架,提升模型对未知视觉内容的理解能力。基于互联网检索,使VLMs处理和回答有关未...