标签：视觉理解

WPS接入DeepSeek，秒变办公神器！

WPS 大家经常用来日常写作，虽然本身提供了AI功能，但可惜需要会员，本文教你三分钟接入最火的DeepSeek，让WPS秒变办公神器。 DeepSeek API申请地址：http:/...

1年前 (2025)

这两年大家都在感叹生活不易，然而我想说的是，机会还是有的，但问题不在于有没有，而在于你是否能够认准机会，然后抓住它。接触过很多咨询项目的人，发现...

2年前 (2024)

Steamer-I2V 是百度 Steamer 团队推出的图像到视频生成模型，通过将静态图像转化为动态视频，展现出卓越的视觉生成能力。模型在 VBench 国际权威的视频生成评...

1年前 (2025)

原标题：DeepSeek 怒抢视觉对话王座！DeepSeek-VL2 发布即开源，技术全公开文章来源：夕小瑶科技说内容字数：6315字DeepSeek-VL2的发布与特点最近，国内大...

2年前 (2024)

SmolVLM是Hugging Face推出的轻量级视觉语言模型，专为设备端推理设计。以20亿参数量，实现了高效内存占用和快速处理速度。SmolVLM提供了三个版本以满足不同...

2年前 (2024)

DINO-X是IDEA研究院推出的通用视觉大模型，具备开放世界对象检测与理解能力。支持文本、视觉和定制提示，能识别图像中的任何对象而无需用户提示。基于超过1亿...

2年前 (2024)

将两种架构融合在一起

2年前 (2024)

Text Behind Image是开源的在线工具，支持用户在图片中的角色背后添加文字，创建具有视觉冲击力的海报和社交媒体图像。用户在图像中的主体背后添加自定义文本...

2年前 (2024)