标签:图像识别

WPS接入DeepSeek,秒变办公神器!

WPS 大家经常用来日常写作,虽然本身提供了AI功能,但可惜需要会员,本文教你三分钟接入最火的DeepSeek,让WPS秒变办公神器。 DeepSeek API申请地址:http:/...
阅读原文

AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!

这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...

Windows AI Foundry

Windows AI Foundry 是微软推出的全新的 AI 开发平台。Windows AI Foundry 基于整合 Windows Copilot Runtime 及新增功能,为 AI 开发者提供从模型选择、优化...
阅读原文

CrowdCore

CrowdCore是AI驱动的网红营销助手,帮助品牌和营销团队高效地发现、筛选与全球各类社交平台上的网红建立合作关系。核心功能包括AI网红搜索与筛选、自动化外联...
阅读原文

OpenVision

OpenVision是加州大学圣克鲁兹分校(UCSC)推出的完全开放、高效且灵活的高级视觉编码器家族,专注于多模态学习。提供从5.9M到632.1M参数的多种规模模型,适...
阅读原文

Image-AI.pro

Image-AI.pro 是专业级的 AI 图像生成平台,基于强大的 img-v2 Pro 引擎驱动,能生成高质量、多风格的图像作品。具备高级语义理解能力,能精准捕捉用户的创作...
阅读原文

Gemini 2.5 Pro (I/O 版)

Gemini 2.5 Pro (I/O 版) 是 Google 推出的 Gemini 2.5 Pro 升级版多模态AI模型,具体版本号为 Gemini 2.5 Pro Preview 05-06。模型在编程能力上取得重大突破...
阅读原文

天翼AI开放平台

天翼AI开放平台是中国电信正式上线的AI技术服务平台。平台以中国电信自研的星辰大模型为技术底座,提供从AI技术能力展示到产品体验、接入使用的全流程服务。
阅读原文

ImagePulse

ImagePulse (图律脉动)是魔搭社区推出的开源项目,为下一代图像理解和生成模型提供数据集支持,通过原子化模型的能力并构建原子能力数据集。项目包含多个原...
阅读原文

Translate Image

Translate Image 是免费的在线 AI 图片翻译工具,专为需要快速翻译图片中文字的用户设计。支持多种图片格式(如 JPG、PNG、JPEG 等),可处理产品图片、电商...
阅读原文

Piece it Together

Piece it Together (PiT)是Bria AI等机构推出的创新图像生成框架,专门用在从部分视觉组件生成完整的概念图像。基于特定领域的先验知识,将用户提供的碎片...
阅读原文

Qwen2.5-VL-32B

Qwen2.5-VL-32B是阿里巴巴开源的多模态模型,参数规模为32B。模型在Qwen2.5-VL系列的基础上,基于强化学习优化,具备更符合人类偏好的回答风格、显著提升的数...
阅读原文

Reve Image

Reve Image 是 Reve 推出的全新 AI 图像生成模型。专注于提升美学表现、精确的提示遵循能力以及出色的排版设计,能生成高质量的视觉作品。模型在生成图像时展...
阅读原文

ReCamMaster

ReCamMaster 是浙江大学、快手科技等联合推出的视频重渲染框架,能根据新的相机轨迹重新生成视频内容。通过预训练模型和帧维度条件机制,结合多相机同步数据...
阅读原文

I2V3D

I2V3D是香港城市大学和微软 GenAI创新的图像到视频生成框架,支持将静态图像转换为动态视频,基于3D几何引导实现精确的动画控制。I2V3D结合传统计算机图形学...
阅读原文

Aya Vision

Aya Vision 是 Cohere 推出的多模态、多语言的视觉模型,提升全球范围内的多语言和多模态通信能力。支持 23 种语言,能执行图像描述生成、视觉问答、文本翻译...
阅读原文

PixVerse V4

PixVerse V4 是爱诗科技推出的最新 AI 视频生成工具,基于文本或图片输入快速生成高质量的 AI 视频,生成速度最快可达 5 秒。新版本在语义理解、物理规律表现...
阅读原文
1235