标签:图像识别

WPS接入DeepSeek,秒变办公神器!

WPS 大家经常用来日常写作,虽然本身提供了AI功能,但可惜需要会员,本文教你三分钟接入最火的DeepSeek,让WPS秒变办公神器。 DeepSeek API申请地址:http:/...
阅读原文

AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!

这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...

Piece it Together

Piece it Together (PiT)是Bria AI等机构推出的创新图像生成框架,专门用在从部分视觉组件生成完整的概念图像。基于特定领域的先验知识,将用户提供的碎片...
阅读原文

Qwen2.5-VL-32B

Qwen2.5-VL-32B是阿里巴巴开源的多模态模型,参数规模为32B。模型在Qwen2.5-VL系列的基础上,基于强化学习优化,具备更符合人类偏好的回答风格、显著提升的数...
阅读原文

Reve Image

Reve Image 是 Reve 推出的全新 AI 图像生成模型。专注于提升美学表现、精确的提示遵循能力以及出色的排版设计,能生成高质量的视觉作品。模型在生成图像时展...
阅读原文

ReCamMaster

ReCamMaster 是浙江大学、快手科技等联合推出的视频重渲染框架,能根据新的相机轨迹重新生成视频内容。通过预训练模型和帧维度条件机制,结合多相机同步数据...
阅读原文

I2V3D

I2V3D是香港城市大学和微软 GenAI创新的图像到视频生成框架,支持将静态图像转换为动态视频,基于3D几何引导实现精确的动画控制。I2V3D结合传统计算机图形学...
阅读原文

Aya Vision

Aya Vision 是 Cohere 推出的多模态、多语言的视觉模型,提升全球范围内的多语言和多模态通信能力。支持 23 种语言,能执行图像描述生成、视觉问答、文本翻译...
阅读原文

PixVerse V4

PixVerse V4 是爱诗科技推出的最新 AI 视频生成工具,基于文本或图片输入快速生成高质量的 AI 视频,生成速度最快可达 5 秒。新版本在语义理解、物理规律表现...
阅读原文

Microsoft Research Forum

Microsoft Research Forum 是微软研究院推出的系列虚拟论坛活动,汇聚全球科技与研究领域的专家学者,共同探讨人工智能及相关前沿技术的最新进展、创新理念与...
阅读原文

HumanDiT

HumanDiT 是浙江大学和字节跳动联合提出的姿态引导的高保真人体视频生成框架。基于扩散变换器(Diffusion Transformer,DiT),能在大规模数据集上训练,生成...
阅读原文

LLaVA-Rad

LLaVA-Rad是微软研究院推出的小型多模态模型,专注于临床放射学报告生成。是LLaVA-Med项目的分支,特别是胸部X光(CXR)成像。基于LLaVA-Med的基础架构和训练...
阅读原文

Lumina-Image 2.0

Lumina-Image 2.0 是开源的高效统一图像生成模型,参数量为26亿,基于扩散模型和Transformer架构。在图像生成质量、复杂提示理解和资源效率方面表现出色,在...
阅读原文

MimicPhoto

MimicPhoto 是 GenAI Works 推出的 AI 驱动的照片编辑工具,专注于通过智能技术提升照片中的人物面部表情和整体效果。能快速调整笑容、眼神等细节,让照片中...
阅读原文

北京邮电大学AI入门课《AI在大前》

亲爱的同学们,你们好!在进入大学之前,这个课程将让你对人工智能有全新的认知和理解。你将学习到人工智能的核心概念,学习数学和物理学的相关基础知识,了解...
阅读原文

Deep Research

Deep Research是OpenAI推出的新型AI深度搜索研究工具,专为需要深度、复杂研究的用户设计。能在短时间内(5到30分钟)完成人类专家需要数小时甚至数天才能完...
阅读原文

明犀AI

明犀AI是AI图像增强工具。明犀AI基于图像生成先验和大模型能力,实现在文本提示引导下恢复图像的功能,能用负面提示和修复引导采样方法提升修复质量。明犀AI...
阅读原文
1235