标签:图像处理

WPS接入DeepSeek,秒变办公神器!

WPS 大家经常用来日常写作,虽然本身提供了AI功能,但可惜需要会员,本文教你三分钟接入最火的DeepSeek,让WPS秒变办公神器。 DeepSeek API申请地址:http:/...
阅读原文

AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!

这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...

绘蛙·多图成片

绘蛙·多图成片是阿里绘蛙推出的AI视频生成工具,基于上传2-4张具有连贯性的图片,结合文字描述,快速生成一段流畅的视频。用户选择本地上传图片或从已有作品...
阅读原文

Mistral OCR

Mistral OCR 是 Mistral AI 推出的先进光学字符识别(OCR)工具,专为处理复杂文档而设计。能全面理解文档中的文本、图像、表格和数学公式等元素,支持数千种...
阅读原文

olmOCR

olmOCR 是 Ai2 推出的开源工具,用在将 PDF 文档高效转换为干净的结构化纯文本。olmOCR结合文档锚定(document-anchoring)技术与Qwen2-VL-7B-Instruct(阿里...
阅读原文

一键P图新神器Gemini 2.0,轻松打造你的完美照片!

车改成敞篷只需一句话,其它元素保持超高一致性
阅读原文

什么是数据增强(Data Augmentation):智能家居系统提升生活便利性与安全性

数据增强(Data Augmentation)是机器学习和深度学习领域中一种常用的技术,在计算机视觉和自然语言处理中应用广泛。核心目的是通过对现有数据进行变换或生成...
阅读原文

AnchorCrafter:中科院与腾讯携手打造智能虚拟主播实现高效带货新模式

AnchorCrafter是基于扩散模型的智能视频制作系统,用在自动生成具有高保真度的主播风格产品推广视频。基于整合人-物交互(HOI)到姿态引导的人体视频生成中,...
阅读原文

突破极限:NUS LinFusion实现每分钟生成16K高清图像,兼容Stable Diffusion插件!

LinFusion架构以一种新颖的广义线性注意力机制作为传统自注意力替代方案。
阅读原文

PHOTOG:无缝融入任何场景的智能电商平台产品优势解析

PHOTOG 是基于生成式AI技术的电商平台,被誉为“电商界的Midjourney”,能将真实世界的物品无缝集成到任何场景中,提供即时控制和结果,实现100%准确的场景复制...
阅读原文

KuaiFormer:智能音响重塑你的听觉体验

KuaiFormer是快手技术团队推出的基于Transformer的检索框架,用在大规模内容推荐系统。基于重新定义检索流程,从传统的分数估计任务转变为Transformer驱动的“...
阅读原文

创意喵:智能短视频创作助手:轻松生成创意标题和文案

创意喵是为自媒体创作者设计的AI创作助手,基于AI技术快速生成吸引人的标题和短视频文案,支持多种自媒体平台和内容类型,让创作过程更轻松高效。创意喵具备...
阅读原文

Text Behind Image:在角色背后插入文字标题

Text Behind Image是开源的在线工具,支持用户在图片中的角色背后添加文字,创建具有视觉冲击力的海报和社交媒体图像。用户在图像中的主体背后添加自定义文本...
阅读原文

墨鱼AIGC

墨鱼AIGC是一款基于国内先进的人工智能技术的文案写作工具,产品经过大量优质数据训练后形成垂类场景的写作能力,为用户提供一键生成营销广告、原创文案、写...
阅读原文

DDColor

DDColor是阿里达摩院的研究人员推出的一个开源的AI图像着色框架,可以一键将黑白图片上色变为全彩图像。该方法通过使用双解码器架构(像素解码器和颜色解码器...
阅读原文
12