标签:图像处理

WPS接入DeepSeek,秒变办公神器!

WPS 大家经常用来日常写作,虽然本身提供了AI功能,但可惜需要会员,本文教你三分钟接入最火的DeepSeek,让WPS秒变办公神器。 DeepSeek API申请地址:http:/...
阅读原文

AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!

这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...

AiBiao

AiBiao 是基于大语言模型技术的AI图表处理工具,通过自然语言交互帮助用户高效完成数据处理和分析工作。支持用户通过对话的方式进行数据查询、清洗、合并、计...
阅读原文

FactSnap

FactSnap是Studio NAND开发的浏览器插件,帮助用户快速验证网页信息的真实性。通过集成多种模型和搜索引擎,在用户浏览网页时对选中的文字进行实时核查。用户...
阅读原文

PixelHacker

PixelHacker 是华中科技大学和 VIVO AI Lab联合推出的图像修复(Image Inpainting)模型。基于引入潜在类别引导(Latent Categories Guidance, LCG)范式,分...
阅读原文

DeerFlow

DeerFlow 是字节跳动开源的深度研究框架,能帮助用户高效完成复杂的研究任务。DeerFlow结合语言模型与多种工具,如网络搜索、爬虫和 Python 执行,能快速生成...
阅读原文

绘蛙·多图成片

绘蛙·多图成片是阿里绘蛙推出的AI视频生成工具,基于上传2-4张具有连贯性的图片,结合文字描述,快速生成一段流畅的视频。用户选择本地上传图片或从已有作品...
阅读原文

Mistral OCR

Mistral OCR 是 Mistral AI 推出的先进光学字符识别(OCR)工具,专为处理复杂文档而设计。能全面理解文档中的文本、图像、表格和数学公式等元素,支持数千种...
阅读原文

olmOCR

olmOCR 是 Ai2 推出的开源工具,用在将 PDF 文档高效转换为干净的结构化纯文本。olmOCR结合文档锚定(document-anchoring)技术与Qwen2-VL-7B-Instruct(阿里...
阅读原文

一键P图新神器Gemini 2.0,轻松打造你的完美照片!

车改成敞篷只需一句话,其它元素保持超高一致性
阅读原文

什么是数据增强(Data Augmentation):智能家居系统提升生活便利性与安全性

数据增强(Data Augmentation)是机器学习和深度学习领域中一种常用的技术,在计算机视觉和自然语言处理中应用广泛。核心目的是通过对现有数据进行变换或生成...
阅读原文

AnchorCrafter:中科院与腾讯携手打造智能虚拟主播实现高效带货新模式

AnchorCrafter是基于扩散模型的智能视频制作系统,用在自动生成具有高保真度的主播风格产品推广视频。基于整合人-物交互(HOI)到姿态引导的人体视频生成中,...
阅读原文

突破极限:NUS LinFusion实现每分钟生成16K高清图像,兼容Stable Diffusion插件!

LinFusion架构以一种新颖的广义线性注意力机制作为传统自注意力替代方案。
阅读原文

PHOTOG:无缝融入任何场景的智能电商平台产品优势解析

PHOTOG 是基于生成式AI技术的电商平台,被誉为“电商界的Midjourney”,能将真实世界的物品无缝集成到任何场景中,提供即时控制和结果,实现100%准确的场景复制...
阅读原文

KuaiFormer:智能音响重塑你的听觉体验

KuaiFormer是快手技术团队推出的基于Transformer的检索框架,用在大规模内容推荐系统。基于重新定义检索流程,从传统的分数估计任务转变为Transformer驱动的“...
阅读原文
123