标签:图像识别

WPS接入DeepSeek,秒变办公神器!

WPS 大家经常用来日常写作,虽然本身提供了AI功能,但可惜需要会员,本文教你三分钟接入最火的DeepSeek,让WPS秒变办公神器。 DeepSeek API申请地址:http:/...
阅读原文

AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!

这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...

HumanDiT

HumanDiT 是浙江大学和字节跳动联合提出的姿态引导的高保真人体视频生成框架。基于扩散变换器(Diffusion Transformer,DiT),能在大规模数据集上训练,生成...
阅读原文

LLaVA-Rad

LLaVA-Rad是微软研究院推出的小型多模态模型,专注于临床放射学报告生成。是LLaVA-Med项目的分支,特别是胸部X光(CXR)成像。基于LLaVA-Med的基础架构和训练...
阅读原文

Lumina-Image 2.0

Lumina-Image 2.0 是开源的高效统一图像生成模型,参数量为26亿,基于扩散模型和Transformer架构。在图像生成质量、复杂提示理解和资源效率方面表现出色,在...
阅读原文

MimicPhoto

MimicPhoto 是 GenAI Works 推出的 AI 驱动的照片编辑工具,专注于通过智能技术提升照片中的人物面部表情和整体效果。能快速调整笑容、眼神等细节,让照片中...
阅读原文

北京邮电大学AI入门课《AI在大前》

亲爱的同学们,你们好!在进入大学之前,这个课程将让你对人工智能有全新的认知和理解。你将学习到人工智能的核心概念,学习数学和物理学的相关基础知识,了解...
阅读原文

Deep Research

Deep Research是OpenAI推出的新型AI深度搜索研究工具,专为需要深度、复杂研究的用户设计。能在短时间内(5到30分钟)完成人类专家需要数小时甚至数天才能完...
阅读原文

明犀AI

明犀AI是AI图像增强工具。明犀AI基于图像生成先验和大模型能力,实现在文本提示引导下恢复图像的功能,能用负面提示和修复引导采样方法提升修复质量。明犀AI...
阅读原文

moonshot-v1-vision-preview

moonshot-v1-vision-preview 是月之暗面推出的多模态图片理解模型,模型完善了 moonshot-v1 模型系列的多模态能力,具备强大的图像识别能力,能精准区分复杂...
阅读原文

MultiBooth

MultiBooth是清华大学深圳国际研究生院、 Meta、香港科技大学等机构推出的多概念图像生成方法,能从文本中生成包含多个用户指定概念的图像。MultiBooth将生成...
阅读原文

R2R

R2R是先进的AI检索系统,专注于Retrieval-Augmented Generation(增强型检索生成)。R2R集成多模态内容摄取、混合搜索、知识图谱构建、GraphRAG聚类分析、用...
阅读原文

百度AI搜

百度AI搜是百度基于文心大模型打造的桌面端AI搜索引擎。整合了百度搜索引擎、百度健康、百度律临、百度文库、百度教育等多个内容生态,确保搜索结果的可靠性...
阅读原文

VITRON

VITRON是Skywork AI、新加坡国立大学和南洋理工大学联合推出的像素级视觉大型语言模型(LLM),能全面理解和处理静态图像与动态视频,对图像和视频进行理解、...
阅读原文

Tempo Labs

Tempo Labs是AI驱动的平台,能帮助设计师和开发者基于单一真实来源进行协作,加速React应用的开发。Tempo Labs提供拖放式编辑器进行代码设计,支持视觉编辑组...
阅读原文

MolyPix.AI

Molypix.AI是AI驱动的在线图形设计平台,支持用户通过简单的文字提示快速生成专业级别的视觉内容。平台提供丰富的模板,包括海报、邀请函、明信片等,让设计...
阅读原文

Vision Parse

Vision Parse是开源的PDF文档转换工具,基于视觉语言模型(Vision LLMs)将PDF文件转换成Markdown格式。Vision Parse能智能识别和提取PDF中的文本和表格,且...
阅读原文
1234