标签:图像识别
WPS接入DeepSeek,秒变办公神器!
WPS 大家经常用来日常写作,虽然本身提供了AI功能,但可惜需要会员,本文教你三分钟接入最火的DeepSeek,让WPS秒变办公神器。 DeepSeek API申请地址:http:/...
AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!
这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...
Lumina-Image 2.0
Lumina-Image 2.0 是开源的高效统一图像生成模型,参数量为26亿,基于扩散模型和Transformer架构。在图像生成质量、复杂提示理解和资源效率方面表现出色,在...
MimicPhoto
MimicPhoto 是 GenAI Works 推出的 AI 驱动的照片编辑工具,专注于通过智能技术提升照片中的人物面部表情和整体效果。能快速调整笑容、眼神等细节,让照片中...
北京邮电大学AI入门课《AI在大前》
亲爱的同学们,你们好!在进入大学之前,这个课程将让你对人工智能有全新的认知和理解。你将学习到人工智能的核心概念,学习数学和物理学的相关基础知识,了解...
Deep Research
Deep Research是OpenAI推出的新型AI深度搜索研究工具,专为需要深度、复杂研究的用户设计。能在短时间内(5到30分钟)完成人类专家需要数小时甚至数天才能完...
moonshot-v1-vision-preview
moonshot-v1-vision-preview 是月之暗面推出的多模态图片理解模型,模型完善了 moonshot-v1 模型系列的多模态能力,具备强大的图像识别能力,能精准区分复杂...
MultiBooth
MultiBooth是清华大学深圳国际研究生院、 Meta、香港科技大学等机构推出的多概念图像生成方法,能从文本中生成包含多个用户指定概念的图像。MultiBooth将生成...
Tempo Labs
Tempo Labs是AI驱动的平台,能帮助设计师和开发者基于单一真实来源进行协作,加速React应用的开发。Tempo Labs提供拖放式编辑器进行代码设计,支持视觉编辑组...
Vision Parse
Vision Parse是开源的PDF文档转换工具,基于视觉语言模型(Vision LLMs)将PDF文件转换成Markdown格式。Vision Parse能智能识别和提取PDF中的文本和表格,且...