标签:智能图像识别

WPS接入DeepSeek,秒变办公神器!

WPS 大家经常用来日常写作,虽然本身提供了AI功能,但可惜需要会员,本文教你三分钟接入最火的DeepSeek,让WPS秒变办公神器。 DeepSeek API申请地址:http:/...
阅读原文

AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!

这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...

Chitu

Chitu(赤兔)是清华大学高性能计算研究所与清程极智联合开源的高性能大模型推理引擎,专为解决大模型在推理阶段的高成本和低效率问题设计,具有强大的硬件适...
阅读原文

Granite 3.2

Granite 3.2 是IBM开源的多模态AI模型系列,具备强大的推理、视觉理解和预测能力。Granite 3.2包含多个版本, Granite 3.2 Instruct 提供实验性链式推理能力...
阅读原文

Image-01

Image-01 是 MiniMax 推出的先进文本到图像生成模型,具备卓越的图像生成能力。能将用户输入的文本描述精准转化为高质量图像,支持多种纵横比和高分辨率输出...
阅读原文

R1-Onevision

R1-Onevision 是开源的多模态大语言模型,专注于复杂视觉推理任务。基于 Qwen2.5-VL 微调而成,通过整合视觉和文本数据,能精准地进行多模态信息解释。在数学...
阅读原文

Evo 2

Evo 2 是美国弧形研究所、英伟达、斯坦福大学等机构合作推出的DNA语言模型,用于基因组建模和设计,覆盖生命的所有领域。Evo 2 基于 StripedHyena 2 架构开发...
阅读原文

LOOK

LOOK是实时AI时尚设计工具,专为时尚设计师开发。LOOK基于先进的AIGC技术,将设计概念即时转化为视觉呈现,简化传统设计流程。设计师在Procreate中绘制草图时...
阅读原文

Hika

Hika是国内五人团队开发的免费AI知识搜索工具,通过个性化交互和多维度知识探索,帮助用户获得更全面和深入的搜索结果。与传统AI搜索工具不同,不追求“一步到...
阅读原文

万相2.1

万相2.1是阿里推出的通义万相升级版本。基于自研的高效VAE和DiT架构,增强时空上下文建模能力,支持无限长1080P视频的高效编解码,首次实现中文文字视频生成...
阅读原文

AGUVIS

AGUVIS是香港大学、Salesforce 联合推出的统一的纯视觉框架,专为自主GUI智能体设计,能在各种平台(如网页、桌面、移动设备)上操作。AGUVIS基于图像观察和...
阅读原文

ZEBRACAT:将文本与音频轻松转换为高质量视频内容的AI营销工具

ZEBRACAT是在线AI视频创作平台,基于技术帮助用户快速将文本或音频转换成具有吸引力的视频内容。平台支持170多种语言,提供拟人的声音和头像,增强视频的吸引...
阅读原文

Copilot Vision:智能网页助手助您高效搜索与信息获取

Copilot Vision 是微软推出的AI浏览器辅助功能,目前处于预览阶段,仅支持在Microsoft Edge浏览器中使用,对美国部分 Copilot Pro 用户开放。Copilot Vision...
阅读原文

iFoto:提升跨境电商销售的高品质时装模特效果解决方案

iFoto是创新的在线AI照片编辑平台,专为电子商务领域设计。提供一系列强大的功能,包括AI时尚模特生成、背景移除和智能背景替换等,帮助用户快速创建专业水准...
阅读原文

Coral AI:智能多语言文档分析与翻译平台实现跨文档搜索与自动摘要

Coral AI是 AI文档分析平台,专注于PDF文档的智能搜索、摘要和翻译。通过AI技术,支持超过90种语言,能快速理解文档内容,提供即时的文档摘要、问答和引用生...
阅读原文

Vidalgo:AI视频创作工具助你轻松制作引人入胜的短视频

Vidalgo是专为社交媒体平台设计的AI视频创作工具,旨在帮助用户快速制作并发布适合TikTok、YouTube Shorts和Instagram Reels的垂直视频。提供丰富的音乐库、...
阅读原文

TIP-I2V:创新智能家居助手提升生活品质与便利性

TIP-I2V是大规模真实文本和图像提示数据集,用在图像到视频生成领域。TIP-I2V包含超过170万独特的用户文本和图像提示,及五种SOTA图生视频模型生成的相应视频...
阅读原文
12