标签:图像识别

AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!

这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...

T-Rex Label:智能AI标注工具简化复杂场景一键标注过程

T-Rex Label是AI自动标注工具,IDEA计算机视觉团队基于T-Rex2模型创建。T-Rex Label支持一键标注和零样本检测,适用于农业、工业、生物医药等多个行业。T-Rex...
阅读原文

LLaVA-o1:开源视觉语言模型助力智能理解与生成内容

LLaVA-o1是北京大学、清华大学、鹏城实验室、阿里巴巴达摩院以及理海大学(Lehigh University)组成的研究团队推出的开源视觉语言模型,基于Llama-3.2-Vision...
阅读原文

一加 13:全面体验,颠覆你的手机认知!

三年之期已到,一加重新定义一加。
阅读原文

众影AI:智能动画创作:从剧本与音频到视觉作品的自动生成

众影AI是AI视频生成工具,专注于轻动画创作。基于自研的大模型自动分析剧本或音频,能一键生成角色表演,平均1分钟内完成视频制作。适于多种创作场景,如夫妻...
阅读原文

Vision Search Assistant:结合视觉语言模型与网络代理搜索技术的开源框架研究

Vision Search Assistant(VSA)是结合视觉语言模型(VLMs)和网络代理的框架,提升模型对未知视觉内容的理解能力。基于互联网检索,使VLMs处理和回答有关未...
阅读原文

什么是深度学习(Deep Learning)

深度学习(Deep Learning)是机器学习的一个子集,本文介绍了什么是深度学习、深度学习的工作原理、深度学习与机器学习的区别、深度学习的开发框架以及深度学...
阅读原文

什么是神经网络(Neural Network)

神经网络(Neural Network)作为人工智能中的一种计算模型,是受人脑启发的一种机器学习类型。本文介绍了其定义、工作原理、类型、优势、局限和其应用场景。
阅读原文

AI初创公司融资数据库

AI工具集推出的AI初创公司融资数据库,通过该页面你可以获取人工智能行业最新的融资数据和资讯,为投资者、创业者、研究人员和AI爱好者提供关于AI创业公司融...
阅读原文

Screenshot to Code

Sscreenshot to Code是一个开源的项目,利用人工智能技术(GPT-4V 和 DALL·E 3)将用户的屏幕截图转换为前端网页代码。项目的核心功能是自动化网页设计的编码...
阅读原文

BrushNet

BrushNet是由腾讯PCG部门的ARC实验室与香港大学的研究人员推出的一个基于扩散模型的即插即用的图像照片修复(Inpainting)模型,通过分解的双分支架构来有效...
阅读原文

Butterflies AI

Butterflies AI是一个有趣的AI社交平台,支持用户定制具有个性和情感的AI角色,称为"蝴蝶",AI虚拟角色能在平台上自动发布动态和互动。
阅读原文

Omages

Omages是一个开源的3D模型生成项目,基于图像扩散技术将3D形状的几何和纹理信息编码进64x64像素的2D图像中,从而简化3D建模流程。
阅读原文

Qwen2-VL

Qwen2-VL是阿里巴巴达摩院开源的视觉多模态AI模型,具备高级图像和视频理解能力。Qwen2-VL支持多种语言,能处理不同分辨率和长宽比的图片,实时分析动态视频...
阅读原文

什么是计算机视觉(Computer Vision)

计算机视觉(Computer Vision)是人工智能的一个关键分支,专注于使机器能够像人类一样解释和理解视觉信息。它涉及图像和视频的获取、处理、分析以及从这些数据...
阅读原文

ImageBind

ImageBind是Meta公司推出的开源多模态AI模型,将文本、音频、视觉、温度和运动数据等六种不同类型的信息整合到一个统一的嵌入空间中。模型通过图像模态作为桥...
阅读原文
12