AI工具

SAM 2.1:Meta开源的先进视觉分割模型提升图像处理精度与效率

SAM 2.1(全称Segment Anything Model 2.1)是Meta(Facebook的母公司)推出的先进视觉分割模型,用于图像和视频。基于简单的Transformer架构和流式记忆设计...
阅读原文

FaceCheck.ID:智能面部识别搜索引擎助力高效精准的视觉数据分析

FaceCheck.ID 是基于人工智能和面部识别技术帮助用户在互联网和社交媒体上定位和识别个人身份的平台。通过先进的算法为身份验证、欺诈检测和个人安全提供了一...
阅读原文

Qwen2vl-Flux:多模态图像生成模型赋能创意无限,支持多样化生成模式

Qwen2VL-Flux是多模态图像生成模型,结合Qwen2VL的视觉语言理解和FLUX框架,基于文本提示和图像参考生成高质量的图像。模型支持多种生成模式,包括变体生成、...
阅读原文

金舟AI助手:创新设计与卓越性能的完美结合提升您的生活品质

金舟AI助手是创新的营销内容创作平台,基于人工智能和大数据技术,为创作者、品牌主和营销服务公司提供高效的内容创作解决方案。平台能快速生成富有创意和针...
阅读原文

Find3D:加州理工学院创新3D部件分割模型提升精确度与效率

Find3D是加州理工学院推出的3D部件分割模型,能根据任意文本查询分割任意对象的任何部分。Find3D用一个强大的数据引擎自动从互联网上的3D资产生成训练数据,...
阅读原文

Sketch2Lineart:将手绘草图瞬间转化为精美线条画的智能工具

Sketch2Lineart是基于人工智能的绘画工具,能将简单的手绘草图转换成清晰的线条画。通过自动生成草图描述并据此绘制线条画,支持调整细节适应不同风格。用户...
阅读原文

Fancy123:创新3D网格生成技术实现高效建模与精准细节捕捉

Fancy123是华中科技大学和华南理工大学推出的3D网格生成技术,基于即插即用的变形技术从单张图片生成高质量的3D网格。该方法包含两个增强模块和反投影操作,...
阅读原文

Mooncake:创新推理架构推动大模型智能应用的新时代

Mooncake是月之暗面Kimi联合清华大学等机构共同开源的大模型推理架构。采用以KVCache为中心的分布式架构,通过分离预填充和解码集群,充分利用GPU集群中未充...
阅读原文

QwQ-32B-Preview:超越O1模型的阿里开源AI推理产品实现高效精准的智能决策

QwQ-32B-Preview(QwQ-32B)是阿里巴巴开源的实验性研究AI模型,以强大的推理能力著称,尤其在数学和编程领域表现卓越。QwQ-32B-Preview包含325亿参数,能处...
阅读原文

幻剪:智能视频创作工具自动匹配最佳素材实现高效成片

幻剪是集成AI技术的新一代视频创作工具,能实现智能生成视频和智能剪辑。用户只需输入文案,幻剪能自动匹配素材库中的最佳素材,快速成片。幻剪支持二次智能...
阅读原文

InfiMM-WebMath-40B:超大规模多模态数据集驱动智能应用的全新可能性

InfiMM-WebMath-40B 是字节跳动和中国科学院联合开源的超大规模多模态数据集,旨在提升多模态模型的图文混合推理能力,在数学领域。数据集从 Common Crawl 中...
阅读原文

抖音搜索:抖音全新AI驱动内容搜索引擎提升精准搜索体验

抖音搜索是抖音推出的独立内容搜索引擎,专注于短视频和图文内容的搜索。用户用搜索栏查找相关话题或创作者,获取包括短视频、图文在内的多种形式的内容。抖...
阅读原文

点线搜索:智能搜索引擎助力高效信息获取与个性化推荐

点线搜索是零一万物推出的AI搜索应用,提供精准、高效的搜索服务。基于智能算法学习用户行为,实现个性化资源推荐,支持多种检索方式,快速定位信息。点线搜...
阅读原文

悦灵犀AI:创新的Stable Diffusion多模态模型赋能AI绘画创作平台

悦灵犀是基于Stable Diffusion多模态模型的AI绘画和创作平台。基于先进的人工智能技术,为用户提供动漫风格、Mindjourney风格、ControlNet图片优化设计等多种...
阅读原文

OneDiffusion:双向图像合成与理解的无缝扩散模型创新解决方案

OneDiffusion是AI2推出的多功能大规模扩散模型,能无缝支持双向图像合成和理解,涵盖文本到图像生成、条件图像生成、图像理解等多种任务。基于将所有条件和目...
阅读原文
199100101102103207