AI工具

幻剪:智能视频创作工具自动匹配最佳素材实现高效成片

幻剪是集成AI技术的新一代视频创作工具,能实现智能生成视频和智能剪辑。用户只需输入文案,幻剪能自动匹配素材库中的最佳素材,快速成片。幻剪支持二次智能...
阅读原文

InfiMM-WebMath-40B:超大规模多模态数据集驱动智能应用的全新可能性

InfiMM-WebMath-40B 是字节跳动和中国科学院联合开源的超大规模多模态数据集,旨在提升多模态模型的图文混合推理能力,在数学领域。数据集从 Common Crawl 中...
阅读原文

抖音搜索:抖音全新AI驱动内容搜索引擎提升精准搜索体验

抖音搜索是抖音推出的独立内容搜索引擎,专注于短视频和图文内容的搜索。用户用搜索栏查找相关话题或创作者,获取包括短视频、图文在内的多种形式的内容。抖...
阅读原文

点线搜索:智能搜索引擎助力高效信息获取与个性化推荐

点线搜索是零一万物推出的AI搜索应用,提供精准、高效的搜索服务。基于智能算法学习用户行为,实现个性化资源推荐,支持多种检索方式,快速定位信息。点线搜...
阅读原文

悦灵犀AI:创新的Stable Diffusion多模态模型赋能AI绘画创作平台

悦灵犀是基于Stable Diffusion多模态模型的AI绘画和创作平台。基于先进的人工智能技术,为用户提供动漫风格、Mindjourney风格、ControlNet图片优化设计等多种...
阅读原文

OneDiffusion:双向图像合成与理解的无缝扩散模型创新解决方案

OneDiffusion是AI2推出的多功能大规模扩散模型,能无缝支持双向图像合成和理解,涵盖文本到图像生成、条件图像生成、图像理解等多种任务。基于将所有条件和目...
阅读原文

LongAlign:港大推出的长文本与图像高效对齐技术革新

LongAlign是香港大学研究团队推出的文本到图像(T2I)扩散模型的改进方法,能提升长文本输入的对齐精度。LongAlign用段级编码技术,将长文本分割处理,适应编...
阅读原文

ebook2audiobookXTTS:多语言开源电子书转有声书AI工具,轻松转换16种语言的文本为生动音频

ebook2audiobookXTTS是开源的AI工具,能将电子书转换为有声书。ebook2audiobookXTTS支持多种电子书格式,如epub、pdf、mobi等,用Coqui XTTS技术实现高质量的...
阅读原文

Optima:提升通信效率与任务管理的创新训练框架

Optima是清华大学推出的优化基于大型语言模型(LLM)的多智能体系统(MAS)的框架。基于一个迭代的生成、排名、选择和训练范式,显著提高通信效率和任务效果...
阅读原文

Sweep AI:智能AI软件开发平台提升效率与用户体验的创新解决方案

Sweep AI是基于AI技术的软件平台,能提升软件开发效率和质量。基于集成大型语言模型(LLM)和高级代码分析工具,为开发者提供代码搜索、重构、测试和文档生成...
阅读原文

燕雀智造:全面提升品牌形象的AI驱动设计工具

燕雀智造是基于AI技术专注于提供企业品牌设计服务。核心服务包括LOGO设计、VI设计、产品包装设计等,帮助小微企业主和普通用户设计属于自己的品牌。燕雀智造...
阅读原文

MuCodec:超低比特率音乐编解码器实现高保真音质与极致压缩效率

MuCodec是清华大学深圳国际研究生院、腾讯AI实验室和香港中文大学的研究人员共同推出的超低比特率音乐编解码器,能实现音乐的高效压缩与高保真重建。MuCodec...
阅读原文

KAZE:高效水印识别与清除的智能图像处理解决方案

KAZE是基于AI技术的在线图片处理平台,提供图片去水印、风格转换、图片增强等多种功能让图片编辑变得更加简单和高效。KAZE的主要功能是去除图片上的水印和LOG...
阅读原文

慧播星:智能直播助力电商新体验,提升互动与销售效率

慧播星是百度推出的AI电商直播平台,通过人工智能技术帮助商家快速创建数字人主播,自动生成直播剧本和互动文案。慧播星支持智能装修直播间,提升直播互动性...
阅读原文

ACE:全能图像生成与编辑模型赋能创意无限可能

ACE(All-round Creator and Editor)是阿里巴巴集团Tongyi Lab推出的基于扩散变换器的全能图像生成和编辑模型。ACE引入长上下文条件单元(LCU)和统一条件格...
阅读原文