AI工具

LongAlign:港大推出的长文本与图像高效对齐技术革新

LongAlign是香港大学研究团队推出的文本到图像(T2I)扩散模型的改进方法,能提升长文本输入的对齐精度。LongAlign用段级编码技术,将长文本分割处理,适应编...
阅读原文

ebook2audiobookXTTS:多语言开源电子书转有声书AI工具,轻松转换16种语言的文本为生动音频

ebook2audiobookXTTS是开源的AI工具,能将电子书转换为有声书。ebook2audiobookXTTS支持多种电子书格式,如epub、pdf、mobi等,用Coqui XTTS技术实现高质量的...
阅读原文

Optima:提升通信效率与任务管理的创新训练框架

Optima是清华大学推出的优化基于大型语言模型(LLM)的多智能体系统(MAS)的框架。基于一个迭代的生成、排名、选择和训练范式,显著提高通信效率和任务效果...
阅读原文

Sweep AI:智能AI软件开发平台提升效率与用户体验的创新解决方案

Sweep AI是基于AI技术的软件平台,能提升软件开发效率和质量。基于集成大型语言模型(LLM)和高级代码分析工具,为开发者提供代码搜索、重构、测试和文档生成...
阅读原文

燕雀智造:全面提升品牌形象的AI驱动设计工具

燕雀智造是基于AI技术专注于提供企业品牌设计服务。核心服务包括LOGO设计、VI设计、产品包装设计等,帮助小微企业主和普通用户设计属于自己的品牌。燕雀智造...
阅读原文

MuCodec:超低比特率音乐编解码器实现高保真音质与极致压缩效率

MuCodec是清华大学深圳国际研究生院、腾讯AI实验室和香港中文大学的研究人员共同推出的超低比特率音乐编解码器,能实现音乐的高效压缩与高保真重建。MuCodec...
阅读原文

KAZE:高效水印识别与清除的智能图像处理解决方案

KAZE是基于AI技术的在线图片处理平台,提供图片去水印、风格转换、图片增强等多种功能让图片编辑变得更加简单和高效。KAZE的主要功能是去除图片上的水印和LOG...
阅读原文

慧播星:智能直播助力电商新体验,提升互动与销售效率

慧播星是百度推出的AI电商直播平台,通过人工智能技术帮助商家快速创建数字人主播,自动生成直播剧本和互动文案。慧播星支持智能装修直播间,提升直播互动性...
阅读原文

ACE:全能图像生成与编辑模型赋能创意无限可能

ACE(All-round Creator and Editor)是阿里巴巴集团Tongyi Lab推出的基于扩散变换器的全能图像生成和编辑模型。ACE引入长上下文条件单元(LCU)和统一条件格...
阅读原文

ViewExtrapolator:新型视图合成技术实现高质量视觉体验与灵活场景重建

ViewExtrapolator是南洋理工大学、UCAS研究团队共同推出的新视角外推方法,基于稳定视频扩散(Stable Video Diffusion, SVD)的生成先验合成远超出训练视图范...
阅读原文

纳米搜索:多模型整合的智能搜索应用引领信息获取新方式

纳米搜索是360集团推出的AI搜索应用,集搜索、阅读、写作和创造于一体,重新定义AI搜索体验。纳米搜索支持文字、语音、拍照和视频等多种搜索方式,提供从简单...
阅读原文

ChefGPT:智能厨房助手为您量身定制美味菜谱与餐计划

ChefGPT是AI驱动的烹饪伴侣,提供个性化食谱推荐、定制膳食计划和专业烹饪指导。通过PantryChef、MasterChef、MacrosChef等功能,帮助用户根据食材生成食谱、...
阅读原文

OpenScholar:智能学术搜索工具助力高效研究与知识发现

OpenScholar是华盛顿大学和艾伦AI研究所共同推出的检索增强型语言模型(LM),能帮助科学家基于检索和综合科学文献中的相关论文回答问题。系统用大规模的科学...
阅读原文

SmolVLM:轻量级视觉语言模型助力多模态任务的高效解决方案

SmolVLM是Hugging Face推出的轻量级视觉语言模型,专为设备端推理设计。以20亿参数量,实现了高效内存占用和快速处理速度。SmolVLM提供了三个版本以满足不同...
阅读原文

GenChess:个性化国际象棋体验:DeepMind推出定制AI棋子工具

GenChess是谷歌DeepMind团队推出的创新AI工具,支持用户自由定制个性化的国际象棋棋子。用户输入关键词,如“猫”或“狗”,生成具有特定主题的棋子,提升游戏体...
阅读原文