AI工具
Takin AudioLLM:创新零样本语音生成模型助力个性化语音合成体验
Takin AudioLLM是喜马拉雅Everest团队推出的一系列高质量零样本语音生成模型,包括Takin TTS、Takin VC和Takin Morphing。模型用最新的大型语言模型技术,专...
checksub:全球覆盖的AI视频字幕生成工具,支持200多种语言自动翻译与精准识别
checksub是AI视频翻译和配音工具,能自动生成200多种语言的字幕,提供AI配音服务。通过集成字幕生成、翻译和配音功能,帮助视频内容跨越语言障碍,扩大全球影...
AutoTrain:无代码模型训练平台助力轻松构建高性能AI应用
AutoTrain(AutoTrain Advanced)是Hugging Face推出的开源无代码平台,能简化最先进模型的训练过程。支持用户无需编写代码即可创建、微调和部署自己的AI模型...
ProductScope:提升销量的AI驱动产品摄影与亚马逊列表优化解决方案
ProductScope是专为电子商务品牌、设计师和营销人员设计的多功能AI工具。提供产品摄影、亚马逊列表优化和客户洞察分析的解决方案。平台旨在简化产品设计、营...
CAMPHOR:创新端侧小语言模型推动多智能体协作与智能交互的新时代
CAMPHOR是苹果团队推出的端侧小语言模型(SLM)多智能体框架,能提升移动设备的隐私保护和响应速度。框架基于在设备本地处理多个用户输入并进行个人上下文推...
huntr:定制化简历与求职信生成器助你轻松赢得面试机会
huntr是创新的求职辅助平台,通过人工智能技术帮助用户创建定制化的简历和求职信,简化工作申请流程。平台提供一键填写申请表、工作搜索组织、简历定制和检查...
XGrammar:智能化结构化生成引擎提升文本创作效率与质量
XGrammar是由陈天奇团队推出的开源软件库,能为大型语言模型(LLM)提供高效、灵活且可移植的结构化数据生成能力。基于上下文无关语法(CFG)定义结构,支持...
PHOTOG:无缝融入任何场景的智能电商平台产品优势解析
PHOTOG 是基于生成式AI技术的电商平台,被誉为“电商界的Midjourney”,能将真实世界的物品无缝集成到任何场景中,提供即时控制和结果,实现100%准确的场景复制...
AI酱:实时多语言对话的二次元风格AI助手
AI酱是二次元风格的AI多语言智能聊天APP,提供了多个二次元萌妹和帅哥形象,用户可以与这些角色进行面对面的即时对话。应用基于语音识别能力和人工智能技术,...
Fridge Leftovers AI:智能食材识别与个性化食谱推荐的创新烹饪助手
Fridge Leftovers AI是智能烹饪应用,旨在减少食物浪费并激发烹饪创意。用户只需拍摄冰箱剩余食材的照片,应用能识别食材推荐相应的食谱。提供个性化食谱建议...
Fugatto:英伟达推出性多功能AI音频生成模型,支持高质量音频合成与实时语音转换
Fugatto是英伟达(NVIDIA)推出的音频合成和转换模型,全称为"Foundational Generative Audio Transformer Opus 1"。模型能根据文本提示生成音频或...
快标书:高效智能的AI标书创作平台助力快速生成优质投标方案
快标书是AI投标书制作工具,帮助用户快速生成高质量的投标方案。平台能一键生成目录和投标方案,简化传统投标书的制作流程,显著提升编写效率和文档的专业性...
爱扒谱:智能音乐创作平台助你轻松生成五线谱与音轨分离
爱扒谱是基于人工智能技术提供音乐处理服务的平台,能实现一键扒谱、音轨分离、AI生成音乐和MP3转MIDI等功能。平台适用于音乐创作者、教师、学生和音乐爱好者...
LongRAG:双视角鲁棒检索框架助力高效精准信息获取
LongRAG是清华大学、中国科学院和智谱的研究团队推出的,面向长文本问答(LCQA)的双视角鲁棒检索增强生成(RAG)框架。基于混合检索器、LLM增强信息提取器、...
Illustrious:高质量动漫风格图像生成的创新开源模型
Illustrious是开源的文本到图像动漫图像生成模型,是Onoma AI Research推出的。基于优化批量大小、dropout控制、训练图像分辨率和多级标题等关键方法,实现高...