AI工具
AskYourPDF
AskYourPDF是一个AI驱动的PDF文档处理工具,支持用户通过自然语言查询与PDF文件进行交互,快速检索和提取信息。用户可以上传文档至其数据库,通过提问获得即...
LiveKit Agents
LiveKit Agents 是一个强大的框架,用于创建能实时通过语音、视频和数据与用户互动的多模态AI代理。框架支持 Python 编程,简化开发过程,支持开发者轻松集成...
Matryoshka Diffusion Models
Matryoshka Diffusion Models(MDM)是苹果公司推出的一种创新的扩散模型,主要用于生成高分辨率图像和视频。MDM通过多分辨率扩散过程,在不同尺度上同时进行...
ImgCreator
ImgCreator是Zmo.ai旗下的一款AI图像生成工具,能将文本描述转换成高质量的图像。用户只需输入简单的文字描述,ImgCreator能生成逼真的艺术图片、动漫角色或3...
Inverse Painting
Inverse Painting 是一种AI技术,由华盛顿大学的研究人员推出,能逆向重现绘画过程。通过分析艺术家的绘画视频,学习绘画技巧和顺序,然后生成一系列绘画指令...
Playground v3
Playground v3(PGv3)是由Playground Research推出的最新文本到图像模型,基于深度融合的大型语言模型(LLM)技术,实现在图形设计任务上超越人类设计师的能...
Transkriptor
Transkriptor 是一款强大的在线音频和视频转录工具,基于先进的AI技术将语音内容转换成文本。工具支持100多种语言,处理各种格式的音频和视频文件,为用户提...
Reverb ASR
Reverb ASR是Rev公司推出的开源自动语音识别和说话人分离模型,基于20万小时的人工转录英语数据训练而成。模型在长语音识别领域表现卓越,适合处理如播客和财...