OpenAudio S1
OpenAudio S1是Fish Audio推出的文本转语音(TTS)模型,基于超过200万小时的音频数据训练,支持13种语言。采用双自回归(Dual-AR)架构和强化学习与人类反馈...
PlayDiffusion
PlayDiffusion是PlayAI推出的新型音频编辑模型,基于扩散模型技术,专门用在音频的精细编辑和修复。模型将音频编码为离散的标记序列,对需要修改的部分进行掩...
Auto Think
Auto Think是快手Kwaipilot团队开源的KwaiCoder-AutoThink-preview自动思考大模型,模型针对深度思考大模型存在的“过度思考”问题进行了深入研究,提出了一种...
Firesearch
Firesearch 是 Mendable AI 团队推出的 AI 驱动的深度研究工具。基于 Firecrawl 多源网络内容提取技术,结合 OpenAI GPT-4o 的搜索规划和内容生成能力,将复...
Mary Meeker团队推出《人工智能趋势报告》(PDF文件)
Mary Meeker团队推出的《人工智能发展趋势》报告,全面分析AI技术的爆炸式发展及全球影响。报告指出,AI的用户增长(如ChatGPT在17个月内达到8亿用户)和资本...
Google AI Edge Gallery
Google AI Edge Gallery 是谷歌推出的实验性应用,支持让用户在本地设备上体验和使用机器学习(ML)及生成式人工智能(GenAI)模型。应用目前支持在 Android...
Bing Video Creator
Bing Video Creator 是微软推出AI视频生成工具。由OpenAI的Sora模型提供支持,能根据用户输入的文本描述快速生成视频内容。用户只需在Bing移动应用中输入详细...