标签:智能语音助手
HART:自回归视觉生成模型推动图像生成的创新与精准
HART(Hybrid Autoregressive Transformer)是麻省理工学院研究团队推出的自回归视觉生成模型。能直接生成1024×1024像素的高分辨率图像,质量媲美扩散模型。H...
Skywork o1:天工大模型4.0 O1版:智能生成与多模态交互的革新体验
Skywork o1是昆仑万维推出的天工大模型4.0 o1版,是国内首款具备中文逻辑推理能力的o1模型。Skywork o1在模型输出中内生了思考、计划、反思等能力,显著提升...
Chonkie:多种文本分块技术:基于Token、单词、句子与语义的分析方法
Chonkie是轻量级、快速且功能丰富的RAG(Retrieval-Augmented Generation)分块库,为文本处理设计。Chonkie支持基于Token、单词、句子和语义的多种分块方法...
声动视界:AI视频工具在带货短视频领域的翻译与配音功能
声动视界是面向带货短视频的AI视频工具。提供视频翻译、文本转语音和视频配音等功能,支持100多种语言,助力用户将产品推广至全球市场。基于音频合成技术,声...
Draw an Audio
Draw an Audio 是中国科学院自动化研究所和美团点评的研究人员推出的视频生成音频系统。根据视频内容自动生成匹配的声音效果,类似于电影制作中的 Foley 艺术...