标签:多语言支持
AgiBot Digital World
AgiBot Digital World 是智元机器人推出的高保真机器人仿真框架,为机器人操作技能研究与应用提供高效支持。AgiBot Digital World集成海量逼真的三维资产、多...
WhisperChain
WhisperChain 是开源的语音识别工具,基于语音输入提升工作效率。WhisperChain用 Whisper.cpp 实现实时语音识别,将语音转换为文本,基于 LangChain 对文本进...
T2V-01-Director
T2V-01-Director 是海螺AI(MiniMax)推出的文本到视频生成工具,专注于通过自然语言指令实现精准的镜头运动控制。支持用户在生成视频时,通过简单的文字描述...
HippoRAG 2
HippoRAG 2是俄亥俄州立大学推出的检索增强生成(RAG)框架,解决现有RAG系统在模拟人类长期记忆动态性和关联性方面的局限性。HippoRAG 2基于个性化PageRank...
Baichuan-Audio
Baichuan-Audio是百川智能推出的端到端音频大语言模型,支持无缝集成音频理解和生成功能,实现支持高质量、可控的实时中英双语对话。Baichuan-Audio基于多码...