AI工具

Avat3r

Avat3r 是慕尼黑工业大学和 Meta Reality Labs 推出的高保真三维头部头像的大型可动画高斯重建模型,仅需几张输入图像,能生成高质量且可动画化的 3D 头部头...
阅读原文

WhisperChain

WhisperChain 是开源的语音识别工具,基于语音输入提升工作效率。WhisperChain用 Whisper.cpp 实现实时语音识别,将语音转换为文本,基于 LangChain 对文本进...
阅读原文

TurboLearn

Turbolearn 是AI学习工具,基于AI技术将录音和PDF文件转化为高效的学习资料,如笔记、闪卡、测验和播客。Turbolearn支持笔记中插入表格、表情符号、图表和公...
阅读原文

星火医疗大模型X1

星火医疗大模型X1是科大讯飞发布的深度推理大模型,专门针对医疗领域设计,具备强大的复杂问题处理能力。模型通过深度推理算法,能逐步解释循证过程,显著降...
阅读原文

T2V-01-Director

T2V-01-Director 是海螺AI(MiniMax)推出的文本到视频生成工具,专注于通过自然语言指令实现精准的镜头运动控制。支持用户在生成视频时,通过简单的文字描述...

飞书知识问答

飞书知识问答是飞书智能办公平台推出的高效知识管理与问答工具,帮助企业快速获取信息、提升知识共享效率。基于强大的AI技术,支持实时联网搜索和多格式文件...
阅读原文

WarriorCoder

WarriorCoder 是华南理工大学计算机科学与工程学院和微软推出的代码生成大语言模型(LLM)。基于模拟专家模型之间的对抗生成高质量训练数据,提升模型性能。...
阅读原文

MakeBestMusic

MakeBestMusic 是基于AI技术的音乐创作平台,基于简单易用的工具帮助用户快速生成高质量的个性化音乐。用户用文本描述生成器乐或人声音乐,基于上传音频进行...
阅读原文

xAR

xAR 是字节跳动和约翰·霍普金斯大学联合提出的新型自回归视觉生成框架。框架通过“下一个X预测”(Next-X Prediction)和“噪声上下文学习”(Noisy Context Lear...
阅读原文

AI-Infra-Guard

AI-Infra-Guard是腾讯开源的高效、轻量级易于使用的 AI 基础设施安全评估工具,能发现和检测 AI 系统中的潜在安全风险。AI-Infra-Guard支持 28 种 AI 框架指...
阅读原文

Mahilo

Mahilo 是灵活的多智能体框架,支持创建与人类互动的多智能体系统。Mahilo支持实时语音和文本通信,智能体之间能自主共享上下文和信息,保持人类对交互的监督...
阅读原文

WorldCraft

WorldCraft是香港科技大学推出的基于大型语言模型(LLM)代理的3D世界创建和定制系统,用在创建和定制逼真的3D虚拟世界。基于自然语言交互,让用户能轻松生成...
阅读原文

Mobius

Mobius 是先进的无缝循环视频生成技术,能通过人工智能算法从文本描述生成无限循环的视频内容。核心在于强大的AI模型,能自动识别视频中的关键元素并生成平滑...
阅读原文

LDGen

LDGen是创新的文本到图像合成技术,通过结合大型语言模型(LLMs)与扩散模型,提升文本描述到图像生成的质量和语义一致性。通过分层标题优化和人类指令技术,...
阅读原文

HippoRAG 2

HippoRAG 2是俄亥俄州立大学推出的检索增强生成(RAG)框架,解决现有RAG系统在模拟人类长期记忆动态性和关联性方面的局限性。HippoRAG 2基于个性化PageRank...
阅读原文
16970717273244