AI工具
Emotion-LLaMA
Emotion-LLaMA是多模态情绪识别与推理模型,融合了音频、视觉和文本输入,通过特定情绪编码器整合信息。模型基于修改版LLaMA,经指令调整以提升情感识别能力...
GR00T-Teleop
GR00T-Teleop是NVIDIA Isaac GR00T的一部分,用在捕获远程操作数据的关键技术。基于NVIDIA CloudXR连接Apple Vision Pro头显,用专门设计的人形远程操作自定...
Riona-AI-Agent
Riona-AI-Agent是Node.js 和 TypeScript 构建的 AI 驱动的自动化工具,能与 Instagram、Twitter 和 GitHub 等社交媒体平台进行交互。Riona-AI-Agent能生成引...
AIPaperGPT
AIPaperGPT(知学术AIPaperGPT)是创新的AI论文写作辅助平台,旨在通过智能化服务提升学术写作的效率和质量。集成了多种功能的智能写作系统。基于最先进的大...
Perception-as-Control
Perception-as-Control是阿里巴巴通义实验室推出的图像动画框架,能根据用户意图实现细粒度的运动控制。Perception-as-Control基于构建3D感知运动表示,将相...
Motion Dreamer
Motion Dreamer是香港科技大学(广州)研究者提出的视频生成框架,旨在生成运动合理视频。基于两阶段生成方式,先基于输入图像和运动条件生成中间运动表示,...