标签:实时反馈
GR00T-Teleop
GR00T-Teleop是NVIDIA Isaac GR00T的一部分,用在捕获远程操作数据的关键技术。基于NVIDIA CloudXR连接Apple Vision Pro头显,用专门设计的人形远程操作自定...
Perception-as-Control
Perception-as-Control是阿里巴巴通义实验室推出的图像动画框架,能根据用户意图实现细粒度的运动控制。Perception-as-Control基于构建3D感知运动表示,将相...
GeneralDyG
GeneralDyG 是南洋理工大学研究团队提出的通用动态图异常检测方法,旨在解决动态图数据在社交网络、电商和网络安全等领域的异常检测问题。通过时间 ego-graph...
Large Motion Model
Large Motion Model(LMM)是统一的多模态运动生成模型,是新加坡南洋理工大学S-Lab和商汤科技研究团队共同推出的。LMM能处理包括文本到运动、音乐到舞蹈等多...
Qwen-Agent
Qwen-Agent是基于通义千问模型(Qwen)的开源Agent开发框架,支持开发者用Qwen模型的指令遵循、工具使用、规划和记忆能力构建智能代理应用。Qwen-Agent支持函...
Mathtutor on Groq
Mathtutor on Groq 是基于 Groq 架构的AI数学辅导工具,基于语音识别功能,支持用户用语音形式提出数学问题。工具内置强大的数学引擎,能实时计算并用 LaTeX ...
VirtualFit:智能虚拟试衣助手实现多功能换衣与图像恢复扩展
VirtualFit是创新的AI虚拟试衣工具,基于人工智能技术让用户能轻松更换服装、恢复图像细节和扩展图像大小。用户只需上传照片,可选择不同的服装样式,AI会自...
Motion Prompting:谷歌携手密歇根与布朗大学推出创新轨迹控制视频生成模型
Motion Prompting是 Google DeepMind、密歇根大学和布朗大学联合推出的视频生成技术,基于运动轨迹(motion trajectories)控制和引导视频内容的生成。Motion...
BrightHire:智能面试助手提升招聘效率与面试官技能的全新解决方案
BrightHire 是先进的AI招聘平台,基于AI技术提升招聘流程的质量和效率。BrightHire 构建结构化的面试计划、自动记录和转录面试、提供AI驱动的面试笔记和一键...
DELIFT:数据驱动的高效语言模型指令微调技术提升智能交互体验
DELIFT(Data Efficient Language model Instruction Fine-Tuning)是新型算法,用在优化大型语言模型(LLMs)在指令调优、任务特定微调和持续微调三个关键阶...