LeviTor:创新3D目标轨迹控制视频合成技术提升视觉效果与交互体验

LeviTor是南京大学、蚂蚁集团、浙江大学等机构推出的图像到视频合成技术,结合深度信息和K-means聚类点控制视频中3D物体的轨迹,无需显式的3D轨迹跟踪。LeviT...
阅读原文

什么是知识表示(Knowledge Representation)

知识表示(Knowledge Representation)是指将知识以一种机器可理解的形式表示出来,它涉及数据结构及其处理机制的综合:表示= 数据结构+处理机制。在知识表示...
阅读原文

什么是机器人流程自动化(Robotic Process Automation, RPA)

机器人流程自动化(Robotic Process Automation, RPA)是一种软件技术,通过模拟人类行为与数字系统和软件进行互动,实现业务流程的自动化。RPA软件机器人能...
阅读原文

什么是具身智能(Embodied Intelligence, EI)

具身智能(Embodied Intelligence, EI)是一个多学科交叉的研究领域,它涉及认知科学、人工智能、机器人技术、神经科学等多个领域。具身智能的核心观点是,智...
阅读原文

什么是规模定律(Scaling Law)

规模定律(Scaling Law)描述了模型性能如何随着模型规模(如参数数量)、训练数据集大小以及用于训练的计算资源的增加而变化。体现为模型性能与这些因素之间...
阅读原文

OCTAVE

OCTAVE(Omni-Capable Text and Voice Engine)是Hume AI推出的新一代语音语言模型,结合EVI 2模型和OpenAI、Elevenlab、Google Deepmind等系统的能力。OCTAV...
阅读原文

BeautifyX

BeautifyX是AI照片生成应用,用户通过简单的操作将肖像和风景照片转换成AI动漫风格图像。用户无需专业编辑技能,只需上传照片,应用内的AI绘图工具能快速转换...
阅读原文

Leya

Leya 是专为法律专业人士设计的AI法律服务平台,基于集成AI工具优化法律工作流程。Leya能自动化重复性任务,聚合信息,并提供对法律资源及用户数据的一站式访...
阅读原文

Univer:智能办公助手全面提升Word和Excel文档处理效率

Univer是开源的全栈框架,支持创建和编辑电子表格、文档及幻灯片,为用户提供统一且强大的办公解决方案。Univer能在浏览器和Node.js环境中运行,易于集成到各...
阅读原文

No more copyright:智能图像生成平台助力创意无限

No more copyright是在线平台,基于AI技术帮助用户将上传的图片转换成独特且无版权问题的版本,专为创意探索和灵感激发而设计。用户上传图像,平台生成新的、...
阅读原文

SceneXplain:智能图像识别工具为复杂场景提供精准描述与上下文分析

SceneXplain 是先进的AI工具,专注于图像描述和视频摘要。SceneXplain 基于多模态算法,提供图像描述、视频摘要、替代文本生成、视觉问答等功能,能提升视觉...
阅读原文

机器人端侧模型的十字路口

大模型、机器人与芯片厂商的拉力赛。
阅读原文

什么是检索增强生成(Retrieval-Augmented Generation, RAG)

检索增强生成(Retrieval-Augmented Generation, RAG)是一种结合了信息检索(IR)和自然语言生成(NLG)的技术。它通过从外部知识库中检索相关信息来增强大...
阅读原文