AI工具

Oryx

Oryx是由清华大学、腾讯和南洋理工大学联合推出的多模态大型语言模型(MLLM),基于两项核心创新来处理视觉数据,预训练的OryxViT模型和动态压缩模块。OryxVi...
阅读原文

I2VEdit

I2VEdit是一个先进的视频编辑框架,通过图像到视频的扩散模型实现首帧引导的视频编辑。用户只需编辑视频的第一帧,I2VEdit能自动将编辑效果应用到整个视频。
阅读原文

HouseCrafter

HouseCrafter 是由东北大学和 Stability AI 推出的先进技术,将二维平面图自动转换成三维室内场景。基于一个网络规模图像训练的2D扩散模型,生成一致的多视图...
阅读原文

AMD-135M

AMD-135M是AMD推出的首款小型语言模型(SLM),为特定用例提供性能与资源消耗之间的平衡。基于LLaMA2模型架构,在AMD Instinct MI250加速器上训练,基于670亿...
阅读原文

JoyHallo

JoyHallo 是京东开源的AI数字人模型,专为普通话设计,能根据音频生成逼真的说话视频。特别适合处理普通话的复杂口型和语调,具有跨语言生成视频的能力。
阅读原文

Steve AI

Steve AI 是一个基于云端的AI视频生成平台,能将文本、博客、网页或音频内容快速转化为高质量的视频和动画。平台基于先进的AI技术,用户即使没有视频编辑经验...
阅读原文

Seed-VC

Seed-VC 是一种零样本声音转换技术,基于上下文学习实现高质量的音频输出和音色相似度。用户无需进行特定训练,只需提供1到30秒的参考语音样本,实现声音的克...
阅读原文

Phidias

Phidias是一个先进的3D内容生成模型,将检索增强生成(RAG)的概念引入到3D建模领域。模型能基于用户提供的或从大型数据库中检索到的3D参考模型,辅助生成新...
阅读原文

Movie Gen

Movie Gen 是 Meta 推出的AI视频生成工具,能根据文本提示生成和编辑视频,为视频配上同步音频。技术包括创建长达16秒的高清视频、为现有视频配上音频、编辑...
阅读原文

Mini-LLaVA

Mini-LLaVA是一款轻量级的多模态大语言模型,由清华大学和北京航空航天大学的研究团队联合开发。能处理图像、文本和视频输入,实现高效的多模态数据处理。Min...
阅读原文

MemoryScope

MemoryScope是一个为大型语言模型(LLM)聊天机器人设计的长期记忆系统。通过构建一个框架,使机器人记住用户的基础信息、习惯和偏好,提供个性化的交互体验...
阅读原文

CogView3

CogView3是清华大学联合智谱AI推出的开源AI图像生成模型,采用中继扩散技术。模型分阶段生成图像,首先创建低分辨率图像,然后通过中继超分辨率技术提升至高...
阅读原文

DataCamp

DataCamp 是一个领先的在线学习平台,专注于数据科学、AI和编程技能的培训。为学习者提供超过900个互动课程,涵盖 Python、R、SQL、Excel、Tableau 等多种技...
阅读原文

Mage

Mage 是一个基于人工智能的创意平台,基于先进的 AI 技术帮助用户将文本描述转换成高质量的数字艺术作品。支持多种艺术风格和自定义选项,创作过程简单而高效...
阅读原文

CoCounsel

CoCounsel 是由 Casetext 推出的AI法律助手,基于先进的机器学习技术快速完成法律研究、文件审查和合同分析等任务。工具能理解自然语言指令,提供高效、准确...
阅读原文