AI工具

xAR

xAR 是字节跳动和约翰·霍普金斯大学联合提出的新型自回归视觉生成框架。框架通过“下一个X预测”(Next-X Prediction)和“噪声上下文学习”(Noisy Context Lear...
阅读原文

AI-Infra-Guard

AI-Infra-Guard是腾讯开源的高效、轻量级易于使用的 AI 基础设施安全评估工具,能发现和检测 AI 系统中的潜在安全风险。AI-Infra-Guard支持 28 种 AI 框架指...
阅读原文

Mahilo

Mahilo 是灵活的多智能体框架,支持创建与人类互动的多智能体系统。Mahilo支持实时语音和文本通信,智能体之间能自主共享上下文和信息,保持人类对交互的监督...
阅读原文

WorldCraft

WorldCraft是香港科技大学推出的基于大型语言模型(LLM)代理的3D世界创建和定制系统,用在创建和定制逼真的3D虚拟世界。基于自然语言交互,让用户能轻松生成...
阅读原文

Mobius

Mobius 是先进的无缝循环视频生成技术,能通过人工智能算法从文本描述生成无限循环的视频内容。核心在于强大的AI模型,能自动识别视频中的关键元素并生成平滑...
阅读原文

LDGen

LDGen是创新的文本到图像合成技术,通过结合大型语言模型(LLMs)与扩散模型,提升文本描述到图像生成的质量和语义一致性。通过分层标题优化和人类指令技术,...
阅读原文

HippoRAG 2

HippoRAG 2是俄亥俄州立大学推出的检索增强生成(RAG)框架,解决现有RAG系统在模拟人类长期记忆动态性和关联性方面的局限性。HippoRAG 2基于个性化PageRank...
阅读原文

FLORA

FLORA是AI创意工具平台,专为设计师、创意工作者和内容创作者打造。通过节点式AI画布,将文本、图像和视频生成等多种功能集成在一个无限画布上,极大地简化了...
阅读原文

AIMv2

AIMv2是苹果公司开源的多模态自回归预训练视觉模型,通过图像和文本的深度融合提升视觉模型的性能。采用创新的预训练框架,将图像划分为非重叠的图像块,将文...
阅读原文

VidSketch

VidSketch 是浙江大学 CAD&CG 国家重点实验室和软件学院推出的创新视频生成框架,根据手绘草图和简单文本提示生成高质量的视频动画。VidSketch基于“层级...
阅读原文

Baichuan-Audio

Baichuan-Audio是百川智能推出的端到端音频大语言模型,支持无缝集成音频理解和生成功能,实现支持高质量、可控的实时中英双语对话。Baichuan-Audio基于多码...
阅读原文

Ideogram 2a

Ideogram 2a 是 AI 图像生成公司 Ideogram 最新发布的文生图模型,模型在 Ideogram 2.0 的基础上进行了优化,主打高效性和实用性,生成速度显著提升,成本降...
阅读原文

Pika 2.2

Pika 2.2 是 Pika Labs 推出的升级版 AI 视频生成工具,基于深度学习技术,能将图片或文字提示转化为高质量的视频内容。与前代版本相比,Pika 2.2 在功能和性...
阅读原文

Hero Stuff

Hero Stuff是基于人工智能的二手物品销售助手工具。用户只需通过手机拍照,Hero Stuff能快速识别物品,自动生成商品描述、定价和发布信息。支持一键将商品发...
阅读原文

Linkeddit

Linkeddit 是基于人工智能的工具,帮助用户从 Reddit 平台快速挖掘潜在客户、合作伙伴或目标受众。通过 AI 算法分析 Reddit 上的海量用户数据,根据用户输入...
阅读原文