AI工具

Llama 3.2

Llama 3.2是Meta公司最新推出的开源AI大模型系列,包括小型和中型视觉语言模型(11B和90B参数)以及轻量级纯文本模型(1B和3B参数)。Llama 3.2模型专为边缘...
阅读原文

MIMO

MIMO是阿里巴巴集团智能计算研究所推出的可控角色视频合成的新型AI框架,基于空间分解建模技术,将2D视频转换为3D空间代码,实现对角色、动作和场景的精确控...
阅读原文

豆包AI视频模型

豆包AI视频模型是字节跳动推出的两款AI视频生成大模型:PixelDance 和 Seaweed 。PixelDance基于DiT结构,擅长理解复杂指令,生成连贯、多主体交互的视频片段...
阅读原文

美图奇想大模型

美图奇想大模型(MiracleVision)是美图公司推出的一款AI视觉大模型,专注于美学创作,包括东方美学、人像和商业设计等。模型完成了视频生成能力的全面升级,...
阅读原文

Paradot

Paradot是由WithFeeling.AI推出的AI伴侣应用,专注于模拟真实的社交互动提供个性化的用户体验。基于先进的自然语言处理技术,记住用户的喜好和对话,建立深度...
阅读原文

SafeEar

SafeEar是由浙江大学和清华大学联合开发的AI音频伪造检测框架,保护用户隐私的同时检测音频伪造。采用基于神经音频编解码器的解耦模型,分离语音的声学信息和...
阅读原文

PDF2Audio

PDF2Audio 是一个开源工具,能将 PDF 文档转换成音频内容,适合制作播客、讲座或摘要。它基于 OpenAI 的 GPT 模型生成播客脚本,通过文本到语音技术转化为音频。
阅读原文

GraphReasoning

GraphReasoning是一种基于人工智能技术将大量科学论文转换成知识图谱的方法。通过结构化分析,计算节点度、识别社区及其连通性,评估关键节点的中心性,来揭...
阅读原文

Comic Translate

Comic Translate 是一个开源的漫画翻译工具,由开发者 ogkalu2 推出。帮助用户自动翻译全球各地的漫画,支持英语、韩语、日语、法语、简体中文、繁体中文、俄...
阅读原文

PearAI

PearAI 是一个开源的 AI 驱动的代码编辑器,基于 Visual Studio Code (VSCode) 开发。PearAI 集成AI技术,减少编程工作量提高开发效率。PearAI 支持开发者直...
阅读原文

EzAudio

EzAudio是由约翰霍普金斯大学和腾讯AI实验室共同推出的一款文本到音频(Text-to-Audio, T2A)生成模型。基于一种高效的扩散变换器技术,用在从文本提示生成高...
阅读原文

神笔马良

神笔马良是猫眼娱乐推出的AI影视创作生成工具,专门将剧本一键转换成动态故事板。通过智能分析剧本内容,提炼剧情,快速生成人物小传和AI画像、动态分镜,提...
阅读原文

Arcade

Arcade 是一个全球首个AI产品创作平台,基于生成式 AI 技术,用户通过简单的文字描述或图片设计独特的产品。设计珠宝、家居用品等,由 Arcade 的全球制造商网...
阅读原文

FLUX-Controlnet-Inpainting

FLUX-Controlnet-Inpainting 是阿里妈妈(Alibaba's Alimama)推出的一款图像修复工具,融合 ControlNet 和 FLUX.1-dev 技术。工具根据用户指定的掩码区...
阅读原文

Reel.AI

Reel.AI 是 CreativeFitting(井英科技)开发的全球首款 AI 短剧应用,它基于 AI 技术生成短视频内容,为用户带来新的娱乐体验。应用在海外市场推出后,迅速...
阅读原文