AI项目和框架

Wav2Lip

Wav2Lip是开源的唇形同步工具,支持用户将音频文件转换成与口型同步的视频,广泛应用于视频编辑和游戏开发等领域。Wav2Lip不仅能够实现实时口型生成,还支持...
阅读原文

AuraFlow

AuraFlow v0.1是Fal团队推出的开源AI文生图模型,拥有6.8B参数量。优化了MMDiT架构,提升了模型的计算效率和可扩展性。AuraFlow擅长精准图像生成,尤其在物体...
阅读原文

LongWriter

LongWriter 是清华大学联合智谱AI推出的长文本生成模型,能生成超10,000字的连贯文本,项目已开源。通过分析现有大型语言模型的输出限制,创建了"LongWr...
阅读原文

源2.0-M32

源2.0-M32是浪潮信息推出的拥有32个专家的混合专家模型(MoE)。采用创新的"Attention Router"技术,提高了模型选择专家的效率和准确性。模型总参数...
阅读原文

Zion

Zion是一个零代码AI应用开发平台,通过可视化配置和拖拽式交互,大幅降低了应用开发的技术门槛。用户无需编程知识即可快速构建小程序、网站等应用。Zion集成...
阅读原文

Dify

Dify是开源的生成式AI应用开发平台,提供从 Agent 构建到 AI workflow 编排、RAG 检索、模型管理等一站式服务。Dify使开发者能专注于创造应用的核心价值,并...
阅读原文

因赛AIGC

因赛AIGC是因赛集团推出的AI营销工具,InsightGPT结合AI技术与营销策略洞察、内容创意生产、传播投放及效果转化,提升营销行业的生产力。InsightGPT不仅具备...
阅读原文

Transfusion

Transfusion是Meta公司最新推出的文本与图像融合的多模态AI模型,Transfusion通过结合语言模型的下一个token预测和扩散模型,在单一变换器上处理混合模态数据...
阅读原文

RAGFlow

RAGFlow 是开源的 RAG(Retrieval-Augmented Generation)引擎,拥有深入理解文档并增强生成能力,是基于OCR和文档解析的下一代 RAG 引擎。RAGFlow通过集成自...
阅读原文

StyleShot

StyleShot 是开源的AI图像风格迁移模型,无需额外训练即可实现任意风格到任意内容的迁移。通过风格感知编码器提取风格特征,基于内容融合编码器加强风格与内...
阅读原文

IMAGDressing

IMAGDressing是华为联合腾讯推出的AI换衣工具,IMAGDressing支持用户通过模块化的方式生成服装,并在虚拟环境中进行试穿。项目页面提供了自动化工作流程、代...
阅读原文

NextChat

NextChat是一个基于 Next.js 和 Vercel 的开源项目,支持用户将 ChatGPT 等 AI 大模型集成到自己的网页应用中。NextChat不仅提供了现成的代码库,还支持一键...
阅读原文

DistriFusion

DistriFusion是高分辨率扩散模型的分布式并行推理框架,通过分布式并行推理显著加速了扩散模型在多个GPU上生成高分辨率图像的过程。DistriFusion利用patch pa...
阅读原文

Still-Moving

Still-Moving是DeepMind推出的AI视频生成框架,支持用户定制文本到视频(T2V)模型,无需特定视频数据。通过训练轻量级的空间适配器,Still-Moving能在静止图像...
阅读原文

AutoShorts

AutoShorts是开源的AI视频创作和发布平台,使用AI技术一键生成并定制无脸视频。AutoShorts支持自定义脚本、配音和视觉效果,每天自动发布新视频到YouTube和Ti...
阅读原文
1353637383964