AI项目和框架

StyleShot

StyleShot 是开源的AI图像风格迁移模型,无需额外训练即可实现任意风格到任意内容的迁移。通过风格感知编码器提取风格特征,基于内容融合编码器加强风格与内...
阅读原文

IMAGDressing

IMAGDressing是华为联合腾讯推出的AI换衣工具,IMAGDressing支持用户通过模块化的方式生成服装,并在虚拟环境中进行试穿。项目页面提供了自动化工作流程、代...
阅读原文

NextChat

NextChat是一个基于 Next.js 和 Vercel 的开源项目,支持用户将 ChatGPT 等 AI 大模型集成到自己的网页应用中。NextChat不仅提供了现成的代码库,还支持一键...
阅读原文

DistriFusion

DistriFusion是高分辨率扩散模型的分布式并行推理框架,通过分布式并行推理显著加速了扩散模型在多个GPU上生成高分辨率图像的过程。DistriFusion利用patch pa...
阅读原文

Still-Moving

Still-Moving是DeepMind推出的AI视频生成框架,支持用户定制文本到视频(T2V)模型,无需特定视频数据。通过训练轻量级的空间适配器,Still-Moving能在静止图像...
阅读原文

AutoShorts

AutoShorts是开源的AI视频创作和发布平台,使用AI技术一键生成并定制无脸视频。AutoShorts支持自定义脚本、配音和视觉效果,每天自动发布新视频到YouTube和Ti...
阅读原文

HeadGAP

HeadGAP是字节跳动和上海科技大学共同推出的3D头像生成模型,仅用少量图片快速生成逼真的3D头像。采用先验学习和个性化创建阶段的框架,基于大规模多视角动态...
阅读原文

LMMs-Eval

LMMs-Eval 是一个专为多模态AI模型设计的统一评估框架,提供标准化、广泛覆盖且成本效益高的模型性能评估解决方案。包含超过50个任务和10多个模型,通过透明...
阅读原文

MooER

MooER是摩尔线程推出的业界首个基于国产全功能GPU训练的开源音频理解大模型。不仅能进行中文和英文的语音识别,还具备中译英的语音翻译能力。
阅读原文

StockBot

StockBot 是一个基于Llama3的AI金融Agent,提供实时股票信息、财务数据、新闻和互动图表。支持多资产市场,包括股票、外汇、债券和加密货币。用户可通过自然...
阅读原文

Imagine Yourself

Imagine Yourself 是Meta公司推出的个性化AI图像生成模型,突破了传统方法的局限,无需对每个用户进行单独调整,通过单一模式即可满足不同用户需求。模型采用...
阅读原文

Bark

Bark是Suno AI 推出的开源文本到音频模型,能生成逼真的多语言语音和多种音频类型,包括音乐、背景噪音等,同时支持非语言交流如笑声和哭泣。Bark提供预训练...
阅读原文

eSearch

eSearch是一款开源的跨平台AI桌面应用,集成了截屏、OCR识别、搜索翻译、贴图、以图搜图和屏幕录制等功能。eSearch基于Electron框架开发,适用于Linux、Windo...
阅读原文

Sapiens

Sapiens是Meta实验室推出的AI视觉模型,专为理解图片和视频中的人类动作设计。支持二维姿势预估、身体部位分割、深度估计和表面法线预测等任务,采用视觉转换...
阅读原文

TrackGo

TrackGo是先进的可控AI视频生成技术,通过用自由形状的遮罩和箭头,为用户提供了一种灵活而精确的机制来控制视频中对象的运动。技术的核心是TrackAdapter,一...
阅读原文
1585960616286