AI工具

VideoJAM

VideoJAM是Meta推出的,用在增强视频生成模型运动连贯性的框架。基于引入联合外观-运动表示,让模型在训练阶段同时学习预测视频的像素和运动信息,在推理阶段...
阅读原文

SynCD

SynCD(Synthetic Customization Dataset)是卡内基梅隆大学和Meta推出的高质量合成训练数据集,用在提升文本到图像模型的定制化能力。SynCD包含多个相同对象...
阅读原文

Onlook

Onlook是开源的视觉编辑工具,专为 React 应用程序设计,帮助设计师和开发人员更高效地协作。支持用户在浏览器中直接修改 React 应用的 UI,实时查看效果,将...
阅读原文

Le Chat APP

Le Chat APP是法国人工智能初创公司Mistral AI推出的AI对话助手应用。支持自然语言对话、实时网页搜索、文档分析和图像生成等功能。Le Chat提供基础版免费使...
阅读原文

MatAnyone

MatAnyone是南洋理工大学S-Lab实验室和商汤科技推出的,针对复杂背景人像视频抠图的先进框架,专注于目标指定的视频抠图任务。MatAnyone基于一致的内存传播模...
阅读原文

TabTac

TabTac是AI驱动的新一代浏览器,专注于提升用户的搜索、网页浏览和办公效率。内置ChatGPT技术,支持滑词搜索、识图生文、AI Summarize和AI Copilot等功能,能...
阅读原文

s1

s1是斯坦福大学和华盛顿大学的研究团队开发的低成本、高性能的AI推理模型。模型通过“蒸馏”技术从谷歌的Gemini 2.0 Flash Thinking Experimental模型中提取推...
阅读原文

MimicPhoto

MimicPhoto 是 GenAI Works 推出的 AI 驱动的照片编辑工具,专注于通过智能技术提升照片中的人物面部表情和整体效果。能快速调整笑容、眼神等细节,让照片中...
阅读原文

LipRead Pro

LipRead Pro 是基于先进 AI 技术的视频唇读工具,能将视频中的唇部动作转换为文字。采用最新的深度学习模型,支持多种语言和口音,应用于内容创作、无障碍辅...
阅读原文

RAG-FiT

RAG-FiT(曾用名RAG Foundry)是英特尔实验室推出的开源框架,用在微调(fine-tuning)增强大型语言模型(LLMs)在检索增强生成(RAG)任务中的表现。RAG-FiT...
阅读原文

LOOK

LOOK是实时AI时尚设计工具,专为时尚设计师开发。LOOK基于先进的AIGC技术,将设计概念即时转化为视觉呈现,简化传统设计流程。设计师在Procreate中绘制草图时...
阅读原文

FluxSR

FluxSR是新型的单步扩散模型,是上海交通大学、哈佛大学、华南理工大学和华为诺亚方舟实验室推出的专门用在真实世界图像超分辨率(Real-ISR)任务。FluxSR基...
阅读原文

DynamicFace

DynamicFace是小红书团队推出新型的视频换脸技术,技术通过结合扩散模型和即插即用的时间层,基于3D面部先验知识,实现高质量和一致性的视频换脸效果。 Dynam...
阅读原文

OpusClip

OpusClip 是AI视频剪辑工具,专为将长视频快速转换为适合社交媒体传播的短视频设计。通过先进的AI技术,能自动识别精彩片段并生成短视频,支持一键发布到TikT...
阅读原文

Gemini 2.0 Pro

Gemini 2.0 Pro是Google推出的高性能实验版AI模型,专为编程性能和复杂提示处理优化。Gemini 2.0 Pro具备200万tokens的超大上下文窗口,能处理和分析海量信息...
阅读原文
15152535455207