AI工具

MAETok

MAETok(Masked Autoencoders Tokenizer)是卡内基梅隆大学、香港大学、北京大学等机构推出的用在扩散模型的新型图像标记化方法。MAETok基于掩码建模(Mask M...
阅读原文

倍客AI

倍客AI是专注于 AI 内容创作的平台,通过人工智能技术为商业摄影、广告设计、电商展示等领域提供高效、高质量的创意解决方案。平台的核心功能包括 AI 商图、A...
阅读原文

JoyGen

JoyGen是京东科技和香港大学推出的,音频驱动的3D说话人脸视频生成框架,专注于实现精确的唇部与音频同步及高质量的视觉效果。JoyGen结合音频特征和面部深度...
阅读原文

Seede.ai

Seede.ai是 AI 图像设计工具,专为简化设计流程,使没有设计经验的用户能在短时间内创建出专业级的设计作品。提供一句话生成设计,用户只需输入简单描述,AI...
阅读原文

LIMO

LIMO(Less Is More for Reasoning)是上海交通大学研究团队提出的高效推理方法,通过极少量高质量的训练样本激活大语言模型(LLM)的复杂推理能力。核心假设...
阅读原文

VideoJAM

VideoJAM是Meta推出的,用在增强视频生成模型运动连贯性的框架。基于引入联合外观-运动表示,让模型在训练阶段同时学习预测视频的像素和运动信息,在推理阶段...
阅读原文

SynCD

SynCD(Synthetic Customization Dataset)是卡内基梅隆大学和Meta推出的高质量合成训练数据集,用在提升文本到图像模型的定制化能力。SynCD包含多个相同对象...
阅读原文

Onlook

Onlook是开源的视觉编辑工具,专为 React 应用程序设计,帮助设计师和开发人员更高效地协作。支持用户在浏览器中直接修改 React 应用的 UI,实时查看效果,将...
阅读原文

Le Chat APP

Le Chat APP是法国人工智能初创公司Mistral AI推出的AI对话助手应用。支持自然语言对话、实时网页搜索、文档分析和图像生成等功能。Le Chat提供基础版免费使...
阅读原文

MatAnyone

MatAnyone是南洋理工大学S-Lab实验室和商汤科技推出的,针对复杂背景人像视频抠图的先进框架,专注于目标指定的视频抠图任务。MatAnyone基于一致的内存传播模...
阅读原文

TabTac

TabTac是AI驱动的新一代浏览器,专注于提升用户的搜索、网页浏览和办公效率。内置ChatGPT技术,支持滑词搜索、识图生文、AI Summarize和AI Copilot等功能,能...
阅读原文

s1

s1是斯坦福大学和华盛顿大学的研究团队开发的低成本、高性能的AI推理模型。模型通过“蒸馏”技术从谷歌的Gemini 2.0 Flash Thinking Experimental模型中提取推...
阅读原文

MimicPhoto

MimicPhoto 是 GenAI Works 推出的 AI 驱动的照片编辑工具,专注于通过智能技术提升照片中的人物面部表情和整体效果。能快速调整笑容、眼神等细节,让照片中...
阅读原文

LipRead Pro

LipRead Pro 是基于先进 AI 技术的视频唇读工具,能将视频中的唇部动作转换为文字。采用最新的深度学习模型,支持多种语言和口音,应用于内容创作、无障碍辅...
阅读原文

RAG-FiT

RAG-FiT(曾用名RAG Foundry)是英特尔实验室推出的开源框架,用在微调(fine-tuning)增强大型语言模型(LLMs)在检索增强生成(RAG)任务中的表现。RAG-FiT...
阅读原文
11920212223175