AI工具

LOOK

LOOK是实时AI时尚设计工具,专为时尚设计师开发。LOOK基于先进的AIGC技术,将设计概念即时转化为视觉呈现,简化传统设计流程。设计师在Procreate中绘制草图时...
阅读原文

FluxSR

FluxSR是新型的单步扩散模型,是上海交通大学、哈佛大学、华南理工大学和华为诺亚方舟实验室推出的专门用在真实世界图像超分辨率(Real-ISR)任务。FluxSR基...
阅读原文

DynamicFace

DynamicFace是小红书团队推出新型的视频换脸技术,技术通过结合扩散模型和即插即用的时间层,基于3D面部先验知识,实现高质量和一致性的视频换脸效果。 Dynam...
阅读原文

OpusClip

OpusClip 是AI视频剪辑工具,专为将长视频快速转换为适合社交媒体传播的短视频设计。通过先进的AI技术,能自动识别精彩片段并生成短视频,支持一键发布到TikT...
阅读原文

Gemini 2.0 Pro

Gemini 2.0 Pro是Google推出的高性能实验版AI模型,专为编程性能和复杂提示处理优化。Gemini 2.0 Pro具备200万tokens的超大上下文窗口,能处理和分析海量信息...
阅读原文

MnnLlmApp

MnnLlmApp 是阿里巴巴基于 MNN-LLM 框架开源的 Android 手机应用,支持各类大语言模型(LLM)在手机上离线运行。具备多模态功能,能实现文本生成文本、图像生...
阅读原文

DeepRAG

DeepRAG 是中科院、中科大和腾讯微信AI部联合推出的新型检索增强生成(RAG)框架,提升大型语言模型(LLMs)在推理和检索任务中的性能。通过将检索增强推理建...
阅读原文

qeen.ai

qeen.ai 是谷歌和 DeepMind 前员工为电子商务企业提供自主 AI Agent平台,帮助商家优化内容创作、营销和对话销售。 AI Agent 基于专有的 RL-UI 技术,实时从...
阅读原文

OpenDeepResearcher

OpenDeepResearcher 是开源的 AI 研究工具,能帮助用户高效地完成复杂的信息查询和分析任务。基于迭代搜索和推理,自动从网络中获取相关数据,生成综合报告。...
阅读原文

OCRmyPDF

OCRmyPDF 是开源的命令行工具,专为将扫描的 PDF 文件转换为可搜索、可复制的文档。通过添加 OCR 文本层,将无法直接编辑的扫描 PDF 文件能被搜索和编辑。工...
阅读原文

node-DeepResearch

node-DeepResearch 是开源的 AI 智能体项目,基于持续搜索和阅读网页,用 Gemini 语言模型和 Jina Reader 工具,逐步推理、回答复杂问题,直到找到答案或超出...
阅读原文

OmniHuman

OmniHuman 是字节跳动推出的端到端多模态条件化人类视频生成框架,能基于单张人类图像和运动信号(如音频、视频或两者的组合)生成逼真的人类视频。OmniHuman...
阅读原文

绘声美音

绘声美音是免费的在线AI翻唱软件,用户无需下载,通过微信公众号使用。支持声音克隆与翻唱,用户上传3分钟以上的语音即可训练声音模型,之后可选择平台提供的...
阅读原文

Hika

Hika是国内五人团队开发的免费AI知识搜索工具,通过个性化交互和多维度知识探索,帮助用户获得更全面和深入的搜索结果。与传统AI搜索工具不同,不追求“一步到...
阅读原文

VideoReward

VideoReward 是香港中文大学、清华大学、快手科技等联合创建的视频生成偏好数据集及奖励模型。包含182,000条标注数据,涵盖视觉质量、运动质量和文本对齐三个...
阅读原文
18990919293244