OCRmyPDF

OCRmyPDF 是开源的命令行工具,专为将扫描的 PDF 文件转换为可搜索、可复制的文档。通过添加 OCR 文本层,将无法直接编辑的扫描 PDF 文件能被搜索和编辑。工...
阅读原文

node-DeepResearch

node-DeepResearch 是开源的 AI 智能体项目,基于持续搜索和阅读网页,用 Gemini 语言模型和 Jina Reader 工具,逐步推理、回答复杂问题,直到找到答案或超出...
阅读原文

OmniHuman

OmniHuman 是字节跳动推出的端到端多模态条件化人类视频生成框架,能基于单张人类图像和运动信号(如音频、视频或两者的组合)生成逼真的人类视频。OmniHuman...
阅读原文

绘声美音

绘声美音是免费的在线AI翻唱软件,用户无需下载,通过微信公众号使用。支持声音克隆与翻唱,用户上传3分钟以上的语音即可训练声音模型,之后可选择平台提供的...
阅读原文

Hika

Hika是国内五人团队开发的免费AI知识搜索工具,通过个性化交互和多维度知识探索,帮助用户获得更全面和深入的搜索结果。与传统AI搜索工具不同,不追求“一步到...
阅读原文

VideoReward

VideoReward 是香港中文大学、清华大学、快手科技等联合创建的视频生成偏好数据集及奖励模型。包含182,000条标注数据,涵盖视觉质量、运动质量和文本对齐三个...
阅读原文

MILS

MILS(Multimodal Iterative LLM Solver)是Meta AI提出的无需训练即可赋予大型语言模型(LLM)多模态能力的方法。通过多步推理,提示LLM生成候选输出,对每...
阅读原文

Telescope 2.0

Telescope 2.0是AI驱动的销售线索生成平台,通过智能标准(Smart Criteria)功能,让用户能使用完全自定义的条件快速精准地搜索销售线索。平台主要面向销售专...
阅读原文

Granola

Granola是专为频繁参加会议的人设计的AI会议助手工具。能实时转录会议内容,自动识别发言者并标注时间戳,支持用户在会议中实时添加笔记和标记重点。会议结束...
阅读原文

Outrank

Outrank是通过 AI 自动化进行关键词研究、生成 SEO 优化内容并自动发布内容的工具,帮助用户提升博客流量和网站排名。能自动寻找未开发的关键词,生成优化的...
阅读原文

X-Prompt

X-Prompt是用于多模态视频目标分割的通用框架,解决传统方法在极端光照、快速运动和背景干扰等复杂场景下的局限性。通过预训练一个基于 RGB 数据的视频目标分...
阅读原文

Wepost

Wepost是基于人工智能的社交媒体营销工具,专为简化内容创作、发布和分析流程而设计。通过 AI 技术生成符合品牌调性的文案、图像和视频内容,支持多平台发布...
阅读原文

BitsAI-CR

BitsAI-CR是字节跳动团队推出的基于大型语言模型(LLM)的自动化代码审查工具,通过两阶段处理流程实现高效代码审查:RuleChecker 负责基于 219 条规则检测潜...
阅读原文

DiffSplat

DiffSplat是新型的 3D 生成方法,从文本提示和单视图图像快速生成 3D 高斯点阵(Gaussian Splats)。通过微调预训练的文本到图像扩散模型,基于强大的 2D 先...
阅读原文

Deep Research

Deep Research是OpenAI推出的新型AI深度搜索研究工具,专为需要深度、复杂研究的用户设计。能在短时间内(5到30分钟)完成人类专家需要数小时甚至数天才能完...
阅读原文