AI工具

MILS

MILS(Multimodal Iterative LLM Solver)是Meta AI提出的无需训练即可赋予大型语言模型(LLM)多模态能力的方法。通过多步推理,提示LLM生成候选输出,对每...
阅读原文

Telescope 2.0

Telescope 2.0是AI驱动的销售线索生成平台,通过智能标准(Smart Criteria)功能,让用户能使用完全自定义的条件快速精准地搜索销售线索。平台主要面向销售专...
阅读原文

Granola

Granola是专为频繁参加会议的人设计的AI会议助手工具。能实时转录会议内容,自动识别发言者并标注时间戳,支持用户在会议中实时添加笔记和标记重点。会议结束...
阅读原文

Outrank

Outrank是通过 AI 自动化进行关键词研究、生成 SEO 优化内容并自动发布内容的工具,帮助用户提升博客流量和网站排名。能自动寻找未开发的关键词,生成优化的...
阅读原文

X-Prompt

X-Prompt是用于多模态视频目标分割的通用框架,解决传统方法在极端光照、快速运动和背景干扰等复杂场景下的局限性。通过预训练一个基于 RGB 数据的视频目标分...
阅读原文

Wepost

Wepost是基于人工智能的社交媒体营销工具,专为简化内容创作、发布和分析流程而设计。通过 AI 技术生成符合品牌调性的文案、图像和视频内容,支持多平台发布...
阅读原文

BitsAI-CR

BitsAI-CR是字节跳动团队推出的基于大型语言模型(LLM)的自动化代码审查工具,通过两阶段处理流程实现高效代码审查:RuleChecker 负责基于 219 条规则检测潜...
阅读原文

DiffSplat

DiffSplat是新型的 3D 生成方法,从文本提示和单视图图像快速生成 3D 高斯点阵(Gaussian Splats)。通过微调预训练的文本到图像扩散模型,基于强大的 2D 先...
阅读原文

Deep Research

Deep Research是OpenAI推出的新型AI深度搜索研究工具,专为需要深度、复杂研究的用户设计。能在短时间内(5到30分钟)完成人类专家需要数小时甚至数天才能完...
阅读原文

Luma Ray2

Luma Ray2 是 Luma AI 推出的最新视频生成模型,Ray2 基于 Luma 新的多模态架构训练后展现出先进功能,该架构的计算能力是 Ray1 的 10 倍。能生成快速连贯的...
阅读原文

Pipecat

Pipecat是开源的Python框架,专注于构建语音和多模态对话代理。基于内置的语音识别、文本转语音(TTS)和对话处理功能,简化AI服务的复杂协调、网络传输、音...
阅读原文

Loora

Loora 是先进的 AI 英语辅导应用,能帮助用户提高英语口语能力。基于模拟各种真实场景的对话,让用户在商务、面试、日常交流等情境中练习英语。Loora 能实时...
阅读原文

RealtimeSTT

RealtimeSTT是开源的实时语音转文本库,专为低延迟应用设计。有强大的语音活动检测功能,可自动识别说话的开始与结束,通过WebRTCVAD和SileroVAD进行精准检测...
阅读原文

Step R-mini

Step R-mini(全称Step Reasoner mini)是阶跃星辰推出的推理模型, 是 Step 系列模型家族的首个推理模型,擅长主动规划、尝试和反思,基于慢思考和反复验证...
阅读原文

豆包AI编程

豆包AI编程是豆包推出的智能编程功能。基于AI技术,提供更便捷的代码导入流程,支持一键上传多个本地代码文件和实时引入GitHub开源仓库,快速获取项目的完整...
阅读原文
12122232425175