AI工具

MotionCanvas

MotionCanvas是香港中文大学、Adobe 研究院和莫纳什大学推出的图像到视频(I2V)生成方法,能将静态图像转化为具有丰富动态效果的视频。MotionCanvas基于引入...
阅读原文

MedRAX

MedRAX(Medical Reasoning Agent for Chest X-ray)是专门用于胸部X光检查的医学推理AI代理。通过整合最先进的胸部X光分析工具和多模态大型语言模型,形成一...
阅读原文

Scam AI

Scam AI 是基于人工智能的防诈骗平台,帮助用户快速验证视频、音频和文本内容的真实性,识别潜在的诈骗行为。通过自然语言处理(NLP)、视觉和音频认证技术,...
阅读原文

GenSFX

GenSFX 是免费的在线 AI 音效生成工具,能将文本描述快速转化为高质量音效。用户只需输入详细的文本指令,比如“森林中清晨的鸟鸣声”或“科幻飞船起飞的声音”,...
阅读原文

PDFtoPDF

PDFtoPDF是基于AI技术的PDF转换工具,基于OCR技术将PDF扫描件或图像文件转换为可编辑的文本格式。PDFtoPDF高精度的OCR技术,能实现高达99.5%的识别准确率,且...
阅读原文

EpicTopia AI

EpicTopia AI 是专注于个人成长与人生规划的智能应用。通过AI技术为用户提供个性化的人生旅程管理方案,帮助用户设定目标、记录进展、反思成长,庆祝成就。用...
阅读原文

LangBot

LangBot 是开源的即时聊天机器人平台,支持多平台(如 QQ、微信、飞书、Discord 等)和多种大语言模型(如 ChatGPT、DeepSeek、Gemini 等)。LangBot具备多模...
阅读原文

LLMDet

LLMDet是阿里巴巴集团通义实验室、中山大学计算机科学与工程学院、鹏城实验室等机构推出的开放词汇目标检测器,基于与大型语言模型(LLM)协同训练提升目标检...
阅读原文

VisoMaster

VisoMaster 是基于 AI 技术的换脸和编辑软件,功能强大操作简便。支持图片、视频以及直播换脸,能生成自然逼真的换脸效果,应用于娱乐、影视制作等领域。支持...
阅读原文

FlashVideo

FlashVideo是字节跳动团队提出的高效的高分辨率视频生成框架,通过两阶段方法解决了传统单阶段扩散模型在高分辨率视频生成中面临的巨大计算成本问题。在第一...
阅读原文

PNGMaker

PNGMaker 是在线 AI 驱动的工具,能将文本快速转换为透明背景的 PNG 图像。PNGMaker为网页设计师、营销人员和内容创作者提供免费服务,具备 AI 驱动转换、自...
阅读原文

Jammable

Jammable是AI音乐翻唱平台。用户选择喜欢的歌手声音或风格,让AI模仿创作出个性化的音乐作品。平台提供热门声音、音乐合集和合作作品展示,方便用户了解流行...
阅读原文

DynVFX

DynVFX是创新的视频增强技术,能根据简单的文本指令将动态内容无缝集成到真实视频中。通过结合预训练的文本到视频扩散模型和视觉语言模型(VLM),实现了在不...
阅读原文

Omakase AI

Omakase AI 是 ZEALS 推出的智能购物助手工具,通过简单的网址输入,为用户提供个性化的商品推荐。用户只需提供目标网址,如商品平台或品牌官网,Omakase AI ...
阅读原文

WorldSense

WorldSense是小红书和上海交通大学推出的,用在评估多模态大型语言模型(MLLMs)在现实世界场景中对视觉、听觉和文本输入的综合理解能力的基准测试。WorldSen...
阅读原文
14849505152207