AI工具

Zyler AI

Zyler AI 是专注于营销分析的人工智能平台,帮助企业和专业人士快速生成高质量的分析报告。通过一键集成 Google Analytics、Meta Ads 等主流数据源,基于强大...
阅读原文

HumanDiT

HumanDiT 是浙江大学和字节跳动联合提出的姿态引导的高保真人体视频生成框架。基于扩散变换器(Diffusion Transformer,DiT),能在大规模数据集上训练,生成...
阅读原文

Symbolab

Symbolab是 EqsQuest Ltd.推出的AI驱动的数学解题工具,通过提供详细的分步解决方案,帮助用户解决从基础算术到高等数学的各类问题,涵盖代数、微积分、三角...
阅读原文

TPO

TPO(Test-Time Preference Optimization)是新型的AI优化框架,在推理阶段对语言模型输出进行动态优化,更符合人类偏好。TPO通过将奖励信号转化为文本反馈,...
阅读原文

PDF to Podcast

PDF to Podcast是NVIDIA推出的PDF转音频的AI工具,基于NVIDIA NIM微服务架构的,能将PDF文档转换为生动的音频内容,如播客。基于大型语言模型(LLM)、文本到...
阅读原文

InternVideo2.5

InternVideo2.5是上海人工智能实验室联合南京大学、中科院深圳先进技术研究院共同开源的视频多模态大模型。在视频理解领域取得了显著进展,特别是在长视频处...
阅读原文

YAYI-Ultra

YAYI-Ultra 是中科闻歌研发的企业级大语言模型的旗舰版本,具备强大的多领域专业能力和多模态内容生成能力。支持数学、代码、金融、舆情、中医、安全等多个领...
阅读原文

Webdone

Webdone 是基于人工智能的在线平台,帮助用户快速创建和定制高质量的落地页和网站。通过强大的 AI 技术,让用户只需简单描述产品或需求,可在几分钟内生成专...
阅读原文

HUGWBC

HUGWBC(Humanoid Unified and General Whole-Body Controller)是上海交通大学、上海AI Lab联合推出的人形机器人全身控制器,能实现精细的运动控制。HUGWBC...
阅读原文

VideoCaptioner

VideoCaptioner(中文名:卡卡字幕助手)是基于大语言模型(LLM)的智能字幕处理工具,能简化视频字幕的生成与优化流程。VideoCaptioner支持语音识别、字幕断...
阅读原文

Zonos-v0.1

Zonos-v0.1是Zyphra推出的高保真文本到语音(TTS)模型。Zonos-v0.1包含两个模型:16亿参数的Transformer模型和SSM混合模型,均在Apache 2.0许可下开源。Zono...
阅读原文

InspireMusic

InspireMusic 是阿里巴巴通义实验室开源的音乐生成技术,通过人工智能为用户生成高质量的音乐作品。基于多模态大模型技术,支持通过简单的文字描述或音频提示...
阅读原文

TurboTTS

TurboTTS 是免费的在线文本转语音工具,支持70多种语言和300多种真实语音选择,能生成自然、逼真的语音效果,适用于短视频创作、在线教育、广告制作、播客等...
阅读原文

Omniflow

Omniflow 是专注于帮助用户将创意快速转化为产品的AI工具。通过 AI 技术简化产品开发流程,提供从创意到发布的全流程支持。Omniflow 的核心功能包括 IdeaFlow...
阅读原文

Goku

Goku是香港大学和字节跳动联合发布的最新视频生成模型,专为图像和视频的联合生成设计。基于先进的rectified flow Transformer框架,支持文生视频、图生视频...
阅读原文
17374757677233