AI工具

Step-Audio-AQAA

Step-Audio-AQAA 是 StepFun 团队推出的端到端大型音频语言模型,专门用于音频查询-音频回答(AQAA)任务。能直接处理音频输入生成自然、准确的语音回答,无...
阅读原文

元智启AI

元智启AI是企业级AI应用零代码配置平台。通过零代码操作,让用户无需编程基础,可通过图形化界面快速搭建智能体。平台整合了多种通用大模型和行业大模型,支...
阅读原文

绘想

绘想是百度推出的AI视频创作平台,基于AI技术帮助用户生成高质量的视频。平台提供直观的界面和强大的工具,让用户能轻松创建个性化的内容。绘想提供灵感推荐...
阅读原文

Mercury

Mercury是由Inception Labs推出的专为聊天应用量身定制的商业级扩散(LLM)。基于“从粗到细”(coarse-to-fine)的生成过程,能并行生成多个token,显著提高文...
阅读原文

MirrorMe

MirrorMe是阿里通义实验室推出的实时、高保真音频驱动肖像动画框架。框架基于LTX视频模型,结合三项关键创新,身份注入机制、音频驱动控制模块和渐进式训练策...
阅读原文

寸止

寸止是开源的AI对话增强工具,能解决AI助手提前终止对话的问题。工具具备智能拦截功能,当AI想要结束对话时,自动弹出继续选项,让用户能深入交流。寸止支持...
阅读原文

GLM-4.1V-Thinking

GLM-4.1V-Thinking是智谱AI推出的开源视觉语言模型,专为复杂认知任务设计,支持图像、视频、文档等多模态输入。模型在GLM-4V架构基础上引入思维链推理机制,...
阅读原文

01编辑器

01编辑器是专为微信公众号设计的AI内容创作智能体。01编辑器基于AI技术降低创作门槛,帮助创作者以10%的成本获得80%的专业内容创作效果。平台功能强大,涵盖...
阅读原文

BlenderFusion

BlenderFusion是Google DeepMind推出的生成式视觉合成框架,将传统的 3D 编辑软件(Blender)与AI 模型相结合,实现精准的几何编辑和多样的视觉合成。
阅读原文

ML-Master

ML-Master是上海交通大学人工智能学院Agents团队推出ML-Master - 上海交大推出的AI专家Agent的AI专家智能体。在OpenAI的权威基准测试MLE-bench中表现出色,以...
阅读原文

ThinkSound

ThinkSound是阿里通义语音团队推出的首个CoT(链式思考)音频生成模型,用在视频配音,为每一帧画面生成专属匹配音效。模型引入CoT推理,解决传统技术难以捕...
阅读原文

MAI-DxO

MAI-DxO(Microsoft AI Diagnostic Orchestrator)是微软推出的先进人工智能系统,能提升医疗诊断的准确性和效率。基于模拟一组具有不同诊断方法的虚拟医生协...
阅读原文

RecGPT

RecGPT是淘天集团推出的百亿参数推荐大模型。现已全面接入手机淘宝首屏“猜你喜欢”信息流,基于融合多模态认知、用户行为分析及实时热点理解,精准捕捉用户长...
阅读原文

华文笔杆

华文笔杆是专为政企笔杆子量身打造的AI公文写作平台。基于最新公文规范,结合AI智能技术,为用户提供从起草到定稿的全流程支持。平台具备四大核心写作模式:...
阅读原文

XVerse

XVerse是字节跳动智能创作团队推出的新型多主体控制图像生成模型。模型在文本到图像生成领域实现对多个主体身份和语义属性(如姿势、风格、光照)的精细控制...
阅读原文
123241