AI工具

gpt-realtime

gpt-realtime 是 OpenAI 最新推出的先进语音模型,专为实际任务设计。模型能生成高质量、自然的语音,支持多种语言和语音风格,能理解非语言线索并根据场景调...
阅读原文

OmniHuman-1.5

OmniHuman-1.5 字节推出的先进的AI模型,能从单张图片和语音轨道生成富有表现力的数字人动画。模型基于双重系统认知理论,融合多模态大语言模型和扩散变换器...
阅读原文

pillowtalk

pillowtalk是注重隐私的语音日记应用,能通过科学引导帮助用户缓解压力、改善睡眠。应用支持用户语音或文字记录日记,支持99种语言的转录,并提供个性化见解。
阅读原文

Meeseeks

Meeseeks 是美团 M17 团队开源的大模型评测集,用在评估模型的指令遵循能力。Meeseeks通过三级评测框架,从宏观到微观全面衡量模型是否能严格按照用户指令生...
阅读原文

HunyuanVideo-Foley

HunyuanVideo-Foley是腾讯混元团队开源的端到端视频音效生成模型。模型能根据输入的视频和文字描述,生成与视频画面精准匹配的高质量音效,解决现有AI视频生...
阅读原文

问小白5

问小白5是问小白推出的“All in One”旗舰大模型,是国产大模型中智能水平最高的。模型在多项评测中表现优异,如AA-Index综合评估指标得分64.7分,STEM能力评测...
阅读原文

Grok Code Fast 1

Grok Code Fast 1 是 xAI 推出的 AI 编程模型,专为快速高效的基础代码任务设计。模型每秒可处理92个标记,拥有256k的上下文窗口,适合快速原型开发、代码调...
阅读原文

Quick BI

Quick BI 是阿里云推出的智能商业分析工具,对话式报表搭建、一键智能美化、智能洞察归因等功能,让数据分析更高效。内置 Quick 加速引擎,实现毫秒级查询响...
阅读原文

PixVerse V5

PixVerse V5是爱诗科技推出的自研AI视频生成大模型,已在全球同步上线。PixVerse V5版本在动态效果、视觉质量、一致性保持和指令遵循等方面进行全面升级,能...
阅读原文

PaperScope

PaperScope 是 AI 学术论文解读平台,基于先进的人工智能技术,对海量学术论文进行快速解析和总结,帮助研究人员快速掌握论文的核心内容。平台已收录并解析大...
阅读原文

FramePackLoop

FramePackLoop 是基于 FramePack 推出的无限循环视频生成工具。工具通过创建主视频和连接视频,将视频组合成循环视频,适用视频背景、图标等场景。
阅读原文

MiniCPM-V 4.5

MiniCPM-V 4.5是面壁智能推出的端侧多模态模型,拥有8B参数。模型在图片、视频、OCR等多个领域表现卓越,尤其在高刷视频理解方面取得突破,能处理高刷新率视...
阅读原文

Waver 1.0

Waver 1.0 是字节跳动推出的新一代视频生成模型,基于修正流 Transformer 架构,支持文本到视频(T2V)、图像到视频(I2V)和文本到图像(T2I)生成,可在单...
阅读原文

Claude for Chrome

Claude for Chrome是Anthropic推出的浏览器智能体扩展程序,目前处于研究预览阶段。支持用户在Chrome浏览器中与Claude进行交互,通过侧边栏窗口与用户聊天,...
阅读原文

Youtu-agent

Youtu-agent 是腾讯优图实验室推出的开源智能体框架,用在构建、运行和评估自主智能体。框架基于开源模型DeepSeek-V3实现领先性能,支持多种模型 API 和工具...
阅读原文
12021222324279