AI工具
Stable Audio 3
Stable Audio 3是Stability AI推出的新一代开源音频生成模型系列,基于流匹配潜空间扩散架构,支持文本转音乐与音效、音频编辑及续写。Stable Audio 3提供Sma...
autoresearch
autoresearch 是 Andrej Karpathy 开源的 AI 自主科研实验框架。框架让 AI Agent 在单张 GPU 上自动运行 nanochat 训练实验:自主调参、执行训练、分析验证指...
LongCat-Video-Avatar 1.5
LongCat-Video-Avatar 1.5 是美团 LongCat 开源的音频驱动数字人视频生成框架。模型基于 13.6B 参数的基础视频生成模型 LongCat-Video 构建,将音频编码器从 ...
GLM-5.1-highspeed
GLM-5.1-HighSpeed是智谱AI推出的旗舰级高速大模型API,在完整保留GLM-5.1综合能力的基础上,通过TileRT高性能推理引擎实现400 tokens/s的输出速度,刷新全球...
Confucius4
Confucius4是网易有道AI团队基于Qwen3.5-27B架构推出的开源多模态大语言模型,专为高级数学推理场景设计。模型通过迭代SFT+RL训练范式、纯文本推理数据增强及...
Qwen3.5-LiveTranslate
Qwen3.5-LiveTranslate 是阿里通义团队推出的实时同声传译大模型,支持60语种输入、29语种输出与3500+翻译组合,通过可读单元流式技术将端到端字均延迟压缩至...
HiDream-O1-Image-Pro
HiDream-O1-Image-Pro是智象未来推出的基于原生全模态架构UiT的图像大模型,超200B参数,在文生图、文字渲染、指令编辑等任务刷新SOTA。模型将图像像素、文本...
粤公网安备 44011502001135号