AI工具

Stable Audio 3

Stable Audio 3是Stability AI推出的新一代开源音频生成模型系列,基于流匹配潜空间扩散架构,支持文本转音乐与音效、音频编辑及续写。Stable Audio 3提供Sma...
阅读原文

autoresearch

autoresearch 是 Andrej Karpathy 开源的 AI 自主科研实验框架。框架让 AI Agent 在单张 GPU 上自动运行 nanochat 训练实验:自主调参、执行训练、分析验证指...
阅读原文

LongCat-Video-Avatar 1.5

LongCat-Video-Avatar 1.5 是美团 LongCat 开源的音频驱动数字人视频生成框架。模型基于 13.6B 参数的基础视频生成模型 LongCat-Video 构建,将音频编码器从 ...
阅读原文

GLM-5.1-highspeed

GLM-5.1-HighSpeed是智谱AI推出的旗舰级高速大模型API,在完整保留GLM-5.1综合能力的基础上,通过TileRT高性能推理引擎实现400 tokens/s的输出速度,刷新全球...
阅读原文

Confucius4

Confucius4是网易有道AI团队基于Qwen3.5-27B架构推出的开源多模态大语言模型,专为高级数学推理场景设计。模型通过迭代SFT+RL训练范式、纯文本推理数据增强及...
阅读原文

Qwen3.7-Max

Qwen3.7-Max 是阿里通义千问团队推出的面向智能体时代的新一代旗舰大模型,定位为全能智能体基座。模型具备前沿编程、办公自动化、长周期自主执行与跨框架泛...
阅读原文

Lance

Lance 是字节跳动智能创作团队开源的轻量级原生统一多模态模型,仅 3B 激活参数,在单一框架内同时支持图像与视频的理解、生成与编辑全链路任务。模型采用分...
阅读原文

HyperEyes

HyperEyes是小红书与剑桥大学联合推出的并行多模态搜索智能体,首创 UGS 范式,将视觉定位与检索融合为单一原子动作,实现单轮多实体并发搜索。
阅读原文

ZCube

ZCube是智谱AI联合驭驯网络与清华大学推出的下一代大模型推理网络架构,专为解决PD分离部署中的结构性网络拥塞设计。架构取消传统Spine层交换机,采用全网扁...
阅读原文

Qwen3.5-LiveTranslate

Qwen3.5-LiveTranslate 是阿里通义团队推出的实时同声传译大模型,支持60语种输入、29语种输出与3500+翻译组合,通过可读单元流式技术将端到端字均延迟压缩至...
阅读原文

HiDream-O1-Image-Pro

HiDream-O1-Image-Pro是智象未来推出的基于原生全模态架构UiT的图像大模型,超200B参数,在文生图、文字渲染、指令编辑等任务刷新SOTA。模型将图像像素、文本...
阅读原文

Agora-1

Agora-1 是 Odyssey 推出的首款多智能体世界模型,支持人类与 AI 在同一实时生成的世界模拟中互动。模型以经典 FPS 游戏 GoldenEye 007 为研究场景,最多支持...
阅读原文

CloudDM

CloudDM 是 ClouGence 团队开源的数据库研发与管控平台。CloudDM将数据查询、SQL 审核、权限管控等数据库核心能力集成于统一平台,支持 30 种数据源,覆盖 My...
阅读原文

微伴 Claw

微伴Claw是微伴助手基于 OpenClaw 推出的企业微信AI数字员工,常驻企微环境,通过自然语言连接客户、标签、群发、朋友圈、积分评分、表单等私域数据,实现客...
阅读原文

Hy-MT2

Hy-MT2是腾讯混元开源的新一代翻译大模型,提供 1.8B、7B、30B-A3B 三个尺寸,支持 33 种语言互译及 5 种民汉/方言翻译。
阅读原文
123336