AI项目和框架
Depth Anything 3
Depth Anything 3(DA3)是字节跳动Seed团队推出的视觉空间重建模型,通过单一Transformer架构实现从任意视角的视觉输入中恢复三维空间几何结构。
HunyuanOCR
HunyuanOCR 是腾讯混元团队推出的开源的端到端OCR视觉语言模型。依托混元原生多模态架构,仅用1B参数就实现了多项OCR任务的SOTA性能。具备高效轻量的架构,单...
Claude Opus 4.5
Claude Opus 4.5 是 Anthropic 公司最新推出的先进 AI 模型。模型在编程、系统级任务、日常研究和文档处理等方面表现出色,擅长处理复杂的软件工程问题,能在...
Supertonic
Supertonic 是 Supertone 开源的高性能文本转语音(TTS)系统,具备极速性能和轻量级。仅包含66M参数,生成语音的速度可达167倍实时速度,是目前最快的TTS系...
MiMo-Embodied
MiMo-Embodied 是小米发布的全球首个开源的跨领域具身大模型,整合了自动驾驶和具身智能两大领域的任务,实现了在环境感知、任务规划、空间理解等多方面的卓...
HunyuanVideo 1.5
HunyuanVideo 1.5 是腾讯混元团队开源的轻量级视频生成模型,参数规模为8.3B。模型基于Diffusion Transformer架构,支持通过文字描述或图片生成5-10秒的高清...
粤公网安备 44011502001135号