AI项目和框架

Kimi K2.6

Kimi K2.6 是月之暗面开源的最新旗舰模型,具备行业领先的代码生成、长程任务执行与 Agent 集群能力。模型在 Humanity's Last Exam、SWE-Bench Pro、Dee...
阅读原文

融光

融光(AI Fusion Video) 是开源的全流程AI视频创作平台,基于Agent架构能实现从剧本编写到视频生成的自动化工作流。
阅读原文

Fun-ASR1.5

Fun-ASR1.5是阿里通义团队推出的端到端语音识别大模型的新一代版本,单模型支持30种语言高精度识别,覆盖中文七大方言体系及二十余种地方口音,专项优化古诗...
阅读原文

Qwen3.6-Max-Preview

Qwen3.6-Max-Preview 是阿里通义千问团队推出的下一代旗舰大模型早期预览版。相比 Qwen3.6-Plus,模型在智能体编程、世界知识和指令遵循三大维度实现显著提升...
阅读原文

HyperFrames

HyperFrames是HeyGen开源的AI原生视频渲染框架,采用"Write HTML, Render video"理念,专为AI Agent和开发者设计。框架将视频定义为HTML文件,通过...
阅读原文

天禧AI Claw

天禧AI Claw是联想基于OpenClaw架构推出的开箱即用型AI智能体助理,采用端云混合部署模式,支持PC、Phone、Pad多端无缝协同。工具无需本地环境配置即可7×24小...

Audio Flamingo Next

Audio Flamingo Next 是NVIDIA与马里兰大学联合开源的新一代音频语言模型(LALM),作为Audio Flamingo系列的最新版本,支持长达30分钟的复杂音频输入,覆盖...
阅读原文

LingBot-Map

LingBot-Map 是蚂蚁灵波科技开源的流式三维重建模型,普通 RGB 摄像头可在视频采集过程中实时完成相机位姿估计与场景三维结构重建。
阅读原文

GPT-Rosalind

GPT-Rosalind是OpenAI推出的生命科学专用推理模型,用DNA双螺旋结构发现者罗莎琳德·富兰克林命名。模型针对50种生物学工作流深度调优,具备假设生成、实验设...
阅读原文

Claude Opus 4.7

Claude Opus 4.7 是 Anthropic 推出的最新旗舰大模型,为 Claude Opus 4.6 的直接升级版。模型在高级软件工程任务上表现突出,SWE-bench Pro 得分提升至 64.3...
阅读原文

Qwen3.6-35B-A3B

Qwen3.6-35B-A3B是阿里通义千问团队推出的开源混合专家(MoE)模型,总参数量350亿,激活参数30亿。模型主打极致推理效率与智能体编程能力,在多项编程基准测...
阅读原文

GPT-image-2

GPT-image-2 是OpenAI推出的下一代原生图像生成模型,据传内部代号为「Spud」,目前已在ChatGPT进行灰度测试。模型于2026年4月初以"maskingtape-alpha&q...
阅读原文

HappyOyster

HappyOyster是阿里ATH创新事业部推出的开放式世界模型产品,定位为可实时构建与交互的AI生成式体验平台。产品基于世界模型技术,支持无限延展的实时内容生成...
阅读原文

StepAudio 2.5 TTS

StepAudio 2.5 TTS是阶跃星辰推出的Contextual TTS(语境感知语音合成模型),首次将语境理解能力引入语音生成全流程。
阅读原文

Gemini 3.1 Flash TTS

Gemini 3.1 Flash TTS是Google推出的新一代文本转语音模型,提供更强的可控性、表现力和音质。模型支持70多种语言,引入音频标签技术,可通过自然语言指令精...
阅读原文