AI项目和框架

FLM-Audio

FLM-Audio 是北京智源人工智能研究院联合 Spin Matrix 与新加坡南洋理工大学共同发布的原生全双工音频对话大模型,支持中文和英文。采用原生全双工架构,可在...
阅读原文

Spark Chemistry-X1-13B

Spark Chemistry-X1-13B 是科大讯飞开源的化学专业大型语言模型。模型基于讯飞星火X1-0420大模型,经过多种化学任务数据集的微调,具备卓越的复杂化学问题解...
阅读原文

Vidu Q2

Vidu Q2是生数科技推出的新一代图生视频大模型,实现了AI视频生成技术从“视频生成”到“演技生成”的跨越,标志着AI视频进入追求“神似”的新纪元。Vidu Q2能生成...
阅读原文

AudioFly

AudioFly 是科大讯飞开源的文本生成音效的AI模型。模型用潜在扩散模型架构,拥有10亿参数,通过大量开放数据集(如AudioSet、AudioCaps、TUT)及内部专有数据...
阅读原文

SimpleFold

SimpleFold 是苹果公司推出的轻量级蛋白质折叠预测 AI 模型。模型基于流匹配(Flow Matching)技术,跳过多序列比对(MSA)等复杂模块,直接从随机噪声生成蛋...
阅读原文

CWM

CWM(Code World Model)是Meta开源的320亿参数的代码世界模型,是全球首个将世界模型系统性引入代码生成的语言模型,支持代码生成和理解。
阅读原文

Neovate Code

Neovate Code 是蚂蚁集团开源的智能编程助手,专注于提升开发效率。工具能深度理解代码库,遵循既有编码习惯,精准完成代码生成、Bug修复和重构等任务。
阅读原文

LucaVirus

LucaVirus 是阿里巴巴云 LucaGroup 研发的专为病毒设计的统一核酸 - 蛋白质语言模型。在 254 亿个核苷酸和氨基酸标记上训练,涵盖几乎所有已知病毒。模型可学...
阅读原文

MiroFlow v0.2

MiroFlow v0.2是MiroMind推出的开源研究智能体框架,能将任何大型语言模型(LLM)升级至OpenAI深度研究级别的能力,专注于可靠完成复杂的工具使用任务。
阅读原文

Wan2.5

通义万相2.5(Wan2.5)是阿里推出的最新多模态生成模型,为通义万相 2.5 preview 版(Wan2.5-Preview),涵盖文生视频、图生视频、文生图和图像编辑四大功能...
阅读原文

Qwen3-Max

Qwen3-Max 是 Qwen 团队推出的超大规模语言模型,参数量超过 1T,预训练使用 36T tokens。Qwen3-Max是目前 Qwen 系列中规模最大、能力最强的模型,具备卓越的...
阅读原文

Qwen3-VL

Qwen3-VL 是阿里通义推出的 Qwen 系列中最强大的视觉语言模型,具备卓越的多模态能力。模型能理解纯文本、图像和视频,支持长上下文、空间感知、代码生成等功...
阅读原文

Qwen3-LiveTranslate

Qwen3-LiveTranslate 是阿里通义团队推出的基于大语言模型的多语言实时音视频同传模型。模型支持 18 种语言及多种方言的翻译,具备视觉增强技术,可结合口型...
阅读原文

presentation-ai

presentation-ai 是ALLWEONE团队推出的开源 AI 演示文稿生成工具,能根据用户输入的主题自动生成完整的 PPT 大纲和精美的幻灯片,支持多种语言、主题风格和自...
阅读原文

Doubao-Seed-Translation

Doubao-Seed-Translation 是字节跳动团队推出的先进多语言翻译模型,支持 28 种语言互译,涵盖中英、日韩、德法等多种常用语言。
阅读原文