标签:自然语言处理

Moonlight-16B-A3B

Moonlight-16B-A3B 是 Moonshot AI 推出的新型 Mixture-of-Expert (MoE) 模型,具有 160 亿总参数和 30 亿激活参数。模型使用了优化后的 Muon 优化器进行训练...
阅读原文

FlashMLA

FlashMLA 是 DeepSeek 开源的针对 NVIDIA Hopper 架构 GPU 优化的高效 MLA(Multi-Head Linear Attention)解码内核,专为处理可变长度序列设计。通过优化 KV...
阅读原文

智川X-Agent

智川X-Agent是中科闻歌推出的一站式企业智能体开发平台,帮助企业零代码快速构建AI应用。智川X-Agent基于封装大模型、知识库、工作流等复杂技术模块为可视化...
阅读原文

MagicArticulate

MagicArticulate 是南洋理工大学和字节跳动Seed实验室推出的自动将静态 3D 模型转换为可动画化资产的框架。MagicArticulate基于自回归生成骨架,预测蒙皮权重...
阅读原文

TANGLED

TANGLED是上海科技大学、Deemos Technology和华中科技大学联合推出的3D发型生成方法,支持从任意风格和视角的图像中生成高质量的3D发丝。TANGLED基于三个核心...
阅读原文

Argon

Argon 是专注于为制药、生物技术和生命科学行业提供自动化和增强临床开发的智能解决方案平台。平台通过自然语言处理和专有数据库,能快速分析临床试验、生成...
阅读原文

Miss Dora

Miss Dora是AI儿童英文阅读应用,为3-8岁儿童提供AI互动故事。Miss Dora基于个性化的故事讲述和互动问答,激发孩子的阅读兴趣和想象力,能提升语言能力和思维...
阅读原文

Llasa TTS

Llasa TTS 是香港科技大学基于 LLaMA 架构推出的开源文本转语音(TTS)模型,支持高质量语音合成和克隆。Llasa TTS 基于单层向量量化(VQ)编解码器和单个 Tr...
阅读原文

OOMOL

OOMOL (悟墨)是基于 VSCode 打造的现代化集成开发环境(IDE),专为工作流自动化而设计。通过拖拽式图形化界面,让用户能直观地搭建复杂的工作流,无需编程...
阅读原文

Evo 2

Evo 2 是美国弧形研究所、英伟达、斯坦福大学等机构合作推出的DNA语言模型,用于基因组建模和设计,覆盖生命的所有领域。Evo 2 基于 StripedHyena 2 架构开发...
阅读原文

Mercor

Mercor 是专注全球招聘的AI驱动平台,基于AI技术简化求职和招聘流程。求职者只需上传简历,完成20分钟的AI面试,Mercor能将用户的信息匹配到全球数千家公司的...
阅读原文

Ovis2

Ovis2 是阿里巴巴国际团队推出的新型多模态大语言模型,基于结构化嵌入对齐解决视觉与文本模态间的差异。Ovis2继承、优化了 Ovis 系列架构,强化小规模模型的...
阅读原文

Microsoft Research Forum

Microsoft Research Forum 是微软研究院推出的系列虚拟论坛活动,汇聚全球科技与研究领域的专家学者,共同探讨人工智能及相关前沿技术的最新进展、创新理念与...
阅读原文

协和·太初

协和·太初是北京协和医院与中国科学院自动化研究所共同研发的国内首个罕见病领域AI大模型,正式进入临床应用。模型基于我国罕见病知识库的多年积累和中国人群...
阅读原文

Crawl4LLM

Crawl4LLM 是清华大学和卡内基梅隆大学联合开源的智能爬虫系统,提升大语言模型(LLM)预训练效率。Crawl4LLM基于智能评估网页对 LLM 预训练的价值,优先抓取...
阅读原文
167891057