Meta开源大礼包：探索图像分割、语音识别、文本处理等前沿科技的无限可能！

AIGC动态1年前 (2024)发布新智元

196 0 0

原标题：一文看尽Meta开源大礼包！全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等
文章来源：新智元
内容字数：6434字

Meta开源AI项目推动技术进步

Meta最近推出了一系列开源AI项目，涵盖了图像处理、语音识别和材料科学等多个领域，进一步推动了人工智能的快速发展。以下是这些项目的主要内容和创新点。

SAM 2.1：图像分割模型的升级
Meta更新了Segment Anything Model 2.1 (SAM 2.1)，引入了新的数据增强技术和改进的训练方法，显著提升了模型在遮挡处理能力上的表现。该模型已被广泛应用于医学图像和气象学研究中，下载量超过70万次。
Spirit LM：多模态语言模型
Spirit LM是Meta首个开源的多模态语言模型，能够将文本与语音混合。研究人员开发了基础版和表达版，后者能够生成更自然的语音，具备自动语音识别和语音分类的能力。
Layer Skip：加速生成时间
Meta推出的层跳过技术能够在不依赖专用硬件的情况下，加速大型语言模型的生成时间。该方法通过局部执行模型层并进行验证，提升了模型性能约1.7倍。
Salsa：量子密码标准验证
Salsa是一种新方法，旨在攻击和NIST标准中的稀疏秘密，使研究人员能够基准测试基于AI的攻击手段。这为密码学研究提供了新的思路。
Meta Lingua：高效模型训练
Meta Lingua是一个轻量级代码库，旨在加速语言模型的训练，提供一个研究友好的环境，帮助研究人员快速测试新想法，同时保持高效性和可重用性。
Open Materials 2024：无机材料发现
Meta开源的Open Materials 2024数据集和模型为材料科学研究提供了一个有竞争力的选择，能够加速无机材料的发现，缩小开放与专有模型之间的差距。
Mexma：改进的句子表征
Mexma是一个跨语言句子编码器，通过结合token和句子级别的目标进行训练，提升了句子表示的质量，支持多达80种语言的处理。
Self-Taught Evaluator：生成奖励模型
自学评估器能够生成合成偏好数据以训练奖励模型，且无须人工标注，表现超越了许多大型语言模型，获得了AI社区的广泛认可。