BERT是一个transformers模型,它是在一个大型英文语料库上进行自监督预训练的。这意味着它仅在原始文本上进行预训练,没有任何人类以任何方式对其进行标注(这就是为什么它可以使用大量公开可用的数据),并使用自动过程从这些文本中生成输入和标签。更准确地说,它是通过两个目标进行预训练的:
- 掩码语言建模(MLM):将一个句子,模型随机屏蔽输入中15%的单词,然后将整个屏蔽的句子通过模型运行,并预测屏蔽的单词。这与传统的递归神经网络(RNN)不同,后者通常一个接一个地看到单词,或者与GPT这样的自回归模型内部屏蔽未来的标记。它允许模型学习句子的双向表示。
- 下一句预测(NSP):模型在预训练期间将两个掩码句子连接在一起作为输入。有时它们对应于原始文本中相邻的句子,有时则不是。然后,模型必须预测这两个句子是否相互跟随。
通过这种方式,模型学习了英语语言的内部表示,然后可以用于提取对下游任务有用的特征:例如,如果您有一个标记的句子数据集,您可以使用BERT模型生成的特征作为输入来训练标准分类器。
本文URL:https://www.ainavpro.com/sites/2559.html
数据统计
数据评估
关于bert-base-uncased-Hugging Face特别声明
本站OpenI提供的bert-base-uncased-Hugging Face都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由OpenI实际控制,在2023年 5月 26日 下午6:04收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,OpenI不承担任何责任。
相关导航
暂无评论...