标签：基准

词表的选择如何影响语言模型训练？这可能是目前见过最好的词表选择研究

机器之心报道编辑：赵阳本文初步探讨了不同类型的词表对语言模型训练所产生的影响，研究者使用了 12 个小型的语言模型及 4 个中型的语言模型作为实验对象，并...

3年前 (2023)

机器之心报道编辑：陈萍、大盘鸡这是真正的开源。在 Llama 2 系列模型发布后的这几个月里，各大公司机构也在不断推出自家产品。近日，一家法国人工智能初创公...

3年前 (2023)

夕小瑶科技说分享来源 | 新智元继4月份加入LLM训练测试后，MLPerf再次迎来重磅更新！刚刚，MLCommons发布了MLPerf v3.1版本更新，并加入了两个全新基准：LLM...

3年前 (2023)

新智元报道编辑：编辑部【新智元导读】传说中的英伟达GH200在MLPerf 3.1中惊艳亮相，性能直接碾压H100，领先了17%。继4月份加入LLM训练测试后，MLPerf再次迎...

3年前 (2023)

机器之心报道编辑：Panda W训练一个 GPT 那样的千亿参数规模的大型语言模型需要多少钱和时间？北京智源人工智能研究院和中国科学院计算技术研究所等多所机构...

3年前 (2023)

夕小瑶科技说分享来源 | 新智元作者 | 桃子一夜之间，世界最强开源大模型Falcon 180B引爆全网！1800亿参数，Falcon在3.5万亿token完成训练，直接登顶Hugging...

3年前 (2023)

新智元报道编辑：桃子【新智元导读】一经发布，地表最强开源模型Falcon 180B直接霸榜HF。3.5万亿token训练，性能直接碾压Llama2。一夜之间，世界最强开源大模...

3年前 (2023)

1…10 1112