标签:基准
词表的选择如何影响语言模型训练?这可能是目前见过最好的词表选择研究
机器之心报道编辑:赵阳本文初步探讨了不同类型的词表对语言模型训练所产生的影响,研究者使用了 12 个小型的语言模型及 4 个中型的语言模型作为实验对象,并...
所有基准测试都优于Llama 2 13B,最好的7B模型来了,免费用
机器之心报道编辑:陈萍、大盘鸡这是真正的开源。在 Llama 2 系列模型发布后的这几个月里,各大公司机构也在不断推出自家产品。近日,一家法国人工智能初创公...
英伟达新王者登场!GH200超级芯片碾压H100,性能飙升17%!
夕小瑶科技说 分享来源 | 新智元继4月份加入LLM训练测试后,MLPerf再次迎来重磅更新!刚刚,MLCommons发布了MLPerf v3.1版本更新,并加入了两个全新基准:LLM...
碾压H100!英伟达GH200超级芯片首秀MLPerf v3.1,性能跃升17%
新智元报道编辑:编辑部【新智元导读】传说中的英伟达GH200在MLPerf 3.1中惊艳亮相,性能直接碾压H100,领先了17%。继4月份加入LLM训练测试后,MLPerf再次迎...
10万美元+26天,一个低成本千亿参数LLM就诞生了
机器之心报道编辑:Panda W训练一个 GPT 那样的千亿参数规模的大型语言模型需要多少钱和时间?北京智源人工智能研究院和中国科学院计算技术研究所等多所机构...
180B参数的Falcon登顶Hugging Face,超越Llama 2 ,自称当前最好开源大模型
夕小瑶科技说 分享来源 | 新智元作者 | 桃子一夜之间,世界最强开源大模型Falcon 180B引爆全网!1800亿参数,Falcon在3.5万亿token完成训练,直接登顶Hugging...
1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4
新智元报道编辑:桃子【新智元导读】一经发布,地表最强开源模型Falcon 180B直接霸榜HF。3.5万亿token训练,性能直接碾压Llama2。一夜之间,世界最强开源大模...