标签:参数
老黄祭出新核弹B200!30倍H100单机可训15个GPT-4模型,AI迎新摩尔时代
新智元报道编辑:编辑部 【新智元导读】就在刚刚,老黄又来打破摩尔定律了:英伟达新核弹B200,一块能顶5个H100,30倍推理加速,能训万亿参数大模型!同时推...
马斯克正式开源 Grok-1,成为全球最大的开源大模型
开源了 但又没 完全开源今日凌晨,在一片质疑声中,信守承诺的马斯克卡在最后一日正式开源了 GroK。 好消息是, 马斯克开源了 Grok 1.0 的完整代码,坏消息是...
突发:马斯克Grok开源!
全球最大开源大模型!马斯克Grok-1参数量3410亿,正式开源。 作者|云鹏 编辑|心缘 6个月掏出3410亿参数自研大模型,马斯克说到做到! 智东西3月18日消息,就...
马斯克突然开源Grok:3140亿参数巨无霸,免费可商用
鱼羊 克雷西 发自 凹非寺量子位 | 公众号 QbitAI马斯克说到做到: 旗下大模型Grok现已开源! 代码和模型权重已上线GitHub。官方信息显示,此次开源的Grok-1是...
GPT-4级模型Grok开源可商用!卷底层大模型的公司危了
夕小瑶科技说 原创作者 | 醒醒上周,马斯克宣布 xAI 将开源 Grok。 刚刚,马斯克终于兑现诺言,xAI 宣布开源了 Grok-1 的模型权重和网络架构。 Grok-1 是一个...
马斯克打脸OpenAI,全球最大巨无霸模型Grok-1开源!3140亿参数8个MoE,GitHub狂揽6k星
新智元报道编辑:编辑部 【新智元导读】xAI的Grok,在七天后如期开源了!公开Grok背后代码,让马斯克对OpenAI啪啪打脸。3140亿参数8个MoE,权重架构全开放,...
巧解「数据稀缺」问题!清华开源GPD:用扩散模型生成神经网络参数|ICLR 2024
新智元报道编辑:LRS 好困 【新智元导读】清华大学电子工程系城市科学与计算研究中心最近提出了一种新的时空少样本学习方法,旨在解决城市计算中广泛存在的数...
马斯克开源Grok-1:3140亿参数迄今最大,权重架构全开放,磁力下载
机器之心报道 机器之心编辑部开源社区有福了。 说到做到,马斯克承诺的开源版大模型 Grok 终于来了! 今天凌晨,马斯克旗下大模型公司 xAI 宣布正式开源 3140...
马斯克开源Grok:参数量近ChatGPT两倍,成为最强开源模型
点击上方蓝字关注我们“埃隆·马斯克领导的xAI公司开源了其首个大型语言模型Grok,拥有3140亿参数。该举措挑战了AI领域的现有格局,向其他竞争对手施加了压力。...
4万亿晶体管5nm制程,全球最快AI芯片碾压H100!单机可训24万亿参数LLM,Llama 70B一天搞定
新智元报道编辑:桃子 好困 【新智元导读】AI世界的进化快的有点跟不上了。刚刚,全球最强最大AI芯片WSE-3发布,4万亿晶体管5nm工艺制程。更厉害的是,WSE-3...
4万亿个晶体管,单机可训练比GPT4大10倍的模型,最快最大的芯片面世
机器之心报道 编辑:小舟、陈萍刚刚,芯片创业公司 Cerebras 宣布了该公司历史上最重要的消息,「我们发布了世界上最快的芯片,该芯片拥有高达 4 万亿个晶体...
ICLR 2024 Spotlight | 大语言模型权重、激活的全方位低bit可微量化,已集成进商用APP
机器之心专栏 作者:邵文琪模型量化是模型压缩与加速中的一项关键技术,其将模型权重与激活值量化至低 bit,以允许模型占用更少的内存开销并加快推理速度。对...
一网打尽!深度学习常见问题!
大数据文摘受权转载自算法进阶 1 前言 在传统软件工程中,程序问题(即Bugs)会导致程序崩溃,但开发人员可以通过检查错误来了解原因。 然而,在深度学习中,...
关于scaling law 的正确认识
智猩猩和智东西发起主办的2024中国生成式AI大会将于4月18-19日在北京举办。主会场将进行开幕式、大模型专场、AI Infra专场和AIGC应用专场;分会场将进行具身...
马斯克怒告OpenAI案解密:Ilya看到了什么?125万亿参数Q*细节曝光,53页PDF全网疯转
新智元报道编辑:编辑部 【新智元导读】现在,马斯克起诉OpenAI案的最大未解之谜,就集中在了「Ilya究竟看到了什么」上。他看到的东西,让OpenAI大震荡,所有...