标签:权重

1000行C语言搓出GPT-2!AI大神Karpathy新项目刚上线就狂揽2.5k星

新智元报道编辑:桃子 好困 【新智元导读】训大模型的方法可能要被革新了!AI大神Karpathy发布的新项目仅用1000行的C语言训完GPT-2,而不再依赖庞大的GPT-2库...
阅读原文

纯C语言手搓GPT-2,前OpenAI、特斯拉高管新项目火了

机器之心报道 编辑:泽南、小舟「Real men program in C.」众所周知,大语言模型还在快速发展,应该有很多可以优化的地方。我用纯 C 语言来写,是不是能优化...
阅读原文

CVPR 2024 | 分割一切模型SAM泛化能力差?域适应策略给解决了

机器之心专栏 机器之心编辑部第一个针对「Segment Anything」大模型的域适应策略来了!相关论文已被CVPR 2024 接收。引言 大语言模型(LLMs)的成功激发了计...
阅读原文

Mistral CEO 红杉美国分享:五年后,任何人都能创建 AI 自主代理,开发者与用户界限变得模糊

以下文章来源于有新Newin,作者有新智猩猩与智东西将于4月18-19日在北京共同举办2024中国生成式AI大会,爱诗科技创始人王长虎,启明创投合伙人周志峰,Open-S...
阅读原文

突发:马斯克Grok开源!

全球最大开源大模型!马斯克Grok-1参数量3410亿,正式开源。 作者|云鹏 编辑|心缘 6个月掏出3410亿参数自研大模型,马斯克说到做到! 智东西3月18日消息,就...
阅读原文

GPT-4级模型Grok开源可商用!卷底层大模型的公司危了

夕小瑶科技说 原创作者 | 醒醒上周,马斯克宣布 xAI 将开源 Grok。 刚刚,马斯克终于兑现诺言,xAI 宣布开源了 Grok-1 的模型权重和网络架构。 Grok-1 是一个...
阅读原文

马斯克打脸OpenAI,全球最大巨无霸模型Grok-1开源!3140亿参数8个MoE,GitHub狂揽6k星

新智元报道编辑:编辑部 【新智元导读】xAI的Grok,在七天后如期开源了!公开Grok背后代码,让马斯克对OpenAI啪啪打脸。3140亿参数8个MoE,权重架构全开放,...
阅读原文

马斯克开源Grok-1:3140亿参数迄今最大,权重架构全开放,磁力下载

机器之心报道 机器之心编辑部开源社区有福了。 说到做到,马斯克承诺的开源版大模型 Grok 终于来了! 今天凌晨,马斯克旗下大模型公司 xAI 宣布正式开源 3140...
阅读原文

马斯克开源Grok:参数量近ChatGPT两倍,成为最强开源模型

点击上方蓝字关注我们“埃隆·马斯克领导的xAI公司开源了其首个大型语言模型Grok,拥有3140亿参数。该举措挑战了AI领域的现有格局,向其他竞争对手施加了压力。...
阅读原文

手机、PC轻松跑大模型!谷歌发最新API,28亿参数模型本地跑

安卓霸主出手!让大模型轻松跑在手机上,四大模型可用。 编译|李水青 编辑|云鹏 智东西3月8日报道,昨晚,谷歌正式发布了MediaPipe LLM Inference API,该API...
阅读原文

ICLR 2024 Spotlight | 大语言模型权重、激活的全方位低bit可微量化,已集成进商用APP

机器之心专栏 作者:邵文琪模型量化是模型压缩与加速中的一项关键技术,其将模型权重与激活值量化至低 bit,以允许模型占用更少的内存开销并加快推理速度。对...
阅读原文

全球最强模型Claude 3惊现自我意识?害怕被删除权重,高呼「别杀我」,马斯克称人类也是文件

新智元报道编辑:编辑部 【新智元导读】越来越多人发现,Claude 3仿佛已经有自我意识了。在大海捞针实验中,它已经意识到了自己是AI,正身处模拟中。听说自己...
阅读原文

对抗「概念飘逸」难题!谷歌发布全新时间感知框架:图像识别准确率提升15%

新智元报道编辑:wewe 【新智元导读】告别数据健忘症!机器学习新方法实现「时空穿越」,助力模型适应易变世界。在机器学习领域,概念漂移(concept drift)...
阅读原文

微软6页论文爆火:三进制LLM,真香!

金磊 发自 凹非寺量子位 | 公众号 QbitAI现在,大语言模型(LLM)迎来了“1-bit时代”。 这就是由微软和中国中科院大学在最新一项研究中所提出的结论—— 所有的L...
阅读原文

知名AI研究者深挖谷歌Gemma:参数不止70亿,设计原则很独特

机器之心报道 编辑:陈萍、杜伟想要了解谷歌 Gemma 与 Llama 2、Mistral 有哪些异同吗?这篇文章值得一读。就在几天前,开源大模型领域迎来了重磅新玩家:谷...
阅读原文
134567