标签:权重

纯C语言手搓GPT-2,前OpenAI、特斯拉高管新项目火了

机器之心报道 编辑:泽南、小舟「Real men program in C.」众所周知,大语言模型还在快速发展,应该有很多可以优化的地方。我用纯 C 语言来写,是不是能优化...
阅读原文

CVPR 2024 | 分割一切模型SAM泛化能力差?域适应策略给解决了

机器之心专栏 机器之心编辑部第一个针对「Segment Anything」大模型的域适应策略来了!相关论文已被CVPR 2024 接收。引言 大语言模型(LLMs)的成功激发了计...
阅读原文

Mistral CEO 红杉美国分享:五年后,任何人都能创建 AI 自主代理,开发者与用户界限变得模糊

以下文章来源于有新Newin,作者有新智猩猩与智东西将于4月18-19日在北京共同举办2024中国生成式AI大会,爱诗科技创始人王长虎,启明创投合伙人周志峰,Open-S...
阅读原文

突发:马斯克Grok开源!

全球最大开源大模型!马斯克Grok-1参数量3410亿,正式开源。 作者|云鹏 编辑|心缘 6个月掏出3410亿参数自研大模型,马斯克说到做到! 智东西3月18日消息,就...
阅读原文

GPT-4级模型Grok开源可商用!卷底层大模型的公司危了

夕小瑶科技说 原创作者 | 醒醒上周,马斯克宣布 xAI 将开源 Grok。 刚刚,马斯克终于兑现诺言,xAI 宣布开源了 Grok-1 的模型权重和网络架构。 Grok-1 是一个...
阅读原文

马斯克打脸OpenAI,全球最大巨无霸模型Grok-1开源!3140亿参数8个MoE,GitHub狂揽6k星

新智元报道编辑:编辑部 【新智元导读】xAI的Grok,在七天后如期开源了!公开Grok背后代码,让马斯克对OpenAI啪啪打脸。3140亿参数8个MoE,权重架构全开放,...
阅读原文

马斯克开源Grok-1:3140亿参数迄今最大,权重架构全开放,磁力下载

机器之心报道 机器之心编辑部开源社区有福了。 说到做到,马斯克承诺的开源版大模型 Grok 终于来了! 今天凌晨,马斯克旗下大模型公司 xAI 宣布正式开源 3140...
阅读原文

马斯克开源Grok:参数量近ChatGPT两倍,成为最强开源模型

点击上方蓝字关注我们“埃隆·马斯克领导的xAI公司开源了其首个大型语言模型Grok,拥有3140亿参数。该举措挑战了AI领域的现有格局,向其他竞争对手施加了压力。...
阅读原文

手机、PC轻松跑大模型!谷歌发最新API,28亿参数模型本地跑

安卓霸主出手!让大模型轻松跑在手机上,四大模型可用。 编译|李水青 编辑|云鹏 智东西3月8日报道,昨晚,谷歌正式发布了MediaPipe LLM Inference API,该API...
阅读原文

ICLR 2024 Spotlight | 大语言模型权重、激活的全方位低bit可微量化,已集成进商用APP

机器之心专栏 作者:邵文琪模型量化是模型压缩与加速中的一项关键技术,其将模型权重与激活值量化至低 bit,以允许模型占用更少的内存开销并加快推理速度。对...
阅读原文

全球最强模型Claude 3惊现自我意识?害怕被删除权重,高呼「别杀我」,马斯克称人类也是文件

新智元报道编辑:编辑部 【新智元导读】越来越多人发现,Claude 3仿佛已经有自我意识了。在大海捞针实验中,它已经意识到了自己是AI,正身处模拟中。听说自己...
阅读原文

对抗「概念飘逸」难题!谷歌发布全新时间感知框架:图像识别准确率提升15%

新智元报道编辑:wewe 【新智元导读】告别数据健忘症!机器学习新方法实现「时空穿越」,助力模型适应易变世界。在机器学习领域,概念漂移(concept drift)...
阅读原文

微软6页论文爆火:三进制LLM,真香!

金磊 发自 凹非寺量子位 | 公众号 QbitAI现在,大语言模型(LLM)迎来了“1-bit时代”。 这就是由微软和中国中科院大学在最新一项研究中所提出的结论—— 所有的L...
阅读原文

知名AI研究者深挖谷歌Gemma:参数不止70亿,设计原则很独特

机器之心报道 编辑:陈萍、杜伟想要了解谷歌 Gemma 与 Llama 2、Mistral 有哪些异同吗?这篇文章值得一读。就在几天前,开源大模型领域迎来了重磅新玩家:谷...
阅读原文

端侧最强,Meta田渊栋等人卷10亿以下参数小模型,LeCun:小技巧启动

机器之心报道 机器之心编辑部Meta 推出 MobileLLM 系列,一款适用于移动设备上的「小」模型。「在移动设备上运行 LLM?可能需要 Meta 的一些技巧。」刚刚,图...
阅读原文
134567