标签:权重
发布几小时,微软秒删媲美GPT-4开源大模型!竟因忘记投毒测试
新智元报道编辑:编辑部 【新智元导读】前段时间,微软公布并开源了最新一代大模型WizardLM-2,号称性能堪比GPT-4。不过,还未上线一天,模型权重和公告全被...
生成式AI如何告别、版权困扰?基于权重显著性的机器遗忘算法有奇效
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
无向图最小割问题取得新突破,谷歌研究获SODA 2024最佳论文奖
机器之心报道 机器之心编辑部谷歌博客放出新研究,求解无向图的最小割问题。1996 年, 美国计算机科学家 David R Karger 连同其他研究者在论文《 A new appro...
DeepMind升级Transformer,前向通过FLOPs最多可降一半
机器之心报道 编辑:Panda W引入混合深度,DeepMind 新设计可大幅提升 Transformer 效率。Transformer 的重要性无需多言,目前也有很多研究团队致力于改进这...
前OpenAI大神Karpathy再整活,1000行C代码搞定GPT-2训练,网友:C语言复兴了!
智猩猩与智东西将于4月18-19日在北京共同举办2024中国生成式AI大会,爱诗科技创始人兼CEO王长虎,Open-Sora开发团队潞晨科技创始人尤洋,英伟达解决方案架构...
1000行C语言搓出GPT-2!AI大神Karpathy新项目刚上线就狂揽2.5k星
新智元报道编辑:桃子 好困 【新智元导读】训大模型的方法可能要被革新了!AI大神Karpathy发布的新项目仅用1000行的C语言训完GPT-2,而不再依赖庞大的GPT-2库...
纯C语言手搓GPT-2,前OpenAI、特斯拉高管新项目火了
机器之心报道 编辑:泽南、小舟「Real men program in C.」众所周知,大语言模型还在快速发展,应该有很多可以优化的地方。我用纯 C 语言来写,是不是能优化...
CVPR 2024 | 分割一切模型SAM泛化能力差?域适应策略给解决了
机器之心专栏 机器之心编辑部第一个针对「Segment Anything」大模型的域适应策略来了!相关论文已被CVPR 2024 接收。引言 大语言模型(LLMs)的成功激发了计...
Mistral CEO 红杉美国分享:五年后,任何人都能创建 AI 自主代理,开发者与用户界限变得模糊
以下文章来源于有新Newin,作者有新智猩猩与智东西将于4月18-19日在北京共同举办2024中国生成式AI大会,爱诗科技创始人王长虎,启明创投合伙人周志峰,Open-S...
突发:马斯克Grok开源!
全球最大开源大模型!马斯克Grok-1参数量3410亿,正式开源。 作者|云鹏 编辑|心缘 6个月掏出3410亿参数自研大模型,马斯克说到做到! 智东西3月18日消息,就...
GPT-4级模型Grok开源可商用!卷底层大模型的公司危了
夕小瑶科技说 原创作者 | 醒醒上周,马斯克宣布 xAI 将开源 Grok。 刚刚,马斯克终于兑现诺言,xAI 宣布开源了 Grok-1 的模型权重和网络架构。 Grok-1 是一个...
马斯克打脸OpenAI,全球最大巨无霸模型Grok-1开源!3140亿参数8个MoE,GitHub狂揽6k星
新智元报道编辑:编辑部 【新智元导读】xAI的Grok,在七天后如期开源了!公开Grok背后代码,让马斯克对OpenAI啪啪打脸。3140亿参数8个MoE,权重架构全开放,...
马斯克开源Grok-1:3140亿参数迄今最大,权重架构全开放,磁力下载
机器之心报道 机器之心编辑部开源社区有福了。 说到做到,马斯克承诺的开源版大模型 Grok 终于来了! 今天凌晨,马斯克旗下大模型公司 xAI 宣布正式开源 3140...
马斯克开源Grok:参数量近ChatGPT两倍,成为最强开源模型
点击上方蓝字关注我们“埃隆·马斯克领导的xAI公司开源了其首个大型语言模型Grok,拥有3140亿参数。该举措挑战了AI领域的现有格局,向其他竞争对手施加了压力。...
手机、PC轻松跑大模型!谷歌发最新API,28亿参数模型本地跑
安卓霸主出手!让大模型轻松跑在手机上,四大模型可用。 编译|李水青 编辑|云鹏 智东西3月8日报道,昨晚,谷歌正式发布了MediaPipe LLM Inference API,该API...