不用4个H100!340亿参数Code Llama在Mac可跑,每秒20个token,代码生成最拿手|Karpathy转赞

新智元报道编辑:桃子【新智元导读】现在,34B Code Llama模型已经能够在M2 Ultra上的Mac运行了,而且推理速度超过每秒20个token,背后杀器竟是「投机采样」...
阅读原文

GPT-4 MATH准确率最高涨至84.3%!港中文、清华等七所顶尖高校提出全新CSV方法

新智元报道编辑:LRS【新智元导读】让模型用代码自我验证解决方案,结合多数投票集成机制,推理准确率可以提升近30%!虽然大型语言模型(LLMs)在常识理解、...
阅读原文

谷歌证实大模型能顿悟,特殊方法能让模型快速泛化,或将打破大模型黑箱

新智元报道编辑:润 好困【新智元导读】谷歌团队认为,模型泛化能力无处不在,只要摸清条件,模型就不是随机鹦鹉。在特定情况下,人工智能模型会超越训练数据...
阅读原文

哪个视觉语言模型更优?InstructBLIP、MiniGPT-4?全面评估基准LVLM-eHub告诉你

夕小瑶科技说 原创作者 | 王思若LLaMA、GPT-3等大型语言模型实现了对自然语言强大的理解和推理能力,为AI社区构筑了强大的语言基座模型。进而,继续迭代的GPT...
阅读原文

超越AlphaGo的里程碑式突破!AI击败人类世界冠军,登上Nature

夕小瑶科技说 分享来源 | 量子位AI再一次击败人类世界冠军,登上Nature封面。与上一次AlphaGo下围棋不同,这次不是脑力运动,而是在真实物理环境中的竞技体育...
阅读原文

1句指令+5美元+20分钟,就能训练出小型专业模型,Prompt2Model了解一下

夕小瑶科技说 分享来源 | 机器之心CMU 与清华的研究者联合发布了 Prompt2Model 框架,它可以根据用户提供的 prompt,快速训练一个小型专业模型。仅需投入 5 ...
阅读原文

LeCun再泼冷水:只会看书的语言模型永远无法实现「类人智能」

夕小瑶科技说 分享来源 | 新智元问题不在语言模型的学习算法,而是语言本身的固有局限性,多模态将引领下一次AI爆发!自去年ChatGPT发布后,业内外都涌现出了...
阅读原文

雹暴中心收集数据、大模型加持极端天气预测,「追风者也」正在上演

大数据文摘受权转载自HyperAI超神经作者 | 雪菜编辑 | 三羊雷暴、冰雹、龙卷风等极端天气总是让人捉摸不透又避之不及。然而澳洲的研究者们却以身犯险,深入雹...
阅读原文

技术时代的“手艺人”,天才程序员改变世界

在这里,“技术的力量被看见,程序员的声音被听见。作者 | 李扬霞编辑 | 陈彩娴他们的大脑掌握着复杂的逻辑和算法。他们的眼睛审视着一行行的代码。他们的手指...
阅读原文

面壁李大海:行业大模型是历史阶段性产物

大模型,通用才是未来。作者丨孙溥茜编辑丨陈彩娴近日,在北京市石景山区人民政府、北京市经济和信息化局、北京市科学技术委员会中关村科技园区管理委员会联...
阅读原文

文心一言放开后,我们评测了百度搜索的「AI伙伴」

新智元报道编辑:桃子 好困【新智元导读】今天,文心一言正式全面开放!大模型重构的百度搜索,让AI触手可及。今天凌晨,百度突然官宣,文心一言全面开放,人...
阅读原文

击败3位人类世界冠军,登上Nature封面!AI无人机极限竞速开启自动驾驶新纪元

新智元报道编辑:润 Lumina【新智元导读】苏黎世大学联合因特尔开发的Swift无人机竞速系统击败3名人类世界冠军,飞行自动驾驶迎来新纪元!在下棋,办公,游戏...
阅读原文

图灵测试已死!ChatGPT通过人类考试也不算,超强AI评估新秀「逻辑谜题」

新智元报道编辑:桃子【新智元导读】如何给大模型一个真正公平评价标准呢?世界最强AI——ChatGPT可以通过各种考试,甚至输出回答让人难以辨别真假。然而,它也...
阅读原文

破解「反AI」情绪!德国马普所揭秘:人类更喜欢自我定制AI艺术

新智元报道编辑:LRS【新智元导读】轻松拿捏人类审美,给AI艺术品做个性化定制将成流量密码!自去年DALL-E 2, Stable Diffusion, Midjourney等高质量AI绘画工...
阅读原文

艾伦AI推出业界最大文本数据集,包含3万亿Tokens,超过Llama 2

迄今为止最大的开源文本数据集。编译 | 香草编辑 | 李水青智东西8月21日消息,艾伦AI研究所(AI2)于8月19日在其官方博客发布用于训练大型语言模型(LLM)的...
阅读原文
1919920921922