标签:语言

没想到!AlphaZero式树搜索也能用来增强大语言模型推理与训练

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

Meta AI推出适用于移动设备的紧凑型语言模型

点击上方蓝字关注我们“Meta AI 推出 MobileLLM,一种为移动设备设计的高效语言模型。该模型通过优化参数,实现了与更大模型相当的性能,推动了 AI 模型小型化...
阅读原文

ChatGPT无法取代人类程序员! IEEE 35页论文测出困难编码正确率仅为0.66%

新智元报道编辑:编辑部 【新智元导读】6月,IEEE刊登了一篇对ChatGPT代码生成任务进行系统评估的论文,数据集就是程序员们最爱的LeetCode题库。研究揭示了LL...
阅读原文

LLM用于时序预测真的不行,连推理能力都没用到

机器之心报道 编辑:panda语言模型真的能用于时序预测吗?根据贝特里奇头条定律(任何以问号结尾的新闻标题,都能够用「不」来回答),答案应该是否定的。事...
阅读原文

全新TextGrad框架:用GPT-4o作引擎,自动优化端到端任务

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

73年前,香农已经给大模型发展埋下一颗种子

机器之心报道 编辑:泽南、杜伟AI 考古,追溯到了祖师爷头上。当今 AI 领域爆火的大语言模型(LLM),其原理是香农提出来的? 今天,普林斯顿大学教授承现峻...
阅读原文

免费AI神器!对照翻译带公式图表识别,支持批量识别

各位小伙伴们,今天重点介绍一款免费神器,名字为Doc2X,可以在线使用和下载客户端使用, 以及有多种第三方插件和pip包等,所有功能全部免费,下面具体展开介...
阅读原文

ICML 2024 Spotlight | 在解码中重新对齐,让语言模型更少幻觉、更符合人类偏好

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

Nature 热议论文证明「语言不是思考工具」,LLM 可能要学不会推理了?

机器之心PRO · 会员通讯 Week 26---- 本周为您解读 ③个值得细品的AI & Robotics业内要事 ---- 1. Nature 热议论文证明「语言不是思考工具」,LLM 可能要...
阅读原文

“小语言模型”或成为庞大人工智能选项的替代品

ISTOCK 来源:IEEE电气电子工程师学会 科技公司已经陷入了建立大型语言模型(LLM,https://spectrum.ieee.org/ai-index-2024)的竞争中。例如,今年4月,Meta...
阅读原文

今日arXiv最热大模型论文:大模型对齐告别微调,直接编辑表征空间即可解决

夕小瑶科技说 原创作者 | Richard人工智能技术正在飞速发展,尤其是大语言模型在自然语言处理领域取得了令人瞩目的成就。但同时,我们也面临着如何让语言模型...
阅读原文

语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了

机器之心报道 机器之心编辑部方向完全搞错了?大语言模型(LLM)为什么空间智能不足,GPT-4 为什么用语言以外的数据训练,就能变得更聪明?现在这些问题有 「...
阅读原文

墙裂推荐!Karpathy大模型培训课LLM101n上线了,非常基础

机器之心报道 机器之心编辑部让我们训练一个 Storyteller。今天外网又被 Andrej Karpathy 这一良心课程刷屏了! 项目是 11 小时前被 Karpathy 上传到 Github ...
阅读原文

智源独家丨谢赛宁:AI是否需要更强的视觉基础来实现理解和意义?

来源:智源社区 6 月 15 日,万众瞩目的智源大会「多模态大模型」论坛轰动举行。纽约大学助理教授谢赛宁从哲学的角度出发,针对大语言时代的视觉表征研究娓娓...
阅读原文

从 CLM 启航:中国大模型的探索与未来

CLM大会不仅是大模型“上半场”的归纳总结,更是拉开了“下半场”中国大模型道路的探索的序幕。作者丨陈鹭伊 编辑丨岑峰 在人工智能的广阔舞台上,大模型技术的崛...
阅读原文
167891029