语言 - 第 8 页

没想到！AlphaZero式树搜索也能用来增强大语言模型推理与训练

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

2年前 (2024)

Meta AI推出适用于移动设备的紧凑型语言模型

点击上方蓝字关注我们“Meta AI 推出 MobileLLM，一种为移动设备设计的高效语言模型。该模型通过优化参数，实现了与更大模型相当的性能，推动了 AI 模型小型化...

阅读原文

AIGC动态

2年前 (2024)

ChatGPT无法取代人类程序员！ IEEE 35页论文测出困难编码正确率仅为0.66%

新智元报道编辑：编辑部【新智元导读】6月，IEEE刊登了一篇对ChatGPT代码生成任务进行系统评估的论文，数据集就是程序员们最爱的LeetCode题库。研究揭示了LL...

阅读原文

AIGC动态

2年前 (2024)

LLM用于时序预测真的不行，连推理能力都没用到

机器之心报道编辑：panda语言模型真的能用于时序预测吗？根据贝特里奇头条定律（任何以问号结尾的新闻标题，都能够用「不」来回答），答案应该是否定的。事...

阅读原文

AIGC动态

2年前 (2024)

全新TextGrad框架：用GPT-4o作引擎，自动优化端到端任务

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

2年前 (2024)

73年前，香农已经给大模型发展埋下一颗种子

机器之心报道编辑：泽南、杜伟AI 考古，追溯到了祖师爷头上。当今 AI 领域爆火的大语言模型（LLM），其原理是香农提出来的？今天，普林斯顿大学教授承现峻...

阅读原文

AIGC动态

2年前 (2024)

免费AI神器！对照翻译带公式图表识别，支持批量识别

各位小伙伴们，今天重点介绍一款免费神器，名字为Doc2X，可以在线使用和下载客户端使用, 以及有多种第三方插件和pip包等，所有功能全部免费，下面具体展开介...

阅读原文

AIGC动态

2年前 (2024)

ICML 2024 Spotlight | 在解码中重新对齐，让语言模型更少幻觉、更符合人类偏好

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

2年前 (2024)

Nature 热议论文证明「语言不是思考工具」，LLM 可能要学不会推理了？

机器之心PRO · 会员通讯 Week 26---- 本周为您解读 ③个值得细品的AI & Robotics业内要事 ---- 1. Nature 热议论文证明「语言不是思考工具」，LLM 可能要...

阅读原文

AIGC动态

2年前 (2024)

“小语言模型”或成为庞大人工智能选项的替代品

ISTOCK 来源：IEEE电气电子工程师学会科技公司已经陷入了建立大型语言模型（LLM，https://spectrum.ieee.org/ai-index-2024）的竞争中。例如，今年4月，Meta...

阅读原文

AIGC动态

2年前 (2024)

今日arXiv最热大模型论文：大模型对齐告别微调，直接编辑表征空间即可解决

夕小瑶科技说原创作者 | Richard人工智能技术正在飞速发展，尤其是大语言模型在自然语言处理领域取得了令人瞩目的成就。但同时，我们也面临着如何让语言模型...

阅读原文

AIGC动态

2年前 (2024)

语言≠思维，大模型学不了推理：一篇Nature让AI社区炸锅了

机器之心报道机器之心编辑部方向完全搞错了？大语言模型（LLM）为什么空间智能不足，GPT-4 为什么用语言以外的数据训练，就能变得更聪明？现在这些问题有「...

阅读原文

AIGC动态

2年前 (2024)

墙裂推荐！Karpathy大模型培训课LLM101n上线了，非常基础

机器之心报道机器之心编辑部让我们训练一个 Storyteller。今天外网又被 Andrej Karpathy 这一良心课程刷屏了！项目是 11 小时前被 Karpathy 上传到 Github ...

阅读原文

AIGC动态

2年前 (2024)

智源独家丨谢赛宁：AI是否需要更强的视觉基础来实现理解和意义?

来源：智源社区 6 月 15 日，万众瞩目的智源大会「多模态大模型」论坛轰动举行。纽约大学助理教授谢赛宁从哲学的角度出发，针对大语言时代的视觉表征研究娓娓...

阅读原文

AIGC动态

2年前 (2024)

从 CLM 启航：中国大模型的探索与未来

CLM大会不仅是大模型“上半场”的归纳总结，更是拉开了“下半场”中国大模型道路的探索的序幕。作者丨陈鹭伊编辑丨岑峰在人工智能的广阔舞台上，大模型技术的崛...

阅读原文

AIGC动态

2年前 (2024)

标签：语言