标签:问题

OpenAI o1 技术初探2:使用MCTS增强推理能力(基于代码实践的解读)

在o1的整体框架篇中(https://zhuanlan.zhihu.com/p/773907223),我们从现有开源的论文和代码中(https://github.com/hijkzzz/Awesome-LLM-Strawberry),抽...
阅读原文

Lex Fridman对谈Cursor团队:真正找到PMF的AI编程产品,有信心取代Copilot

Cursor 最近很火,甚至被认为可能是取代 VS Code 的下一代代码编辑器。 Cursor 一开始就没有把自己定位在 Copilot 的角色上,团队认为,大模型会颠覆软件的开...
阅读原文

爆火AI编程应用何以单挑微软?Cursor团队2小时访谈揭秘

本次对话非常技术化,讨论的范围远远超出一个代码编辑器。 编译|尹明顺 吴浪娜 编辑|漠影 智东西10月10日消息,当地时间10月7日,知名播客主持人Lex Fridman...
阅读原文

NeurIPS 2024|SparseLLM:突破性全局剪枝技术,大语言模型稀疏化革命

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

Kimichat 底层 Prompt 泄漏:原来AI也怕隐私曝光!

点击上方蓝字关注我们今日,Kimichat的系统级Prompt意外泄漏(截止发稿时,该问题未修复),这让我们瞥见了这位AI助手的“幕后剧本”。原来,连AI也有自己的“小...
阅读原文

重要的事情说两遍!Prompt「复读机」,显著提高LLM推理能力

新智元报道编辑:alan 【新智元导读】尽管大模型能力非凡,但干细活的时候还是比不上人类。为了提高LLM的理解和推理能力,Prompt「复读机」诞生了。众所周知...
阅读原文

Jim Fan再谈基准测试之弊!Hugging Face开源套件LightEval领跑LLM评估新篇章

新智元报道编辑:Mindy 【新智元导读】HuggingFace推出LightEval,为AI评估带来透明度和定制化,开启AI模型评估的新时代。在AI的世界里,模型的评估往往被看...
阅读原文

Cursor创始团队最新访谈:如果Github整合o1,Cursor可能要倒闭了

机器之心报道 编辑:佳琪、蛋酱最近一段时间,AI 编程工具 Cursor 火遍全球,风头一时无两。 Cursor 是一款基于 VS Code 的代码编辑器,它为 AI 辅助编程添加...
阅读原文

AI博士如何做出有影响力的研究?斯隆奖得主弟子亲身讲述经验

机器之心编译 作者:Omar Khattab 编辑:蛋酱、泽南写论文?那只是其中的一小步。在研究生期间,很多人经常会迷茫于如何构建自身的研究。我们应该如何开展研...
阅读原文

耗资1.3万,ASU团队揭秘o1推理王者!碾压所有LLM成本超高,关键还会PUA

新智元报道编辑:桃子 好困 【新智元导读】LLM不会规划,大推理模型o1可以吗?ASU团队最新研究发现,o1-preview推理规划能力是所有模型之最,但仍未触及天花...
阅读原文

280页PDF,全方位评估OpenAI o1,Leetcode刷题准确率竟这么高

机器之心报道 编辑:张倩计算机科学、数学、自然科学、医学、语言学、社会科学……OpenAI o1擅长什么?还有哪些不足?OpenAI 的 o1-preview 模型已经发布两周了...
阅读原文

科研大佬投稿顶会的经验分享:时间安排、idea灵感、科研习惯

大数据文摘受权转载自AI TIMER 整理:陈研概述:大模型时代,科研的挑战和机遇并存。随着数据规模的激增和技术的迅猛发展,如何有效地准备顶会投稿、应对评审...
阅读原文

端到端优化所有能力,字节跳动提出强化学习LLM Agent框架AGILE

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

OpenAI o1: 合成数据与推理搜索

GTIC 2024中国AI PC创新峰会将于10月11日,在2024上海国际消费电子展TechG同期举办,峰会将邀请8位嘉宾深入探讨生成式AI如何推动PC产业进入第三次变革。目前...
阅读原文

三只羊卢总的录音AI到底能不能做出来?我的答案是:当然能。

大数据文摘受权转载自数字生命卡兹克 作者:卡兹克 今天凌晨,N多人给我发了一张图,说警方通报了,问我到底怎么看三只羊录音是不是AI这事。 还有朋友跟我说...
阅读原文
12345635