标签:问题

GPT-4推理能力为0?开发者悬赏1万美金被打脸,神秘提示正确率直冲100%

新智元报道编辑:Aeneas 好困 【新智元导读】小孩子都会的脑筋急转弯推理题,GPT-4和Claude 3做不出?国外一位开发者小哥坚称这一观点,认为GPT模型在训练集...
阅读原文

N-S方程问题有解了?与黎曼猜想并列,千禧年数学难题胜利在望

机器之心报道 编辑:泽南、小舟这是数学中最著名的未解问题之一。新的工作已通过同行评审,全文可看。 起猛了,流体力学迎来自己的超导时刻了?最近几天,数...
阅读原文

陶哲轩转发、菲尔兹奖得主领衔:AI正在颠覆数学家的工作方式 | 美国数学学会特刊

梦晨 发自 凹非寺量子位 | 公众号 QbitAI陶哲轩点赞转发,《美国数学学会通报》用一整期特刊介绍了AI给数学带来的改变。 这些文章读起来很有趣,尽管使我自己...
阅读原文

中科大等意外发现:大模型不看图也能正确回答视觉问题!

陈林 投稿 凹非寺量子位 | 公众号 QbitAI大模型不看图,竟也能正确回答视觉问题?! 中科大、香港中文大学、上海AI Lab的研究团队团队意外发现了这一离奇现象...
阅读原文

今日arXiv最热大模型论文:从Twitter动态预测论文学术不端,人大发布

夕小瑶科技说 原创作者 | 松果 引言:社交媒体在科研诚信中的潜在作用在科研领域,确保研究成果的真实性和可靠性是至关重要的。然而,不论是由于研究不端行为...
阅读原文

GPT-4加Agent轻松追平Devin!普林斯顿造,开源首日斩获1.6k星

白交 发自 凹非寺量子位 | 公众号 QbitAI用GPT-4打造的AI程序员,结果轻松追平Devin! 普林斯顿打造的开源SWE-agent,直接开箱即用——修复GitHub存储库中真实b...
阅读原文

普林斯顿首个「开源」AI程序员登场!爆改GPT-4,93秒修bug

新智元报道编辑:编辑部 【新智元导读】世界首个AI程序员Devin诞生不足一个月,普林斯顿就推出了全新的「开源版本」——SWE-agent!在GPT-4的加持下,debug只需...
阅读原文

ChatGPT官宣免注册,全球互联网变天!OpenAI将取代谷歌搜索?

新智元报道编辑:编辑部 【新智元导读】OpenAI这份愚人节礼物,实在是太大了:今天起,ChatGPT不用注册,可以直接使用。用户狂欢,竞品颤抖,我们仿佛已经听...
阅读原文

马斯克发布Grok 1.5,追了一年,仍落后于GPT-4和Claude3

点击上方蓝字关注我们“xAI公司近日推出了Grok-1.5 AI模型,具备强大的推理能力和处理高达10万字文本的能力。在多项基准测试中表现优异,尽管与市场领先产品GP...
阅读原文

CVPR 2024|生成不了光线极强的图片?微信视觉团队有效解决扩散模型奇点问题

机器之心专栏 机器之心编辑部扩散模型凭借其在图像生成方面的出色表现,开启了生成式模型的新纪元。诸如 Stable Diffusion,DALLE,Imagen,SORA 等大模型如...
阅读原文

LLM性能最高60%提升!谷歌ICLR 2024力作:让大语言模型学会「图的语言」

新智元报道编辑:Mindy 【新智元导读】图是组织信息的一种有用方式,但LLMs主要是在常规文本上训练的。谷歌团队找到一种将图转换为LLMs可以理解的格式的方法...
阅读原文

AI 能否代替软件工程师?

出品:CSDN(ID:CSDNnews) 作者:Harry Tormey 译者:弯月 责编:夏萌 软件工程师的工作不仅仅是写代码。AI 面临着一系列的挑战,比如深入洞察人类以及开...
阅读原文

和安克创始人阳萌聊聊:我不看好英伟达,但相信大模型会改变硬件

今晚 8 点,Anker安克创始人阳萌将作客 Founder Park 视频号直播间,与极客公园创始人张鹏聊聊,大模型会如何改变硬件行业。 主要话题: 大模型会是英伟达 GP...
阅读原文

今日arXiv最热NLP大模型论文:天津大学发布大模型数学能力细粒度评价基准FineMath

夕小瑶科技说 原创作者 | Tscom 引言:大语言模型数学能力评估的重要性数学能力的评估对于理解和发展大语言模型(LLMs)至关重要。数学问题不仅涉及对数字的...
阅读原文

讨论下一个token预测时,我们可能正在走进陷阱

机器之心报道 编辑:赵阳自香农在《通信的数学原理》一书中提出「下一个 token 预测任务」之后,这一概念逐渐成为现代语言模型的核心部分。最近,围绕下一个 ...
阅读原文
1181920212236