标签:问题

独家|OpenAI超级对齐负责人Jan Leike:如何破解对齐难题?用可扩展监督

来源:智源社区导读今年早些时候,OpenAI宣布成立了一支专注于超级对齐的新团队,由Jan Leike和IIya Sutskever领导,超级对齐旨在构建一个能够与人类水平相媲...
阅读原文

GPT-4肆虐「谁是卧底」桌游!交谈逼真,类人属性仍有发展空间

新智元报道编辑:拉燕【新智元导读】最近,韩国一团队为了测试GPT-3.5和GPT-4的类人属性,竟然让它们玩儿这款游戏!生成式AI研究再整新活!韩国团队尝试让GPT...
阅读原文

火爆外网!23岁华人博士修复22年历史漏洞,网友:我喜欢这个故事

新智元报道编辑:贝果【新智元导读】导语:年仅23岁的斯坦福大学华人博士,修复了一个已有22年历史的bug。一夜之间在外网爆火,引得无数网友围观和赞赏。有人...
阅读原文

陶哲轩再逼近60年几何学难题!周期性密铺问题又获新突破

新智元报道编辑:Aeneas【新智元导读】关于60年的几何学难题周期性密铺问题,陶哲轩最近又有新突破了。陶哲轩一直在研究的周期性密铺问题,又有新突破了。9月...
阅读原文

Effective Prompt: 编写高质量Prompt的14个有效方法

夕小瑶科技说 分享来源 | 知乎@Maple小七、刘聪NLP今天给大家带来一篇《Effective Prompt: 编写高质量Prompt的14个有效方法》,来自知乎@Maple小七。提示工程...
阅读原文

突破『逆转诅咒』!新数学推理数据集揭秘,让大语言模型逆向推理能力翻倍

夕小瑶科技说 分享来源 | 机器之心复杂数学推理是评价大语言模型推理能力的重要指标,目前常用的数学推理数据集样本量有限且问题多样性不足,导致大语言模型...
阅读原文

ChatGPT/GPT-4/Llama电车难题大PK!小模型道德感反而更高?

新智元报道编辑:Lumina【新智元导读】微软对大语言模型的道德推理能力进行了测试,但在电车问题中大尺寸的模型表现反而比小模型差。但最强大语言模型GPT-4的...
阅读原文

MetaMath:新数学推理语言模型,训练大模型的逆向思维

机器之心专栏机器之心编辑部复杂数学推理是评价大语言模型推理能力的重要指标,目前常用的数学推理数据集样本量有限且问题多样性不足,导致大语言模型存在 [...
阅读原文

「陶哲轩×GPT-4」合写数学论文!数学大佬齐惊呼,LLM推理神助证明不等式定理

新智元报道编辑:编辑部【新智元导读】陶哲轩的新论文,竟是用GPT-4辅助写的?前不久,GitHub Copilot的惊人能力已经让陶哲轩不安,现在,众大佬齐呼数学研究...
阅读原文

GPT-4推理更像人了!中国科学院提出「思维传播」,类比思考完胜CoT,即插即用

新智元报道编辑:桃子 好困【新智元导读】大模型推理难题攻克了?中国科学院联手耶鲁大学的研究人员提出了全新框架「思维传播」,让大模型能够像人类一样类比...
阅读原文

慢的不是 Ruby,而是你的数据库

作者 | Sergio De Simone 译者 | 明知山 策划 | 丁晓昀 许多人不停抱怨 Ruby 运行缓慢。诚然,它的确不如人意,然而这并非致命伤,因为问题的根源在于你的数...
阅读原文

陶哲轩:我用GPT-4辅助证明不等式定理,论文还会上传arXiv

机器之心报道编辑:杜伟陶哲轩可太喜欢 GPT 系列大语言模型了!近几个月来,著名数学家陶哲轩热衷于用 ChatGPT、GPT-4 等 AI 工具辅助解决数学问题。我们也一...
阅读原文

和谷歌搜索抢活,FRESHLLM「紧跟时事」,幻觉更少,信息更准

机器之心报道机器之心编辑部LLM 能更新知识的话,还有谷歌搜索什么事?大型语言模型的能力有目共睹,如 BARD 和 CHATGPT/GPT-4,被设计成多功能开放域聊天机...
阅读原文

沉寂四十年,海尔布隆三角问题找到了更小的上界

机器之心编译编辑:赵阳一项新的证明打破了几十年来海尔布隆三角问题的上界,虽然数值上只是突破了一点,但却是三角问题的一大步。假设有一个里面有一堆点的...
阅读原文

制作莫比乌斯环,最少需要多长纸带?50年来的谜题被解开了

机器之心编译编辑:Rome Rome自己动手做过莫比乌斯带吗?莫比乌斯带是一种奇特的数学结构。要构造一个这样美丽的单面曲面其实非常简单,即使是小孩子也可以轻...
阅读原文