标签:问题
LLM推理性能受输出格式影响,JSON最严重
一水 发自 凹非寺量子位 | 公众号 QbitAI输出格式不同,竟然还能影响大模型发挥?! 两种提示下让大语言模型(LLMs)解同一道数学题,问题如下: Eliza每周工...
陶哲轩最新演讲:AI将催生出一个大数学时代
大数据文摘授权转载自学术头条 【编者按】日前,菲尔茨奖获得者、华裔数学家、加州大学洛杉矶分校教授陶哲轩在牛津数学公开讲座中,探讨了人工智能(AI)在数...
陶哲轩最新演讲:AI 将催生出一个大数学时代
【编者按】日前,菲尔茨奖获得者、华裔数学家、加州大学洛杉矶分校教授陶哲轩在牛津数学公开讲座中,探讨了人工智能(AI)在数学和科学领域中的潜力,以及它...
OpenAI「草莓」模型再次跳票,凌晨发布的SWE-bench Verified是个啥?
机器之心报道 编辑:张倩、小舟有人说,「我们期待的是草莓,但他们发布的是羽衣甘蓝。」我们来看看这个「羽衣甘蓝」是做什么用的。一直以来,大模型的编程能...
刚刚,OpenAI又双叒叕鸽了!没等来“草莓”发布,只敷衍发了评测集,网友:拿这来抢谷歌发布会风头?
整理 | 李冬梅 褚杏娟 大家期待中的 OpenAI 与谷歌“大战”并未如约而至,双方都打出了“毫无杀伤力”的棉花拳。以为能等到“草莓”,没想到来了个“羽衣甘蓝”尽管...
最高提速1440倍!15秒用GCN搞定随机规划,中科院自动化所新成果入选ICML 24
中科院自动化研究所 投稿量子位 | 公众号 QbitAI仅需15秒即可搞定随机规划问题,速度比传统方法快了1440倍! 中科院自动化研究所的新研究,利用GCN在此类问题...
21.5万张X光,78万个问题!德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA
新智元报道编辑:LRST 好困 【新智元导读】多模态大语言模型(MLLM)在医学视觉问答(VQA)领域展现出巨大潜力,通过提供针对医学图像的具体临床问题的回答,...
无比顺滑!告别TTS!贾扬清领衔的Lepton AI推出实时语音交互
夕小瑶科技说 分享作者 | 谷雨龙泽事到如今,各种AI助手满天飞,语音功能也不是什么稀罕物了。 “明天早上会不会下雨?” “导航去火车站” “帮我预订××餐厅的桌...
陶哲轩牛津对谈罗博深:解密DeepMind如何让AI拿到IMO银牌
新智元报道编辑:编辑部 【新智元导读】陶哲轩一场新鲜出炉的演讲,为我们带来了一场干货满满的思想盛宴。7月17日,「牛津数学公开讲座」系列研讨会邀请到了...
1500 万月活的 AI 搜索:理解用户、做好产品,比模型更重要
创立于 2022 年 8 月的 Perplexity 引领了当下的 AI 搜索热潮。。 4 月份,在最新一轮融资 6200 万美元之后,Perplexity 的估值超过 10 亿美元,成为新的 AI ...
Kaldi 之父:AI 最终会破坏它触及的一切 | 新程序员
【导读】本文作者站在 AI 整个历史长河的发展中看待当下 LLM 技术,他表示,AI 的发展是个漫长的过程,没有终点。模型更迭迅猛,未来充满未知,但唯一令人担...
苹果AI后台提示词曝光,工程师:别幻觉!别捏造事实!
金磊 发自 凹非寺量子位 | 公众号 QbitAI苹果AI(Apple Intelligence)还没有正式到来,后台的提示词却意外曝光了。 事情是这样的。 上周苹果不是刚发布了包...
泄露!Apple Intelligence提示词原来是这样,还告诉大模型:别幻觉
机器之心报道 编辑:陈陈、佳琪从泄露的信息来看 ,Apple Intelligence 背后的提示语还是挺简单的。当苹果的 Apple Intelligence 还未完全开放体验时,其提示...
苹果 AI 官方 prompt 泄露,看起来挺简单的
上周,iOS 18 测试版发布,部分用户提前试用了苹果在 WWDC 宣布的一系列 Apple Intelligence(苹果智能)的功能,更多的功能会在未来几个月内陆续发布。 不过...
LLM智能「参差不齐」!AI大牛Karpathy用表情包解释「9.9<9.11」
新智元报道编辑:乔杨 【新智元导读】前段时间冲上热搜的问题「9.11比9.9大吗?」,让几乎所有LLM集体翻车。看似热度已过,但AI界大佬Andrej Karpathy却从中...