标签:问题
大模型预测问题的计算复杂度,用不同能力的LLMs协作提高推理效率
关键词:大语言模型,深度学习,计算复杂度来源:集智俱乐部 作者:郭瑞东 大语言模型(LLMs)在人工智能领域取得显著进展,但同时也带来了推理成本方面的...
中文大模型竞技场第一:MiniMax海螺AI初体验!
直播预告 | 6月20日晚7点,「智猩猩机器人新青年讲座」第8讲正式开讲,清华大学THUNLP lab在读博士胡锦毅将直播讲解《面向多模态大模型的具身智能平台LEGENT...
联创用ChatGPT写的一行代码让公司损失上万美元!网友:老板自己写的,找不到人背锅了
作者|Asim Shrestha 译者|核子可乐 编辑|冬梅编者按:ChatGPT 在编程时的使用已经非常广泛。近日,一支国外技术团队在利用 ChatGPT 生成代码进行开发时遇...
拯救Transformer推理能力!DeepMind新研究TransNAR:给模型嵌入「算法推理大脑」
新智元报道编辑:乔杨 好困 【新智元导读】DeepMind最近发表的一篇论文提出用混合架构的方法解决Transformer模型的推理缺陷。将Transformer的NLU技能与基于GN...
LLM最全「怪癖」首曝光!马里兰OpenAI等30+学者祭出75页提示报告
新智元报道编辑:编辑部 【新智元导读】大语言模型提示中,竟有不少「怪癖」:重复某些内容,准确性就大大提高;人名变匿名,准确性就大大下降。最近,马里兰...
大模型+蒙特卡洛树搜索,一招让LLaMa-3 8B奥数水平直逼GPT-4
机器之心报道 编辑:陈萍、杜伟通过算法层面的创新,未来大语言模型做数学题的水平会不断地提高。这几天,17 岁中专生姜萍在 2024 阿里巴巴全球数学竞赛预选...
张俊林:关于Scaling Law、半合成数据、MOE及长文本
直播预告 | 6月18日上午10点,「智猩猩AI新青年讲座」第240讲正式开讲,邀请到德州大学奥斯汀分校刘星超博士将直播讲解《利用直线概率流加速Stable Diffusion...
AI 初创企业如何做好增长?来自 PayPal 增长负责人的最佳实践
本文编译自播客 20VC,Harry Stebbings 与 Matt Lerner 谈论了 AI 时代中初创企业的最佳增长方法论。 Matt Lerner 在 PayPal 带领增长团队工作了 11 年,是增...
Stable Diffusion 3开源秒翻车,画人好掉san
明敏 发自 凹非寺量子位 | 公众号 QbitAI没想到……Stable Diffusion 3开源即出现翻车案例。 生成一个躺在草地上的女孩,结果长这样? 而且不是个例,只要是和...
ICML 2024 哈佛大学最新研究:越强的大模型越不懂人类
夕小瑶科技说 原创作者 | 任同学大语言模型(LLMs)展现出了多种用途。这种多样性提供了巨大的潜力:同一个模型可以帮助软件工程师编写代码,也可以总结医生...
GPT-4搞不定的图推理,港科大7B模型搞定|KDD2024
香港科技大学 陈诺 投稿量子位 | 公众号 QbitAI大模型执行图推理任务,我们是希望大模型仅仅给出结果,还是在给出准确答案的同时,输出详细的推理过程? 先来...
对话王田苗:万亿市场之下,大模型+机器人还有四大问题未解决
大数据文摘受权转载自硬氪 作者|黄楠 编辑|袁斯来 今年3月,一段两分半钟的视频点击量破百万。没有太多花哨的情节,白色背景前,一个人形机器人遵照人类指...
两句话,让LLM逻辑推理瞬间崩溃!最新「爱丽丝梦游仙境」曝出GPT、Claude等重大缺陷
新智元报道编辑:乔杨 好困 【新智元导读】在基准测试上频频屠榜的大模型们,竟然被一道简单的逻辑推理题打得全军覆没?最近,研究机构LAION的几位作者共同发...
硅谷创业教父 Paul Graham:如何获得一个好的创业想法?
对,又是 Paul Graham 的文章,毕竟号称「硅谷创业教父」,确实在创业这件事上有很多真知灼见。 本篇是他发表于 2012 年的文章,但常读常新,尤其适合当下 AI...
GPT-4o仅排第二!北大港大等6所高校联手,发布权威多模态大模型榜单!
夕小瑶科技说 原创作者 | 谢年年多模态大模型视频分析能力榜单出炉: Gemini 1.5 Pro最强,GPT-4o仅排第二? 曾经红极一时的GPT-4V屈居第三。 最近,北大港大...