标签:任务
GPT-4搞不定的图推理,港科大7B模型搞定|KDD2024
香港科技大学 陈诺 投稿量子位 | 公众号 QbitAI大模型执行图推理任务,我们是希望大模型仅仅给出结果,还是在给出准确答案的同时,输出详细的推理过程? 先来...
拿下SOTA!最强中文Embedding模型对标OpenAI,技术路线公开
新智元报道编辑:编辑部 【新智元导读】国产大模型「日日新 5.0」已经在权威主流评测中鲨疯了。变强的背后原因竟是,来自商汤自研中文Embedding模型——Piccolo...
大模型在持续学习中的最新进展:综述
来源:专知 近年来,基础语言模型(LMs)在自然语言处理(NLP)和计算机视觉(CV)领域取得了显著成就。与传统神经网络模型不同,基础语言模型通过在大量无监...
偏微分方程有了基础模型:样本需求数量级减少,14项任务表现最佳
机器之心报道 编辑:陈萍本文提出的 Poseidon 在样本效率和准确率方面都表现出色。偏微分方程(PDEs)被称为物理学的语言,因为它们可以在广泛的时间 - 空间...
GPT-4人类高达99.16%惊人率!PNAS重磅研究曝出,LLM推理越强值越高
新智元报道编辑:桃子 乔杨 【新智元导读】最近,德国研究科学家发表的PANS论文揭示了一个令人担忧的现象:LLM已经涌现出「欺骗能力」,它们可以理解并诱导欺...
Llama3-8B秒杀700亿巨兽?北大博士生等全新「BoT」框架推理暴涨70倍,24点图形推理一步成神
新智元报道编辑:Aeneas 好困 【新智元导读】24点游戏、几何图形、一步将死问题,这些推理密集型任务,难倒了一片大模型,怎么破?北大、UC伯克利、斯坦福研...
清华系细胞大模型登Nature子刊!能对人类2万基因同时建模,代码已开源
白交 发自 凹非寺量子位 | 公众号 QbitAI生命科学领域的基础大模型来了! 来自清华、百图生科的团队提出的单细胞基础大模型scFoundation,登上Nature Methods...
今日arXiv最热大模型论文:大模型都能怎么用?中南大学最新综述:大模型时代的自然语言处理
夕小瑶科技说 原创作者 | Axe_越还记得2022年末ChatGPT的横空出世,带来了整个NLP乃至AI领域的震动,随后如LLaMA、ChatGLM、Qwen等类ChatGPT大模型(LLM)开...
3B模型新SOTA!开源AI让日常调用不同大模型更简单
NEXA AI 投稿量子位 | 公众号 QbitAI大模型,大,能力强,好用! 但单一大模型在算力、数据和能耗方面面临巨大的限制,且消耗大量资源。 而且目前最强大的模...
多模态模型学会打扑克:表现超越GPT-4v,全新强化学习框架是关键
Simon Zhai 投稿量子位 | 公众号 QbitAI只用强化学习来微调,无需人类反馈,就能让多模态大模型学会做决策! 这种方法得到的模型,已经学会了看图玩扑克、算“...
LeCun新作:分层世界模型,数据驱动的人型机器人控制
新智元报道编辑:alan 【新智元导读】在复杂的物理世界中,人型机器人的全身控制一直是个难题,现有的强化学习做出的效果有时会比较抽象。近日,LeCun参与的...
SpaceX 与日本亿万富豪「分手」,dearMoon 环月之旅宣布暂停
dearMoon 环月之旅 取消日本亿万富豪前泽友作曾高调宣布自己将乘坐 SpaceX 的星舰,进行一场「环月之旅」。如果顺利飞行,这将是 1972 年美国阿波罗登月计划...
浅谈大模型 SFT 的实践落地:10 问 10 答
来源|知乎—周星星 地址|https://zhuanlan.zhihu.com/p/685582706 前言SFT 是“低端”的工作,但它与业务紧密相连。相较于难以实施且多数公司没资源训练的预训...
英伟达新研究:上下文长度虚标严重,32K性能合格的都不多
西风 发自 凹非寺量子位 | 公众号 QbitAI无情戳穿“长上下文”大模型的虚标现象—— 英伟达新研究发现,包括GPT-4在内的10个大模型,生成达到128k甚至1M上下文长...
next-token被淘汰!Meta实测「多token」训练方法,推理提速3倍,性能大涨10%+
新智元报道编辑:LRS 【新智元导读】研究人员提出了一种新的大型语言模型训练方法,通过一次性预测多个未来tokens来提高样本效率和模型性能,在代码和自然语...