标签:模型

DeepMind:大模型又曝重大缺陷,无法自我纠正推理,除非提前得知正确答案

新智元报道编辑:润【新智元导读】DeepMind的研究人员发现,LLM有一个天生的缺陷——在推理过程中无法通过自我纠正获得更好的回复,除非数据集中预设了真值标签...
阅读原文

解决大模型复现难、协作难, 这支95后学生团队打造了一个国产AI开源社区

机器之心报道机器之心编辑部过去十年间,AI 技术经历了巨大的飞跃,无论是在自然语言处理、图像识别,还是在更多的创新领域,AI 的影响已无所不在。伴随着研...
阅读原文

UC伯克利团队开源MemGPT大模型上下文内存管理方案;AgentLM、多模态Fuyu-8B、数学LLEMMA等专用大模型开源

本周开源社区新进展本周推荐关注5 个基础模型/精调模型 项目,分别用于视觉问答、数学推理、天文多模态、医疗、代码生成;3个系统/框架/工具项目,分别用于 L...
阅读原文

让大模型看图比打字管用!NeurIPS 2023新研究提出多模态查询方法,准确率提升7.8%

转载自 沁园夏量子位 | 公众号 QbitAI大模型“识图”能力都这么强了,为啥还老找错东西?例如,把长得不太像的蝙蝠和拍子搞混,又或是认不出一些数据集中的稀有...
阅读原文

一行代码提高大模型10%性能,开发者:免费午餐

克雷西 发自 凹非寺量子位 | 公众号 QbitAI大模型微调有“免费的午餐”了,只要一行代码就能让性能提升至少10%。在7B参数量的Llama 2上甚至出现了性能翻倍的结...
阅读原文

如何做出顶级AI研究?OpenAI科学家Jason Wei《AI研究思考》演讲,讲述杰出与普通研究之差别

来源:专知如何做出世界级影响力的AI研究?我们来听听OpenAI科学家Jason Wei在伯克利的报告《AI研究思考》,非常值得关注!OpenAI科学家Jason Wei。Jason Wei...
阅读原文

聊聊昨日ChatGPT全球宕机,带给我们的警示

夕小瑶科技说 原创作者 | 卖萌酱,王二狗昨日,ChatGPT崩了!许多人发现无论是 ChatGPT 或是 ChatGPT PLUS 都不能正常工作了。还连带了全球数以万计的依赖Cha...
阅读原文

爆火!超越ChatGPT和Llama2,新一代检索增强方法Self-RAG来了

夕小瑶科技说 原创作者 | ZenMoore前言大型语言模型(LLMs)具有出色的能力,但由于完全依赖其内部的参数化知识,它们经常产生包含事实错误的回答,尤其在长...
阅读原文

从「最强2D」升维「最强3D」!智源联合清北重磅发布10亿参数Uni3D视觉大模型

新智元报道编辑:好困【新智元导读】最近,智源、清华和北大联合发布了全新的10亿参数的3D视觉通用模型——Uni3D,在主流3D视觉能力上取得了全方位的性能突出!...
阅读原文

LLaMA2上下文长度暴涨至100万tokens,只需调整1个超参数|复旦邱锡鹏团队出品

萧箫 发自 凹非寺量子位 | 公众号 QbitAI只需微调一下,大模型支持上下文大小就能从1.6万tokens延长至100万?!还是在只有70亿参数的LLaMA 2上。要知道,即使...
阅读原文

评论能力强于GPT-4,上交开源13B评估大模型Auto-J

机器之心专栏机器之心编辑部随着生成式人工智能技术的快速发展,确保大模型与人类价值(意图)对齐(Alignment)已经成为行业的重要挑战。虽然模型的对齐至关...
阅读原文

​参数少近一半,性能逼近谷歌Minerva,又一个数学大模型开源了

机器之心报道编辑:大盘鸡、杜伟大模型家族来了一个专门解决数学问题的「新成员」——Llemma。如今,在各种文本混合数据上训练出来的语言模型会显示出非常通用...
阅读原文

DALL·E 3关键技术公开!同时向企业版和Plus会员开放

本文来源:量子位出场即炸场的DALL·E 3,又有新动向了!这次直接宣布对ChatGPT Plus和企业版用户开放,还连带公开了更多“官方推荐案例”。不仅如此,OpenAI还...
阅读原文

DALL·E 3正式上线ChatGPT;智谱AI今年已融资25亿元;科大讯飞回应美国AI芯片出口管制丨AIGC大事日报

10/20全球AIGC产业要闻1、DALL·E 3正式上线ChatGPT Plus和企业版2、智谱AI宣布已完成超25亿人民币融资3、科大讯飞回应美国AI芯片出口管制4、云从将联合华为等...
阅读原文

10.20丨AIGC大事日报

10/20全球AIGC产业要闻1、DALL·E 3正式上线ChatGPT Plus和企业版2、智谱AI宣布已完成超25亿人民币融资3、科大讯飞回应美国AI芯片出口管制4、云从将联合华为等...
阅读原文