标签:模型
李沐大模型公司细节曝光,项目GitHub空仓标星超500
衡宇 发自 凹非寺量子位 | 公众号 QbitAIAI大神李沐大模型创业方向,终于“水落石出”:利用大模型能力,做游戏引擎,且是面向4A游戏。关于4A游戏这个概念,目...
预测token速度翻番!Transformer新解码算法火了,来自小羊驼团队|代码已开源
丰色 发自 凹非寺量子位 | 公众号QbitAI小羊驼团队的新研究火了。他们开发了一种新的解码算法,可以让模型预测100个token数的速度提高1.5-2.3倍,进而加速LLM...
GPT成熟之路官方笔记 | OpenAI开发者日
鱼羊 克雷西 发自 凹非寺量子位 | 公众号 QbitAIChatGPT产品打造的细节,现在OpenAI自己交了个底。并且这波干货分享真是信息量满满,包括但不限于:ChatGPT背...
清华提出 SoRA,参数量只有 LoRA 的 70%,表现更好!
夕小瑶科技说 原创作者 | 智商掉了一地、Python现在有很多关于大型语言模型(LLM)的研究,都围绕着如何高效微调展开。微调是利用模型在大规模通用数据上学到...
OpenAI神秘Q*毁灭人类?爆火「Q*假说」竟牵出世界模型,全网AI大佬长文热议
新智元报道编辑:Aeneas 好困【新智元导读】传闻中OpenAI的Q*,已经引得AI大佬轮番下场。AI2研究科学家Nathan Lambert和英伟达高级科学家Jim Fan都激动的写下...
全网大讨论:引爆OpenAI全员乱斗的Q*到底是什么?
机器之心报道编辑:泽南、小舟强大到能威胁人类,所以不得不把自家 CEO 开了?本周三,OpenAI 的「宫斗」随着山姆・奥特曼回归 CEO 大位而告于段落,不过此次...
人类考92分的题,GPT-4只能考15分:测试一升级,大模型全都现原形了
机器之心报道编辑:张倩、泽南AutoGPT 的得分也凉凉。GPT-4 自诞生以来一直是位「优等生」,在各种考试(基准)中都能得高分。但现在,它在一份新的测试中只...
小模型如何进行上下文学习?字节跳动 & 华东师大联合提出自进化文本识别器
机器之心专栏机器之心编辑部我们都知道,大语言模型(LLM)能够以一种无需模型微调的方式从少量示例中学习,这种方式被称为「上下文学习」(In-context Learn...
像Docker一样编排大模型应用程序:这支十余人的年轻创业团队如何在2个月做出一个LLMOps平台?
采访嘉宾 | 张路宇作者 | 凌敏大模型浪潮正在重构千行百业。可以预见的是,随着技术的不断进步以及应用场景的不断扩展,基于大模型的 AI 应用将会不断涌现,...
用视觉来做Prompt!沈向洋展示IDEA研究院新模型,无需训练或微调,开箱即用
白交 发自 凹非寺量子位 | 公众号 QbitAI用视觉来做Prompt,是种什么体验?只需在图里随便框一下,结果秒秒钟圈出同一类别!即便是那种GPT-4V都难搞定的数米...
Mistral AI:欧洲最强大模型团队的现状及商业未来
Mistral AI 是欧洲最强的 LLM 大模型公司,团队由来自 Google、Meta 和 Hugging Face 的新生代法国科学家们组成。法国是欧洲 AI 人才最集中的地方,Falcon 模...
OpenAI调查ChatGPT错误率升高问题;零一万物上线Yi微调模型;Adobe收购AI视频创企丨AIGC大事日报
11/24全球AIGC产业要闻1、零一万物上线Yi-34B-Chat微调模型及量化版2、中科闻歌雅意大模型2.0将于12月15日发布3、优刻得智算平台“孔明”上线4、OpenAI就ChatGP...
OpenAI神秘新模型Q*太强大,导致奥特曼被开除?你信吗?
来源:量子位OpenAI宫斗大戏刚刚落幕,马上又掀起另一场轩然大波!路透社曝光,在奥特曼被解雇之前,几位研究人员给董事会写的警告信可能是整个事件导火索:...
加速科学进步:通过贝叶斯对抗性合作
来源:CreateAMind分层贝叶斯建模提供了一种优雅的方式,将科学理论正式化为编码分层结构假设空间的模型摘要 对抗性合作被推崇为解决科学争议的黄金标准。...