标签:模型

李沐大模型公司细节曝光,项目GitHub空仓标星超500

衡宇 发自 凹非寺量子位 | 公众号 QbitAIAI大神李沐大模型创业方向,终于“水落石出”:利用大模型能力,做游戏引擎,且是面向4A游戏。关于4A游戏这个概念,目...
阅读原文

预测token速度翻番!Transformer新解码算法火了,来自小羊驼团队|代码已开源

丰色 发自 凹非寺量子位 | 公众号QbitAI小羊驼团队的新研究火了。他们开发了一种新的解码算法,可以让模型预测100个token数的速度提高1.5-2.3倍,进而加速LLM...
阅读原文

GPT成熟之路官方笔记 | OpenAI开发者日

鱼羊 克雷西 发自 凹非寺量子位 | 公众号 QbitAIChatGPT产品打造的细节,现在OpenAI自己交了个底。并且这波干货分享真是信息量满满,包括但不限于:ChatGPT背...
阅读原文

清华提出 SoRA,参数量只有 LoRA 的 70%,表现更好!

夕小瑶科技说 原创作者 | 智商掉了一地、Python现在有很多关于大型语言模型(LLM)的研究,都围绕着如何高效微调展开。微调是利用模型在大规模通用数据上学到...
阅读原文

OpenAI神秘Q*毁灭人类?爆火「Q*假说」竟牵出世界模型,全网AI大佬长文热议

新智元报道编辑:Aeneas 好困【新智元导读】传闻中OpenAI的Q*,已经引得AI大佬轮番下场。AI2研究科学家Nathan Lambert和英伟达高级科学家Jim Fan都激动的写下...
阅读原文

全网大讨论:引爆OpenAI全员乱斗的Q*到底是什么?

机器之心报道编辑:泽南、小舟强大到能威胁人类,所以不得不把自家 CEO 开了?本周三,OpenAI 的「宫斗」随着山姆・奥特曼回归 CEO 大位而告于段落,不过此次...
阅读原文

人类考92分的题,GPT-4只能考15分:测试一升级,大模型全都现原形了

机器之心报道编辑:张倩、泽南AutoGPT 的得分也凉凉。GPT-4 自诞生以来一直是位「优等生」,在各种考试(基准)中都能得高分。但现在,它在一份新的测试中只...
阅读原文

小模型如何进行上下文学习?字节跳动 & 华东师大联合提出自进化文本识别器

机器之心专栏机器之心编辑部我们都知道,大语言模型(LLM)能够以一种无需模型微调的方式从少量示例中学习,这种方式被称为「上下文学习」(In-context Learn...
阅读原文

像Docker一样编排大模型应用程序:这支十余人的年轻创业团队如何在2个月做出一个LLMOps平台?

采访嘉宾 | 张路宇作者 | 凌敏大模型浪潮正在重构千行百业。可以预见的是,随着技术的不断进步以及应用场景的不断扩展,基于大模型的 AI 应用将会不断涌现,...
阅读原文

用视觉来做Prompt!沈向洋展示IDEA研究院新模型,无需训练或微调,开箱即用

白交 发自 凹非寺量子位 | 公众号 QbitAI用视觉来做Prompt,是种什么体验?只需在图里随便框一下,结果秒秒钟圈出同一类别!即便是那种GPT-4V都难搞定的数米...
阅读原文

Mistral AI:欧洲最强大模型团队的现状及商业未来

Mistral AI 是欧洲最强的 LLM 大模型公司,团队由来自 Google、Meta 和 Hugging Face 的新生代法国科学家们组成。法国是欧洲 AI 人才最集中的地方,Falcon 模...
阅读原文

手机大模型之战,只差苹果了

一个月,四家,连发十余个大模型,手机厂商们是真着急了。作者|云鹏编辑|心缘就在智能手机出货量跌入十年最低谷之际,AI大模型直接给所有人送来了新的机遇。...
阅读原文

OpenAI调查ChatGPT错误率升高问题;零一万物上线Yi微调模型;Adobe收购AI视频创企丨AIGC大事日报

11/24全球AIGC产业要闻1、零一万物上线Yi-34B-Chat微调模型及量化版2、中科闻歌雅意大模型2.0将于12月15日发布3、优刻得智算平台“孔明”上线4、OpenAI就ChatGP...
阅读原文

OpenAI神秘新模型Q*太强大,导致奥特曼被开除?你信吗?

来源:量子位OpenAI宫斗大戏刚刚落幕,马上又掀起另一场轩然大波!路透社曝光,在奥特曼被解雇之前,几位研究人员给董事会写的警告信可能是整个事件导火索:...
阅读原文

加速科学进步:通过贝叶斯对抗性合作

来源:CreateAMind分层贝叶斯建模提供了一种优雅的方式,将科学理论正式化为编码分层结构假设空间的模型摘要 对抗性合作被推崇为解决科学争议的黄金标准。...
阅读原文