标签:模型

全面的中文大语言模型评测来啦!香港中文大学研究团队发布

允中 发自 凹非寺量子位 | 公众号 QbitAIChatGPT 的一声号角吹响了2023年全球大语言模型的竞赛。2023年初以来,来自工业界和研究机构的各种大语言模型层出不...
阅读原文

大语言模型击败扩散模型!视频图像生成双SOTA,谷歌CMU最新研究,一作北大校友

白交 发自 凹非寺量子位 | 公众号 QbitAI语言模型击败扩散模型,在视频和图像生成上实现双SOTA!这是来自谷歌CMU最新研究成果。据介绍,这是语言模型第一次在...
阅读原文

一周AI热点(10月9日-10月15日)

图|匡萃彪文|匡萃彪OpenAI 年入13亿美元,下月将推出重大更新OpenAI计划在下个月推出重大更新,旨在使其AI模型更容易为开发者所用,降低应用开发成本最多20...
阅读原文

最新AI热点论文(10/9-10/15)

图|匡萃彪文|匡萃彪最新人工智能论文(10/9-10/15):- 环形注意力- 通用模拟器- LLMs中事实性的概述- LLMs 能学规则- LLM的元思维链提示- 医疗保健LLM调查...
阅读原文

推理成本增加10倍?对文心大模型4.0的一些猜想

夕小瑶科技说 原创作者 | 卖萌酱大家好,我是卖萌酱。相信不少小伙伴这几天都听到了消息,在期待下周即将发布的文心大模型4.0。我们的几个读者群里也发生了相...
阅读原文

“大大震惊”一位CTO:GPT-4V自动驾驶五连测关注前沿科技 量子位 2023-10-15 14:39 发表于北京

来源:量子位编者按:GPT-4V的到来,给AI又带来了无限可能。近日,图森中国CTO王乃岩在知乎发表的《GPT-4V在自动驾驶中初探》引发了不少关注。在多项测试之后...
阅读原文

“大大震惊”一位CTO:GPT-4V自动驾驶五连测

编者按:GPT-4V的到来,给AI又带来了无限可能。近日,图森中国CTO王乃岩在知乎发表的《GPT-4V在自动驾驶中初探》引发了不少关注。在多项测试之后,他本人表示...
阅读原文

CCF CED 2023完整日程公布!10月21日,一起探讨大模型时代的工程师文化

CCF CED 2023中国计算机学会工程师文化日将于10月21日在苏州CCF业务总部 学术交流中心举行,期待您的参与!在大模型技术引发的新的技术浪潮之中,即将于10月2...
阅读原文

字节跳动李航:对语言大模型的若干观察和思考

机器之心专栏作者:ByteDance Research负责人李航本文阐述笔者对 LLM 的一些看法,主要观点如下:ChatGPT 的突破主要在于规模带来的质变和模型调教方式的发明...
阅读原文

值得一试的开源模型!开源社区上季度都有哪些靠谱项目?

在过去的一个季度,社区开源了不少「值得一试」的通用模型,包括 LLaMA 2、Baichuan 2、ChatGLM2-6B、Qwen-14B、InternLM-20B、Tigerbot-13B、Xverse-13B 等...
阅读原文

「Meta版ChatGPT」背后的技术:想让基础LLM更好地处理长上下文,只需持续预训练

机器之心报道编辑:Panda W在处理长上下文方面,LLaMA 一直力有不足,而通过持续预训练和其它一些方法改进,Meta 的这项研究成功让 LLM 具备了有效理解上下文...
阅读原文

SGD 的光辉,带来深度学习的意义

大数据文摘出品7月份,纽约大学(NYU)博士后Naomi Saphra撰写了一篇题为“Interpretability Creationism”,从进化论的角度解释了随机梯度下降(SGD)与深度学...
阅读原文

LangChain 不好用的原因是,它起步于一场程序员的自嗨

当库克站在苹果总部大楼外围草坪的虚拟背景前开始展示全新的 15 pro 系列 iPhone,居住在波兰的产品设计师 Volodymyr 转头拿起手机。他发了一条推特:「我怀...
阅读原文

OpenAI靠ChatGPT赚翻了!年收入较去年翻45倍

来源:硅星人Pro据外媒报道,ChatGPT 制造商 OpenAI 首席执行官Sam Altman本周告诉员工,OpenAI 的年化标准收入达到了 13 亿美元。Altman的这次发言意味着,O...
阅读原文

别再「浪费」GPU了,FlashAttention重磅升级,实现长文本推理速度8倍提升

机器之心报道机器之心编辑部处理小说、法律文件等长文本是大模型的一个重要应用方向,但也面临速度上的挑战。FlashAttention 作者 Tri Dao 等人提出的「Flash...
阅读原文