标签：模型

全面的中文大语言模型评测来啦！香港中文大学研究团队发布

允中发自凹非寺量子位 | 公众号 QbitAIChatGPT 的一声号角吹响了2023年全球大语言模型的竞赛。2023年初以来，来自工业界和研究机构的各种大语言模型层出不...

阅读原文

AIGC动态

3年前 (2023)

大语言模型击败扩散模型！视频图像生成双SOTA，谷歌CMU最新研究，一作北大校友

白交发自凹非寺量子位 | 公众号 QbitAI语言模型击败扩散模型，在视频和图像生成上实现双SOTA！这是来自谷歌CMU最新研究成果。据介绍，这是语言模型第一次在...

阅读原文

AIGC动态

3年前 (2023)

一周AI热点（10月9日-10月15日）

图｜匡萃彪文｜匡萃彪OpenAI 年入13亿美元，下月将推出重大更新OpenAI计划在下个月推出重大更新，旨在使其AI模型更容易为开发者所用，降低应用开发成本最多20...

阅读原文

AIGC动态

3年前 (2023)

推理成本增加10倍？对文心大模型4.0的一些猜想

夕小瑶科技说原创作者 | 卖萌酱大家好，我是卖萌酱。相信不少小伙伴这几天都听到了消息，在期待下周即将发布的文心大模型4.0。我们的几个读者群里也发生了相...

阅读原文

AIGC动态

3年前 (2023)

“大大震惊”一位CTO：GPT-4V自动驾驶五连测关注前沿科技量子位 2023-10-15 14:39 发表于北京

来源：量子位编者按：GPT-4V的到来，给AI又带来了无限可能。近日，图森中国CTO王乃岩在知乎发表的《GPT-4V在自动驾驶中初探》引发了不少关注。在多项测试之后...

阅读原文

AIGC动态

3年前 (2023)

“大大震惊”一位CTO：GPT-4V自动驾驶五连测

编者按：GPT-4V的到来，给AI又带来了无限可能。近日，图森中国CTO王乃岩在知乎发表的《GPT-4V在自动驾驶中初探》引发了不少关注。在多项测试之后，他本人表示...

阅读原文

AIGC动态

3年前 (2023)

CCF CED 2023完整日程公布！10月21日，一起探讨大模型时代的工程师文化

CCF CED 2023中国计算机学会工程师文化日将于10月21日在苏州CCF业务总部学术交流中心举行，期待您的参与！在大模型技术引发的新的技术浪潮之中，即将于10月2...

阅读原文

AIGC动态

3年前 (2023)

「Meta版ChatGPT」背后的技术：想让基础LLM更好地处理长上下文，只需持续预训练

机器之心报道编辑：Panda W在处理长上下文方面，LLaMA 一直力有不足，而通过持续预训练和其它一些方法改进，Meta 的这项研究成功让 LLM 具备了有效理解上下文...

阅读原文

AIGC动态

3年前 (2023)

字节跳动李航：对语言大模型的若干观察和思考

机器之心专栏作者：ByteDance Research负责人李航本文阐述笔者对 LLM 的一些看法，主要观点如下：ChatGPT 的突破主要在于规模带来的质变和模型调教方式的发明...

阅读原文

AIGC动态

3年前 (2023)

值得一试的开源模型！开源社区上季度都有哪些靠谱项目？

在过去的一个季度，社区开源了不少「值得一试」的通用模型，包括 LLaMA 2、Baichuan 2、ChatGLM2-6B、Qwen-14B、InternLM-20B、Tigerbot-13B、Xverse-13B 等...

阅读原文

AIGC动态

3年前 (2023)

SGD 的光辉，带来深度学习的意义

大数据文摘出品7月份，纽约大学（NYU）博士后Naomi Saphra撰写了一篇题为“Interpretability Creationism”，从进化论的角度解释了随机梯度下降（SGD）与深度学...

阅读原文

AIGC动态

3年前 (2023)

LangChain 不好用的原因是，它起步于一场程序员的自嗨

当库克站在苹果总部大楼外围草坪的虚拟背景前开始展示全新的 15 pro 系列 iPhone，居住在波兰的产品设计师 Volodymyr 转头拿起手机。他发了一条推特：「我怀...

阅读原文

AIGC动态

3年前 (2023)

OpenAI靠ChatGPT赚翻了！年收入较去年翻45倍

来源：硅星人Pro据外媒报道，ChatGPT 制造商 OpenAI 首席执行官Sam Altman本周告诉员工，OpenAI 的年化标准收入达到了 13 亿美元。Altman的这次发言意味着，O...

阅读原文

AIGC动态

3年前 (2023)

别再「浪费」GPU了，FlashAttention重磅升级，实现长文本推理速度8倍提升

机器之心报道机器之心编辑部处理小说、法律文件等长文本是大模型的一个重要应用方向，但也面临速度上的挑战。FlashAttention 作者 Tri Dao 等人提出的「Flash...

阅读原文

AIGC动态

3年前 (2023)

1…439 440441442 443…483