标签:模型
Meta计划曝光:下一个大模型以GPT-4为标准,2024年开始训练
机器之心报道编辑:陈萍随着技术竞赛的升级,Meta 更强大的 AI 系统正在研发当中。在 AI 研究这一领域,Meta 可谓是走在了众多科技公司的前列。自年初以来,...
尴尬了!用ChatGPT写论文忘删生成按钮,出版商:撤稿
白交 发自 凹非寺量子位 | 公众号 QbitAI尴尬了,物理论文把ChatGPT按钮也复制了进去。结果不仅通过了两个月同行评审,甚至最终在杂志上公开发表。而发现这一...
老黄给H100“打鸡血”:英伟达推出大模型加速包,Llama2推理速度翻倍
克雷西 发自 凹非寺量子位 | 公众号 QbitAI大模型的推理速度,仅仅一个月就提高了一倍!英伟达近日官宣给H100推出了“鸡血包”——专用于LLM推理的加速程序。或许...
强!谷歌DeepMind新论文放出大语言模型最佳提示词,由AI设计效果超人类
夕小瑶科技说 分享来源 | 量子位提示词中加上“深呼吸”,AI大模型数学成绩就能再涨8.4分!谷歌DeepMind团队最新发现,用这个新“咒语”(Take a deep breath)结...
清华团队提出“高分辨率”图像生成方法:任意分辨率无缝衔接,极大降低训练和采样成本
大数据文摘受权转载自学术头条在火热的“AI 图像生成”领域,任意不同分辨率的无缝衔接扩散模型,出现了。近日,来自清华大学和智谱 AI 的研究团队联合提出了一...
访谈系列·E03S01|GPT-4成功背后灵魂人物Ilya访谈解读——从预训练模型到可靠可用AGI
图|汤源文|汤源OpenAI的CEO Sam Altman在MIT AI研究员兼Youtube播客Lex Fridman的专访中▽题记在讨论GPT-4是否是通用人工智能(AGI)时,尤其是在与GPT-4对...
智谱AI最新估值突破100亿元;红杉减持美团,迄今超500亿港币;消息称9月30日前,阿里云将关停代销业务 | AI一周资讯
编辑 | 冬梅、刘绍芬红杉“清仓式”减持美团 套现迄今已超 500 亿;消息称 9 月 30 日前,阿里云将关停代销业务;马斯克更新隐私政策表明将使用用户数据训练 AI...
AIGC,驱动架构与业务的新动力 | 9月16日 TF线下活动报名
本期CCF TF第117期“AIGC,驱动架构与业务的新动力”活动由CCF TF架构SIG承办,新浪协办,邀请到了科大讯飞、阿里云、去哪儿网、新浪微博等多位互联网技术专家...
H100推理飙升8倍!英伟达官宣开源TensorRT-LLM,支持10+模型
新智元报道编辑:桃子 润【新智元导读】H100让模型推理性能最高跃升8倍!英伟达最新开源软件TensorRT-LLM,将彻底改变LLM推理现状。「GPU贫民」即将告别困境...
Llama2 7B中文魔改PK:「雅意」百万指令集微调 VS「伶荔」扩词+增量预训练+指令微调
机器之心 SOTA!模型社区专栏作者:Jiying专栏编辑:之乎、 雅芳、小土同学本专栏由机器之心SOTA!模型社区出品,每周日于机器之心公众号持续更新。探索 Llam...
访谈系列·E02S01|llya的AGI信念:为伊消得人憔悴,十年终迎GPT震撼崛起
图|汤源文|汤源GPT-4成功背后灵魂人物Ilya访谈-让机器学会思考与理解语言的关键▽题记本文主要介绍了GPT系列模型的演进历程,从GPT-1到GPT-3,模型参数规模...
蚂蚁集团开 “卷” 金融大模型,“四力和一” 解决产业真命题
机器之心原创作者:吴昕大模型最让人印象深刻的是它们的「涌现」行为,数以万计的二进制计算决策融合成一种仿佛人类的理解力和创造力,让金融行业看到开发一...
10万美元+26天,一个低成本千亿参数LLM就诞生了
机器之心报道编辑:Panda W训练一个 GPT 那样的千亿参数规模的大型语言模型需要多少钱和时间?北京智源人工智能研究院和中国科学院计算技术研究所等多所机构...
大模型写代码能力突飞猛进,北大团队提出结构化思维链SCoT
机器之心专栏机器之心编辑部任何简单或复杂的算法都可以由顺序结构、选择结构和循环结构这三种基本结构组合而成。摘要大型语言模型(下文称为:大模型)在代...