标签：性能

人大高瓴提出“注意力波”方法，70 亿参数 Llama 比肩 GPT-4

夕小瑶科技说原创作者 | 智商掉了一地、python最近，随着大型语言模型（LLM）在人机交互、多模态任务和语言应用等领域的广泛应用，研究者们纷纷致力于提升这...

阅读原文

AIGC动态

3年前 (2023)

ChatGPT一：开源语言大模型的冲击

自2022年末发布后，ChatGPT给人工智能的研究和商业领域带来了巨大变革。通过有监督微调和人类反馈的强化学习，模型可以回答人类问题，并在广泛的任务范围内遵...

阅读原文

AIGC动态

3年前 (2023)

CMU 最新研究：Gemini 综合不敌 ChatGPT，谷歌还需努力

研究结果表明，Gemini 综合性能难敌 ChatGPT 。作者丨王悦编辑丨陈彩娴最近谷歌发布的 Gemini 格外引人注目，其号称是第一个在各种任务中可与 OpenAI 的 C...

阅读原文

AIGC动态

3年前 (2023)

ChatGPT不再懒惰，GPT-4.5传闻引关注

点击上方蓝字关注我们“OpenAI正对GPT-4进行调整，解决性能问题，并重新开放ChatGPT Plus订阅。有传言称GPT-4.5已秘密推出，但CEO否认。用户反馈GPT-4异常行为...

阅读原文

AIGC动态

3年前 (2023)

英特尔第五代至强可扩展处理器发布，在CPU上跑AI更香了

金磊丰色发自凹非寺量子位 | 公众号 QbitAI千呼万唤始出来，第五代英特尔®至强®可扩展处理器，它来了！若是用一句话来概括它的特点，那就是——AI味道越发...

阅读原文

AIGC动态

3年前 (2023)

推理性能超H100十倍！21岁华裔小哥哈佛辍学开发AI加速芯片「Sohu」，2人公司估值3400万刀

新智元报道编辑：润好困【新智元导读】最近，两位哈佛辍学生共同创立的AI芯片公司，估值已达3400万美元，并计划明年交付一款名为「Sohu」的AI推理加速芯片—...

阅读原文

AIGC动态

3年前 (2023)

PaLM 2数学性能暴涨6%！DeepMind新作力证「合成数据」是通往AGI关键

新智元报道编辑：桃子【新智元导读】AI可以从自己生成的「合成数据」中学习，最重要的是，能够大幅提升数据问题解决和代码生成的能力。合成数据，或许就是大...

阅读原文

AIGC动态

3年前 (2023)

微软推出2.7B「小语言模型」，碾压Gemini Nano，能打Llama 2 70B

大模型现在真的是越来越卷了！11月OpenAI先是用GPTs革了套壳GPT们的命，然后再不惜献祭董事会搏了一波天大的流量。谷歌被逼急了，赶在年底之前仓促发布了超大...

阅读原文

AIGC动态

3年前 (2023)

2.7B能打Llama 2 70B，微软祭出「小语言模型」！96块A100 14天训出Phi-2，碾压谷歌Gemini nano

新智元报道编辑：润 alan【新智元导读】都快到年底了，大模型领域还在卷，今天，Microsoft发布了参数量为2.7B的Phi-2——不仅13B参数以内没有对手，甚至还能和L...

阅读原文

AIGC动态

3年前 (2023)

微软小模型击败大模型：27亿参数，手机就能跑

机器之心报道编辑：杜伟、小舟在「小搏大」这条技术发展路线上，微软一直在前进。上个月，微软 CEO 纳德拉在 Ignite 大会上宣布自研小尺寸模型 Phi-2 将完全...

阅读原文

AIGC动态

3年前 (2023)

22人估值20亿美元，半年增长七倍，“欧洲 OpenAI”发布媲美GPT3.5的“开放权重”模型

编辑｜ Tina Mistral AI 是一家总部位于巴黎的初创公司，由 Meta 和谷歌的研究人员于七个月前创立。目前，该公司已成功筹集 3.85 亿欧元（约合 4.15 亿美元...

阅读原文

AIGC动态

3年前 (2023)

2024年AI趋势看这张图，LeCun：开源大模型要超越闭源

机器之心报道编辑：大盘鸡、泽南能感受到其中的趋势吗？2023 年即将过去。一年以来，各式各样的大模型争相发布。当 OpenAI 和谷歌等科技巨头正在角逐时， —— ...

阅读原文

AIGC动态

3年前 (2023)

性能超越GPT-3.5：Mistral 8x7B是目前最好的开源 LLM

点击上方蓝字关注我们“ 欧洲初创公司Mistral最新发布Mixtral 8x7B，采用独特“专家混合”技术，介绍展示了该模型性能超越GPT-3.5和Llama 2系列。同时，该公司完...

阅读原文

AIGC动态

3年前 (2023)

训练成本不到其 6% 的「联邦大模型」，凭什么在会议场景媲美 GPT-4？

「三个臭皮匠，顶个诸葛亮」。作者丨何思思编辑丨陈彩娴今年 8 月，在雷峰网于新加坡举办的 GAIR 大会主论坛上，前微软全球技术院士、美国双院院士黄学东用一...

阅读原文

AIGC动态

3年前 (2023)

1…18 192021 22…26