标签:性能

人大高瓴提出“注意力波”方法,70 亿参数 Llama 比肩 GPT-4

夕小瑶科技说 原创作者 | 智商掉了一地、python最近,随着大型语言模型(LLM)在人机交互、多模态任务和语言应用等领域的广泛应用,研究者们纷纷致力于提升这...
阅读原文

ChatGPT一周年:开源语言大模型的冲击

自2022年末发布后,ChatGPT给人工智能的研究和商业领域带来了巨大变革。通过有监督微调和人类反馈的强化学习,模型可以回答人类问题,并在广泛的任务范围内遵...
阅读原文

CMU 最新研究:Gemini 综合不敌 ChatGPT,谷歌还需努力

研究结果表明,Gemini 综合性能难敌 ChatGPT 。作者丨王 悦 编辑丨陈彩娴 最近谷歌发布的 Gemini 格外引人注目,其号称是第一个在各种任务中可与 OpenAI 的 C...
阅读原文

ChatGPT不再懒惰,GPT-4.5传闻引关注

点击上方蓝字关注我们“OpenAI正对GPT-4进行调整,解决性能问题,并重新开放ChatGPT Plus订阅。有传言称GPT-4.5已秘密推出,但CEO否认。用户反馈GPT-4异常行为...
阅读原文

英特尔第五代至强可扩展处理器发布,在CPU上跑AI更香了

金磊 丰色 发自 凹非寺量子位 | 公众号 QbitAI千呼万唤始出来,第五代英特尔®至强®可扩展处理器,它来了! 若是用一句话来概括它的特点,那就是——AI味道越发...
阅读原文

推理性能超H100十倍!21岁华裔小哥哈佛辍学开发AI加速芯片「Sohu」,2人公司估值3400万刀

新智元报道编辑:润 好困 【新智元导读】最近,两位哈佛辍学生共同创立的AI芯片公司,估值已达3400万美元,并计划明年交付一款名为「Sohu」的AI推理加速芯片—...
阅读原文

PaLM 2数学性能暴涨6%!DeepMind新作力证「合成数据」是通往AGI关键

新智元报道编辑:桃子【新智元导读】AI可以从自己生成的「合成数据」中学习,最重要的是,能够大幅提升数据问题解决和代码生成的能力。合成数据,或许就是大...
阅读原文

微软推出2.7B「小语言模型」,碾压Gemini Nano,能打Llama 2 70B

大模型现在真的是越来越卷了!11月OpenAI先是用GPTs革了套壳GPT们的命,然后再不惜献祭董事会搏了一波天大的流量。谷歌被逼急了,赶在年底之前仓促发布了超大...
阅读原文

2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano

新智元报道编辑:润 alan【新智元导读】都快到年底了,大模型领域还在卷,今天,Microsoft发布了参数量为2.7B的Phi-2——不仅13B参数以内没有对手,甚至还能和L...
阅读原文

微软小模型击败大模型:27亿参数,手机就能跑

机器之心报道编辑:杜伟、小舟在「小搏大」这条技术发展路线上,微软一直在前进。上个月,微软 CEO 纳德拉在 Ignite 大会上宣布自研小尺寸模型 Phi-2 将完全...
阅读原文

最新开源模型Mixtral震爆AI社区!超越LLama2和GPT-3.5,来自欧洲初创公司

夕小瑶科技说 原创作者 | 松果、王二狗这两天,法国初创公司Mistral AI开源的一个Mixtral 8x7B MoE模型引爆了AI社区。一是因为它的性能击败了LLama2和GPT-3.5...
阅读原文

22人估值20亿美元,半年增长七倍,“欧洲 OpenAI”发布媲美GPT3.5的“开放权重”模型

编辑 | Tina Mistral AI 是一家总部位于巴黎的初创公司,由 Meta 和谷歌的研究人员于七个月前创立。目前,该公司已成功筹集 3.85 亿欧元(约合 4.15 亿美元...
阅读原文

2024年AI趋势看这张图,LeCun:开源大模型要超越闭源

机器之心报道编辑:大盘鸡、泽南能感受到其中的趋势吗?2023 年即将过去。一年以来,各式各样的大模型争相发布。当 OpenAI 和谷歌等科技巨头正在角逐时, —— ...
阅读原文

性能超越GPT-3.5:Mistral 8x7B是目前最好的开源 LLM

点击上方蓝字关注我们“ 欧洲初创公司Mistral最新发布Mixtral 8x7B,采用独特“专家混合”技术,介绍展示了该模型性能超越GPT-3.5和Llama 2系列。同时,该公司完...
阅读原文

训练成本不到其 6% 的「联邦大模型」,凭什么在会议场景媲美 GPT-4?

「三个臭皮匠,顶个诸葛亮」。作者丨何思思编辑丨陈彩娴今年 8 月,在雷峰网于新加坡举办的 GAIR 大会主论坛上,前微软全球技术院士、美国双院院士黄学东用一...
阅读原文
1181920212226