标签:模型

ViT-22B被取代了!商汤开源60亿视觉参数大模型InternVL刷爆多模态榜单!

论文链接: https://arxiv.org/abs/2312.14238开源代码: https://github.com/OpenGVLab/InternVL01引言大型语言模型(LLMs)在开放世界语言任务中展现出令人...
阅读原文

GPT-5不会真正突破,24年AGI不会实现!全网AI大佬24年最全预测

新智元报道编辑:Aeneas 桃子 【新智元导读】经过23年的生成式AI之年,24年AI会有哪些新突破?大佬预测,即使GPT-5发布,LLM在本质上仍然有限,在24年,基本...
阅读原文

GPT-4抽象推理PK人类差距巨大!多模态远不如纯文本,AGI火花难以燃烧

新智元报道编辑:Mindy 润 【新智元导读】圣达菲研究所的科研人员用非常严谨的定量研究方法,测试出了GPT-4在推理和抽象方面与人类水平还有较大差距。要想从G...
阅读原文

这是GPT-4变笨的新解释

机器之心报道 编辑:蛋酱变笨的本质是知识没进脑子。 自发布以来,曾被认为是世界上最强大的 GPT-4 也经历了多场「信任危机」。 如果说今年早些时候那次「间...
阅读原文

基础模型+机器人:现在已经走到哪一步了

机器之心报道 编辑:Panda W机器人是一种拥有无尽可能性的技术,尤其是当搭配了智能技术时。近段时间创造了许多变革性应用的大模型有望成为机器人的智慧大脑...
阅读原文

AI 行业2024 年最重要的 32 个趋势,都在这了

预知 2024回顾过去一年,生成式 AI 迎来了井喷式发展,从抽象晦涩的技术概念,转变为人们手中不可或缺的生产力工具,深刻地渗透到社会的每个角落。 展望 2024...
阅读原文

ChatGPT变笨新解释:世界被AI改变,与训练时不同了

梦晨 发自 凹非寺量子位 | 公众号 QbitAI对于ChatGPT变笨原因,学术界又有了一种新解释。 加州大学圣克鲁兹分校一项研究指出: 在训练数据截止之前的任务上,...
阅读原文

OpenAI年收入破16亿美元!AI元年英伟达暴涨239%+2024年AI大预测

新智元报道编辑:桃子 润 【新智元导读】OpenAI年收入破16亿美元,美股更是一片大好,以科技股为主的纳斯达克指数年底暴涨涨了43%。2023年即将落幕,2024年AI...
阅读原文

Hugging Face:2023开源LLM大爆发,数据竞赛已开启!

新智元报道编辑:alan 【新智元导读】2023年的LLM开源社区都发生了什么?来自Hugging Face的研究员带你回顾并重新认识开源LLM2023年的大语言模型(LLM),让...
阅读原文

安徽,全面瞄准通用人工智能

机器之心原创 作者:姜菁玲过去一年人工智能赛道投资人的出差列表里,除了北上深,中部省份安徽的存在感越来越高。 走在安徽省合肥市的中安创谷产业园里,这...
阅读原文

8x7B MoE与Flash Attention 2结合,不到10行代码实现快速推理

机器之心报道 编辑:陈萍感兴趣的小伙伴,可以跟着操作过程试一试。前段时间,Mistral AI 公布的 Mixtral 8x7B 模型爆火整个开源社区,其架构与 GPT-4 非常相...
阅读原文

告别冷启动,LoRA成为大模型「氮气加速器」,提速高达300%

选自Raphael G 的博客 机器之心编译 作者:Raphael G 编辑:大盘鸡用 LoRA打造更快的 AI 模型。AI 模型功能越来越强大,结构也越来越复杂,它们的速度也成为...
阅读原文

盘点2023,大模型产业狂奔的365天

无尤发自 2023量子位 | 公众号 QbitAI4万亿摄氏度(345MeV),是美国纽约布鲁克黑文国家实验室在2010年利用相对论性重离子对撞机进行金离子对撞实验时创造的...
阅读原文

无需额外训练提升模型30%性能!DeepMind科学家点赞MIT博士生实习成果

丰色 发自 凹非寺量子位 | 公众号 QbitAI一个来自MIT博士生的惊人发现: 只需对Transformer的特定层进行一种非常简单的修剪,即可在缩小模型规模的同时显著提...
阅读原文

LLaMA开源大模型源码分析!

01LLaMA-Model在transformers仓库中可以看到llama的源码,首先是LlamaModel类,继承自PreTrainedModel,这个类是所有模型的基类,包含了一些通用的方法,比如...
阅读原文