标签:准确率
字节提出视觉基础模型ViTamin,多项任务实现SOTA,入选CVPR2024
文章转载自公众号:量子位,本文只做学术/技术分享,如有侵权,联系删文。 视觉语言模型屡屡出现新突破,但ViT仍是图像编码器的首选网络结构。 字节提出新基...
字节发布视觉基础模型ViTamin,多项任务实现SOTA,入选CVPR2024
允中 发自 凹非寺量子位 | 公众号 QbitAI视觉语言模型屡屡出现新突破,但ViT仍是图像编码器的首选网络结构。 字节提出新基础模型——ViTamin,专为视觉语言时代...
苹果加入开源大战,官宣端侧小模型OpenELM!参数2.7亿到30亿一台M2 Mac可跑
新智元报道编辑:桃子 【新智元导读】开源战在这半个月愈演愈烈。先是Llama 3,又到微软Phi-3,再到今天苹果发布的OpenELM。四种不同小参数版本全部上线,我...
苹果卷开源大模型,公开代码、权重、数据集、训练全过程,OpenELM亮相
机器之心报道 编辑:陈萍、大盘鸡苹果发布基于开源训练和推理框架的高效语言模型族 OpenELM。要说 ChatGPT 拉开了大模型竞赛的序幕,那么 Meta 开源 Llama 系...
超越GPT-4,斯坦福团队手机可跑的大模型火了,一夜下载量超2k
机器之心报道 机器之心编辑部在大模型落地应用的过程中,端侧 AI 是非常重要的一个方向。 近日,斯坦福大学研究人员推出的 Octopus v2 火了,受到了开发者社...
如何从头开始编写LoRA代码,这有一份教程
选自 lightning.ai 作者:Sebastian Raschka 机器之心编译 编辑:陈萍作者表示:在各种有效的 LLM 微调方法中,LoRA 仍然是他的首选。LoRA(Low-Rank Adaptat...
何恺明刘壮新作:消除数据集偏差的十年之战
编辑部 发自 凹非寺量子位 | 公众号 QbitAIMIT新晋副教授何恺明,新作新鲜出炉: 瞄准一个横亘在AI发展之路上十年之久的问题:数据集偏差。 该研究为何恺明在...
年轻人的第一个多模态大模型:1080Ti轻松运行,已开源在线可玩
Vary-toy团队 投稿量子位 | 公众号 QbitAI一款名为Vary-toy的“年轻人的第一个多模态大模型”来了! 模型大小不到2B,消费级显卡可训练,GTX1080ti 8G的老显卡...
历时8年终发Science,他证明老鼠有类人的想象力
来源:量子位关于大模型注意力机制,Meta又有了一项新研究。通过调整模型注意力,屏蔽无关信息的干扰,新的机制让大模型准确率进一步提升。而且这种机制不需...
更像人脑的新型注意力机制,Meta让大模型自动屏蔽任务无关信息,准确率提高27%
克雷西 发自 凹非寺量子位 | 公众号 QbitAI关于大模型注意力机制,Meta又有了一项新研究。通过调整模型注意力,屏蔽无关信息的干扰,新的机制让大模型准确率...
DeepMind:谁说卷积网络不如ViT?
机器之心报道编辑:陈萍、小舟本文通过评估按比例扩大的 NFNets,挑战了 ConvNets 在大规模上表现不如 ViTs 的观点。深度学习的早期成功可归功于卷积神经网络...
大模型搞“搜索”,准确率高达95.8%!研究作者:已提醒OpenAI谷歌Meta
丰色 发自 凹非寺量子位 | 公众号 QbitAI一项最新研究(来自苏黎世联邦理工大学)发现:大模型的“人肉搜索”能力简直不可小觑。例如一位Reddit用户只是发表了...
DeepMind让大模型学会归纳和演绎,GPT-4准确率提升13.7%
机器之心报道机器之心编辑部当前,大型语言模型(LLM)在推理任务上表现出令人惊艳的能力,特别是在给出一些样例和中间步骤时。然而,prompt 方法往往依赖于 ...
突破『逆转诅咒』!新数学推理数据集揭秘,让大语言模型逆向推理能力翻倍
夕小瑶科技说 分享来源 | 机器之心复杂数学推理是评价大语言模型推理能力的重要指标,目前常用的数学推理数据集样本量有限且问题多样性不足,导致大语言模型...
MetaMath:新数学推理语言模型,训练大模型的逆向思维
机器之心专栏机器之心编辑部复杂数学推理是评价大语言模型推理能力的重要指标,目前常用的数学推理数据集样本量有限且问题多样性不足,导致大语言模型存在 [...