标签:准确率

清华接手,YOLOv10问世:性能大幅提升,登上GitHub热榜

机器之心报道 机器之心编辑部相同性能情况下,延迟减少 46%,参数减少 25%。目标检测系统的标杆 YOLO 系列,再次获得了重磅升级。自今年 2 月 YOLOv9 发布之...
阅读原文

芝大论文证明GPT-4选股准确率高达60%,人类股票分析师要下岗?AI大牛质疑数据污染

新智元报道编辑:编辑部 【新智元导读】GPT-4在为人类选股时,表现竟然超越了大部分人类分析师,和针对金融训练的专业模型?在没有任何上下文的情况下,它们...
阅读原文

谷歌数学版Gemini破解奥赛难题,堪比人类数学家!

新智元报道编辑:编辑部 【新智元导读】I/O大会上,谷歌Gemini 1.5 Pro一系列更新让开发者们再次沸腾。最新技术报告中,最引人注目的一点是,数学专业版1.5 P...
阅读原文

AI学会隐藏思维暗中推理!不依赖人类经验解决复杂任务,更黑箱了

梦晨 发自 凹非寺量子位 | 公众号 QbitAIAI做数学题,真正的思考居然是暗中“心算”的? 纽约大学团队新研究发现,即使不让AI写步骤,全用无意义的“……”代替,在...
阅读原文

字节提出视觉基础模型ViTamin,多项任务实现SOTA,入选CVPR2024

文章转载自公众号:量子位,本文只做学术/技术分享,如有侵权,联系删文。 视觉语言模型屡屡出现新突破,但ViT仍是图像编码器的首选网络结构。 字节提出新基...
阅读原文

字节发布视觉基础模型ViTamin,多项任务实现SOTA,入选CVPR2024

允中 发自 凹非寺量子位 | 公众号 QbitAI视觉语言模型屡屡出现新突破,但ViT仍是图像编码器的首选网络结构。 字节提出新基础模型——ViTamin,专为视觉语言时代...
阅读原文

苹果加入开源大战,官宣端侧小模型OpenELM!参数2.7亿到30亿一台M2 Mac可跑

新智元报道编辑:桃子 【新智元导读】开源战在这半个月愈演愈烈。先是Llama 3,又到微软Phi-3,再到今天苹果发布的OpenELM。四种不同小参数版本全部上线,我...
阅读原文

苹果卷开源大模型,公开代码、权重、数据集、训练全过程,OpenELM亮相

机器之心报道 编辑:陈萍、大盘鸡苹果发布基于开源训练和推理框架的高效语言模型族 OpenELM。要说 ChatGPT 拉开了大模型竞赛的序幕,那么 Meta 开源 Llama 系...
阅读原文

超越GPT-4,斯坦福团队手机可跑的大模型火了,一夜下载量超2k

机器之心报道 机器之心编辑部在大模型落地应用的过程中,端侧 AI 是非常重要的一个方向。 近日,斯坦福大学研究人员推出的 Octopus v2 火了,受到了开发者社...
阅读原文

如何从头开始编写LoRA代码,这有一份教程

选自 lightning.ai 作者:Sebastian Raschka 机器之心编译 编辑:陈萍作者表示:在各种有效的 LLM 微调方法中,LoRA 仍然是他的首选。LoRA(Low-Rank Adaptat...
阅读原文

何恺明刘壮新作:消除数据集偏差的十年之战

编辑部 发自 凹非寺量子位 | 公众号 QbitAIMIT新晋副教授何恺明,新作新鲜出炉: 瞄准一个横亘在AI发展之路上十年之久的问题:数据集偏差。 该研究为何恺明在...
阅读原文

年轻人的第一个多模态大模型:1080Ti轻松运行,已开源在线可玩

Vary-toy团队 投稿量子位 | 公众号 QbitAI一款名为Vary-toy的“年轻人的第一个多模态大模型”来了! 模型大小不到2B,消费级显卡可训练,GTX1080ti 8G的老显卡...
阅读原文

历时8年终发Science,他证明老鼠有类人的想象力

来源:量子位关于大模型注意力机制,Meta又有了一项新研究。通过调整模型注意力,屏蔽无关信息的干扰,新的机制让大模型准确率进一步提升。而且这种机制不需...
阅读原文

更像人脑的新型注意力机制,Meta让大模型自动屏蔽任务无关信息,准确率提高27%

克雷西 发自 凹非寺量子位 | 公众号 QbitAI关于大模型注意力机制,Meta又有了一项新研究。通过调整模型注意力,屏蔽无关信息的干扰,新的机制让大模型准确率...
阅读原文

DeepMind:谁说卷积网络不如ViT?

机器之心报道编辑:陈萍、小舟本文通过评估按比例扩大的 NFNets,挑战了 ConvNets 在大规模上表现不如 ViTs 的观点。深度学习的早期成功可归功于卷积神经网络...
阅读原文
123