标签:函数

MLP 的时代结束了?全新神经网络架构 KAN 横空出世,MIT华人一作!

文章转载自公众号:AI科技大本营,本文只做学术/技术分享,如有侵权,联系删文。 多层感知器(MLP, Multilayer Perceptron)作为人工神经网络的一个基本架构...
阅读原文

数学遇上人工智能,深度学习架构迎来最强挑战者 KAN,MLP 的时代结束了

来源:《新程序员》编辑部 文:王启隆 多层感知器(MLP, Multilayer Perceptron)作为人工神经网络的一个基本架构,一直在历史上扮演着至关重要的角色。MLP ...
阅读原文

KAN: Kolmogorov–Arnold Networks论文全译

来源:CreateAMind KAN: Kolmogorov–Arnold Networkshttps://arxiv.org/pdf/2404.197566 讨论 Application aspects:We have presented some preliminary evid...
阅读原文

Transformer要变Kansformer?用了几十年的MLP迎来挑战者KAN

机器之心报道 机器之心编辑部MLP(多层感知器)用了几十年了,真的没有别的选择了吗?多层感知器(MLP),也被称为全连接前馈神经网络,是当今深度学习模型的...
阅读原文

MLP一夜被干掉!MIT加州理工等革命性KAN破记录,发现数学定理碾压DeepMind

新智元报道编辑:桃子 LRS 【新智元导读】无需怀念MLP,新网络KAN基于柯尔莫哥洛夫-阿诺德定理,带着更少的参数、更强的性能、更好的可解释性来了,深度学习...
阅读原文

全新神经网络架构KAN一夜爆火!200参数顶30万,MIT华人一作,轻松复现Nature封面AI数学研究

白交 衡宇 发自 凹非寺量子位 | 公众号 QbitAI一种全新的神经网络架构KAN,诞生了! 与传统的MLP架构截然不同,且能用更少的参数在数学、物理问题上取得更高...
阅读原文

这就是OpenAI神秘的Q*?斯坦福:语言模型就是Q函数

机器之心报道 编辑:Panda‍‍还记得去年 11 月底爆出来的 Q* 项目吗?这是传说中 OpenAI 正在秘密开展、或将带来颠覆性变革的 AI 项目。如果你想回忆一下,可...
阅读原文

「大模型+强化学习」最新综述!港中文深圳130余篇论文:详解四条主流技术路线

新智元报道编辑:LRS 【新智元导读】用大模型来辅助强化学习,可以提高模型在多任务学习、样本利用率、任务规划等复杂任务下的能力,该论文综述了LLM-enhance...
阅读原文

超越GPT-4,斯坦福团队手机可跑的大模型火了,一夜下载量超2k

机器之心报道 机器之心编辑部在大模型落地应用的过程中,端侧 AI 是非常重要的一个方向。 近日,斯坦福大学研究人员推出的 Octopus v2 火了,受到了开发者社...
阅读原文

“幻觉”问题根本无解!为什么我们的大模型会“说胡话”?

来源:CSDN 整理:王启隆 “幻觉”(Hallucination),现在已经是大语言模型领域无人不知、无人不晓的热词。我们在和 ChatGPT 等聊天机器人对话的时候,有时会...
阅读原文

今日arXiv最热大模型论文:北京大学发布,将试错引入大模型代理学习!

夕小瑶科技说 原创编辑 | 松果引言:探索语言智能的新边界在人工智能的发展历程中,语言智能始终是一个核心的研究领域。随着大语言模型(LLM)的兴起,我们对...
阅读原文

手撕CNN:综述论文详解卷积网络的数学本质

近日南洋理工大学研究者发布了一篇描述卷积网络数学原理的论文,该论文从数学的角度阐述整个卷积网络的运算与传播过程。该论文对理解卷积网络的数学本质非常...
阅读原文

大语言模型为什么始终会产生幻觉?

夕小瑶科技说 原创编辑 | 谢年年随着LLMs的广泛应用,幻觉问题引起了越来越多的安全和道德关注,各种各样的幻觉缓解方法也层出不穷,比如各类知识增强方法、...
阅读原文

今日arXiv最热NLP大模型论文:大语言模型为什么始终会产生幻觉

夕小瑶科技说 原创作者 | 谢年年、python随着LLMs的广泛应用,幻觉问题引起了越来越多的安全和道德关注,各种各样的幻觉缓解方法也层出不穷,比如各类知识增...
阅读原文

三篇论文解决「语义分割的优化和评估」难题!鲁汶/清华/牛津等联合提出全新方法

新智元报道编辑:LRS 【新智元导读】现有的语义分割技术在评估指标、损失函数等设计上都存在缺陷,研究人员针对相关缺陷设计了全新的损失函数、评估指标和基...
阅读原文
134567