标签:数据

30%参数达到92%的表现,大模型稀疏化方法显神通

夕小瑶科技说 原创作者 | Axe_越当我还是一位懵懂少年的时候,总认为“任务难度”,“参数规模”和“准确率”是一个不可兼顾的三角,比如当我想要挑战更难的任务,...
阅读原文

AI投资高昂,中小银行如何策略性“以小搏大”?

嘉宾|林峰 杭州联合银行监事长 作者|高玉娴 杭州联合银行成立于 1954 年,前身是杭州市农村信用联社,2011 年由农村合作银行改制农商行,拥有近 70 年的发...
阅读原文

立即预约 Google I/O 2024 会议直播!百科详解一夜爆火的全新神经网络架构 KAN

📢 Google I/O 2024 Keynote 主题演讲将于 5 月 15 日(下周三)凌晨 1 点举行,届时 HyperAI超神经会在视频号和 B 站实时转播,立即预约不错过↓ ‍ 直播结束后...
阅读原文

Mixtral-8x7B MoE大模型微调实践,超越Llama2-65B

直播预告 | 5月14日晚7点,「智猩猩AI新青年讲座」第235讲正式开讲,慕尼黑工业大学视觉实验室陈振宇博士将直播讲解《三维室内场景纹理图生成》欢迎扫码报名~...
阅读原文

李飞飞:我并不认为大模型正在耗尽数据,拒谈新创业项目

来源:腾讯科技 丨划重点 ①李飞飞称她并不担心AI末日,反而对过度炒作AI可能导致人类灭绝感到担忧。 ②李飞飞呼吁人们将焦点转为更紧迫的问题,比如AI引发的虚...
阅读原文

数字大脑的未来,技术与计算交叉的愿景 | 追问观察

近年来,得益于方法学的重大进步和从分子到整个大脑多层次的数字数据集成及建模,脑科学研究无疑已迈入一个新时代。在这一背景下,神经科学与技术、计算的交...
阅读原文

2024年,自动驾驶会迎来质的改变吗?|甲子光年智库

一文读懂端到端自动驾驶。作者|翟惠宇 编辑|王博 89.2万人次,这是今年北京国际汽车展览会(以下简称“北京车展”)的观众人数,而上一届北京车展的观众人数...
阅读原文

RAG还是微调?万字长文总结大模型微调技能图谱

随着大模型的飞速发展,在短短一年间就有了大幅度的技术迭代更新,从LoRA、QLoRA、AdaLoRa、ZeroQuant、Flash Attention、KTO、PPO、DPO、蒸馏技术到模型增量...
阅读原文

超分辨率专题 | 3 种方法、4 个教程、10 个数据集,一文 Get 核心知识点

作者:十九 编辑:李宝珠,三羊 超分辨率能够克服或补偿由于图像采集系统、采集环境本身限制而导致的成像模糊、图像质量低下等问题,提升图像分辨率,为特征...
阅读原文

中电信AI大模型TeleChat-12B评测:使用3T tokens预训练,已开源!

直播预告 | 5月14日晚7点,「智猩猩、AI新青年讲座」第235讲正式开讲,慕尼黑工业大学视觉实验室陈振宇博士将直播讲解《三维室内场景纹理图生成》欢迎扫码报...
阅读原文

AI正面临一个难以突破的硬性天花板

近几个月来,围绕人工智能的炒作达到了疯狂的程度。据说,特斯拉将在一两年内完全实现自动驾驶,人工智能明年将比人类更聪明,到2040年,十亿台AI驱动的机器...
阅读原文

今日arXiv最热大模型论文:浙江大学:如何减轻视觉大模型中的幻觉问题

夕小瑶科技说 原创作者 | 谢年年大模型虽然能力强,但一直饱受“幻觉”问题的困扰,在视觉大模型(LVLMs)中更是如此,生成的文本包含与视觉输入不正确的对象、...
阅读原文

【图像分割数据集汇总】字节发布 COCONut 入选 CVPR 2024,立即体验 Segment Anything 分割万物!

随着计算机视觉技术的不断发展,图像分割在诸多领域展现出重要的应用价值。近年来,各种图像分割数据集如雨后春笋般涌现。上个月,字节跳动发布了首个大规模...
阅读原文

综述170篇「自监督学习」推荐算法,港大发布SSL4Rec:代码、资料库全面开源!

新智元报道编辑:LRT 【新智元导读】本文全面综述了自监督学习(SSL)在推荐系统中的应用,深入分析了逾170篇论文。文中提出了一个涵盖九大推荐场景的自监督...
阅读原文

港大开源图基础大模型OpenGraph: 强泛化能力,前向传播预测全新数据

OpenGraph 投稿向 凹非寺量子位 | 公众号 QbitAI图学习领域的数据饥荒问题,又有能缓解的新花活了! OpenGraph,一个基于图的基础模型,专门用于在多种图数据...
阅读原文
15657585960126