标签:知乎

大模型微调到底有没有技术含量?

大模型时代最火AI芯片峰会来啦!!9月6-7日,由芯东西联合主办的2024全球AI芯片峰会将在北京举行。峰会设有数据中心AI芯片、智算集群等7大板块。目前,AMD人...
阅读原文

ResNet作者张祥雨,投身AI大模型

衡宇 西风 发自 凹非寺量子位 | 公众号 QbitAI大模型的人才黑洞效应,还在持续。 量子位获悉,最新出现在大模型大牛转会名单上的重磅大牛,是90后AI大牛张祥...
阅读原文

太原理工2024软件工程招60个班,近2000人,冲上热搜

机器之心报道 机器之心编辑部这一届软件工程专业的学生占了 1/4,同班同学都是老乡。都知道计算机专业火热,没想到竟然这么火。 刚刚,「2024 太原理工大学(...
阅读原文

全网独一份!AI大模型学习训练资源…(限时免费领)

如果你问:2024年,程序员必须掌握哪项技术?AI一定是榜首! 从去年起,AI大模型已是程序员的必备工具——‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍ 编程提效:编写更快,程序更稳定; ...
阅读原文

可解释性终极追问,什么才是第一性解释?20篇CCF-A+ICLR论文给你答案

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

零一万物黄文灏:大模型训练方及Yi-Large的实践

9月6-7日,2024全球AI芯片峰会将在北京召开。目前,AMD人工智能事业部高级总监王宏强,清华大学交叉信息研究院助理教授、北极雄芯创始人马恺声,珠海芯动力创...
阅读原文

张俊林:大语言模型无法对数字进行准确运算的主要原因

直播预告 | 7月23日14点,「智猩猩在线研讨会 NVIDIA AI for Science 专场」将开讲,两位专家将分别以《AI 驱动下的新能源材料研究与发现》、《NVIDIA Modulu...
阅读原文

大模型Infra这些年,从黑铁时代到黄金时代再到白银时代

7月16日19点,「智猩猩AI新青年讲座」第244讲将开讲。上海交通大学和宁波东方理工大学联合培养博士生徐良将主要讲解通用的3D人体动作生成框架ActFormer和人体...
阅读原文

数据匮乏仍是通用具身智能面前的高墙吗?

机器之心PRO · 会员通讯 Week 28---- 本周为您解读 ③个值得细品的AI & Robotics业内要事 ---- 1. 数据匮乏问题仍是通用具身智能面前的高墙吗? 具身智能...
阅读原文

kimi chat大模型的200万长度无损上下文可能是如何做到的?

7月11日19点,「智猩猩自动驾驶新青年讲座」第36讲将开讲,主讲理想汽车最新成果:基于MLLM的闭环规划智能体PlanAgent,由理想汽车实习研究员、中国科学院自...
阅读原文

从零训练的 1B 以下小模型汇总

导读本文来自知乎,作者为Angry Bugs。出于学术/技术分享进行转载,如有侵权,联系删文。 本文是作者自己从头训练一个1B以下的模型的相关技巧和资源的汇总。 ...
阅读原文

清华北航博士生「」Gemma-2说中文!弱智吧、角色扮演、数学问题表现惊喜

新智元报道编辑:编辑部 【新智元导读】谷歌的Gemma 2刚刚发布,清华和北航的两名博士生就已经成功推出了指令微调版本,显著增强了Gemma 2 9B/27B模型的中文...
阅读原文

Kimi论文自曝推理架构,80%流量都靠它承担

克雷西 发自 凹非寺量子位 | 公众号 QbitAI月之暗面和清华KVCache.ai团队的最新论文,首次揭秘了Kimi背后的推理架构! 要知道Kimi是国产大模型的当红炸子鸡,...
阅读原文

AI 搜索热潮背后:注定要逾越场景的门槛

诸多 AI 搜索产品的出现似乎意味着,创业做一个搜索产品的速度快了很多。但 AI 是否真的让搜索引擎的入场门槛变低?其真正的护城河又是什么?作者丨王悦 编辑...
阅读原文

鹅厂造10亿虚拟人格专搞数据合成:让7B模型数学成绩打平GPT4,还能给弱智吧出题

克雷西 发自 凹非寺量子位 | 公众号 QbitAI10亿名“员工”生产数据合成,数量占到了世界人口的13%。 不过这些“员工”并不是真人,而是腾讯利用网络数据制造出的...
阅读原文
13456719