标签:模型

今日arXiv最热大模型论文:忘记"也是一门学问:机器如何忘记自己学到的知识?

夕小瑶科技说 原创作者 | Richard在信息时代,我们常常希望人工智能能够学到更多的知识,变得更加智能。但你是否想过,有时候让机器'忘记'一些它学到的东西,...
阅读原文

一篇让你了解人工智能四巨头的学术成就

GPT4V里面有一个非常有意思的实验,上面标明了“人工智能四巨头”。除了NG之外,Yoshua Bengio、Geoffrey Hinton和Yann LeCun都是 2018 年 ACM AM 图灵奖,Beng...
阅读原文

AI黑盒研究的突破性进展:Anthropic详解大模型的「思维」特征

一直以来 AI 都是一个黑盒子(black box),其内部运作机制是不可见的。人们输入数据并得到结果,但无法检查输出结果的逻辑或者系统的代码。 而就在刚刚,Ant...
阅读原文

AI独角兽集体求卖身,新一轮洗牌期开始了

明敏 克雷西 发自 凹非寺量子位 | 公众号 QbitAI大模型公司洗牌期开始了。 突然之间,几家明星初创纷纷传出消息,寻求收购。都是大家熟悉的名字、过往战绩也...
阅读原文

大模型“国家队”发力了 ,中国移动发布“万百千”

明敏 发自 凹非寺量子位 | 公众号 QbitAI国产大模型最新进展,这次来自“国家队”! 刚刚,全栈国产化生态大模型“九天智能基座”正式发布! 它由中国移动自研。...
阅读原文

只需单卡RTX 3090,低比特量化训练就能实现LLaMA-3 8B全参微调

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

用基础模型指导特征传播,首个泛化型图像匹配器OmniGlue搞定未见过域

机器之心报道 编辑:杜伟第一个以「泛化」能力为核心设计原则的可学习图像匹配器来了!对于想要获取两张图像之间的细粒度视觉对应关系而言,局部图像特征匹配...
阅读原文

裁员、人去楼空,这家估值 80 亿的 AI 编程工具独角兽不行了?

作者 | Tina,李冬梅 近日,据外媒报道, AI 编码工具初创公司 Replit 宣布将解雇 30 名员工,占其员工总数的近 20%。 Replit 首席执行官 Amjad Masad 在发...
阅读原文

如何落地AI编程和可观测智能化?怎么从 0 到 1 训练大模型?阿里多位专家出席 ArchSummit 现身说法

麦肯锡的一项研究结果表明,在生成式 AI 的辅助下,可维护性代码文档可以在一半的时间内完成,新代码生成效率提升近一倍,而代码重构类任务的完成时间也节省...
阅读原文

AICon 北京站圆满闭幕,哪些专题和议题最火爆?优秀出品人&明星讲师花落谁家?

5 月 17 日 -18 日,AICon 全球人工智能开发与应用大会 暨 大模型应用生态展·2024,圆满落幕,会议话题涵盖 AI Agent、RAG、行业应用、大模型国际化挑战与机...
阅读原文

基础架构竞争激烈,LSTM原作者提出指数门控xLSTM,性能直逼Transformer和Mamba

大数据文摘授权转载自将门创投 作者:seven_ 经典长短时记忆网络(LSTM)架构最早可以追溯到20世纪90年代,因其独特的常量误差传递(constant error carousel...
阅读原文

实测零一万物“万知”:手机2分钟生成PPT,秒读数十万字文档,但财报解读不太准

直播预告 | 5月28日10点,「智猩猩AI新青年讲座」第236讲正式开讲,密歇根大学安娜堡分校在读博士生张挥杰将直播讲解《利用多级框架和多解码器架构提高扩散模...
阅读原文

VAST宋亚宸:3D生成迈入秒级时代,今年将做到Midjourney V5/V6水平丨GenAICon 2024

3D创作门槛和成本太高,需要大众化3D内容平台。 2024中国生成式AI大会于4月18-19日在北京举行,在大会第二天的主会场AIGC应用专场上,VAST创始人兼CEO宋亚宸...
阅读原文

焱融科技张文涛:将大模型训练效率提升40%!详解多云架构下高效存储策略丨GenAICon 2024

破题大模型算力荒,如何打造高性能存储底盘? 2024中国生成式AI大会于4月18-19日在北京举行,在大会第二天的主会场AI Infra专场上,焱融科技CTO张文涛以《多...
阅读原文

微软高通英特尔都力推的AI PC,为啥联想更先造好?

明敏 发自 凹非寺量子位 | 公众号 QbitAI为什么是时候换一台AI PC了? 何川想到的是20多年前的一次考试突击,要是当时有AI就好了。 因为记错了第二天的考试科...
阅读原文