标签:模型
李彦宏“程序员将不再存在”被周鸿祎驳斥,网友怒怼:先把百度程序员都开除了!
整理 | 凌敏、核子可乐网友热评:先把百度的程序员都开除了吧。 李彦宏:未来将不再存在“程序员” 这一职业 在 3 月 9 日央视的《对话》·开年说节目上,百度创...
“新王”!Claude 3 横空出世,最强大模型易主 | 大模型一周大事
大模型的快节奏发展,让了解最新技术动态、积极主动学习成为每一位从业者的必修课。InfoQ 研究中心期望通过每周更新大模型行业最新动态,为广大读者提供全面...
奥特曼老黄齐预测:AGI五年内降临,代替95%工作!但马斯克断言AGI将被电力卡脖子
新智元报道编辑:编辑部 【新智元导读】突然间,AGI已经成为了一个新的「5年内实现」的未来技术。从Altman到老黄,都在不同场合表示,达到人类智能水平的AI将...
华人CV宗师黄煦涛高徒离职特斯拉,加入OpenAI!专攻多模态模型研究
新智元报道编辑:桃子 好困 【新智元导读】华人科学家程博文官宣即将入职OpenAI,加入后训练团队参与多模态模型研究。值得一提的是,他还是著名华人计算机泰...
「图结构学习」新思路!港大等提出GraphEdit模型:用LLM删除噪声边,全局理解节点间依赖关系
新智元报道编辑:LRS 【新智元导读】GraphEdit方法可以有效地去除图网络中的噪声连接,还能从全局视角识别节点间的依赖关系,在不同的实验设置中都被验证为有...
清华NLP组发布InfLLM:无需额外训练,「1024K超长上下文」100%召回!
新智元报道编辑:LRS 【新智元导读】挖掘大模型固有的长文本理解能力,InfLLM在没有引入额外训练的情况下,利用一个外部记忆模块存储超长上下文信息,实现了...
从第一人称视角理解世界,多模态模型离我们还有多远?| CVPR 2024
大数据文摘受权转载自将门创投 目前很多评测工作探究视觉语言大模型在不同维度上的能力,但都忽视了真实世界中非常重要的一点:未来作为智能体或机器人的大脑...
前端不存在了?盲测64%的人更喜欢GPT-4V的设计,杨笛一等团队新作
机器之心报道 编辑:Panda前端工程师是不是开始慌了?3 月 9 日央视的一档节目上,百度创始人、董事长兼 CEO 李彦宏指出,以后不会存在「程序员」这种职业了...
DenseMamba:大模型的DenseNet时刻,Mamba和RetNet精度显著提升
机器之心专栏 机器之心编辑部近期,来自华为诺亚方舟实验室的研究者提出了 DenseSSM,用于增强 SSM 中各层间隐藏信息的流动。通过将浅层隐藏状态有选择地整合...
当prompt策略遇上分治算法,南加大、微软让大模型炼成「火眼金睛」
机器之心专栏 机器之心编辑部近年来,大语言模型(LLMs)由于其通用的问题处理能力而引起了大量的关注。现有研究表明,适当的提示设计(prompt enginerring)...
甲对话李志飞:理解Sora,复现Sora|甲子光年
我们越来越接近大一统,接近智能的本质。作者|甲小姐刘杨楠 经过1个月的发酵,国内AI从业者们对Sora的态度正发生着微妙的转变,从最初的震撼,到被未知裹挟...
哲学家万字解析Sora本质,杨立昆点赞转发,AI视频离世界模拟器还有多远?
Sora是世界模拟器吗?万字长文深度解读,杨立昆点赞。 编译|香草 编辑|李水青 智东西3月8日报道,近日,深度学习三巨头之一、Meta首席科学家杨立昆点赞分享了...
7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题
微软靠“想象力”解决大语言模型调用工具两大难题!方法已开源。 作者|徐珊 编辑|云鹏 智东西3月10日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出...
今日Arxiv最热NLP大模型论文:美团发布VisionLLaMA,为视觉生成和理解提供新基线
夕小瑶科技说 原创作者 | 芒果引言:探索统一的视觉与语言模型架构在人工智能领域,统一的模型架构对于简化模型设计、提高模型效率以及促进跨领域应用具有重...
前谷歌科学家离职创业1年,自述训练LLM卡在算力上!买卡就像中彩票,Karpathy转赞
新智元报道编辑:桃子 【新智元导读】一家大模型初创公司从创立到训练出大模型,要克服怎样的难题?前谷歌科学家离职后创业一年,发文自述算力是训练大模型的...