标签:模型
十年内出现AGI?下一代Gemini能感知环境?DeepMind CEO哈萨比斯畅谈AI
机器之心报道 编辑:Panda智能本质、对齐、Gemini、超人类AI和多模态、AGI……在这场干货满满的访谈中,Demis Hassabis可谓「知无不言、言无不尽」。「如果我们...
RNN效率媲美Transformer,谷歌新架构两:同等规模强于Mamba
机器之心报道 机器之心编辑部去年 12 月,新架构 Mamba 引爆了 AI 圈,向屹立不倒的 Transformer 发起了挑战。如今,谷歌 DeepMind「Hawk 」和「Griffin 」的...
清华、哈工大把大模型压缩到了1bit,把大模型放在手机里跑的愿望就快要实现了!
机器之心专栏 机器之心编辑部近期,清华大学和哈尔滨工业大学联合发布了一篇论文:把大模型压缩到 1.0073 个比特时,仍然能使其保持约 83% 的性能!自从大模...
逼迫大模型消除幻觉,就像杨永信电击治疗网瘾少年
夕小瑶科技说 原创作者 | 智商掉了一地在科技高速发展的领域,进步往往伴随着争议。数字化时代,我们被海量信息所环绕,利用大模型来提取信息和生成答案,有...
今日arXiv最热大模型论文:谷歌最新研究,将LLM用于回归分析任务,显著超越传统模型
夕小瑶科技说 原创编辑 | 松果 引言:探索语言模型在回归分析中的应用回归分析是一个强大的工具,能够准确预测系统或模型的结果指标,给定一组参数。然而,传...
月之暗面杨植麟专访:AI不是接下来一两年找到PMF,而是接下来十到二十年如何改变世界
就在一年以前,AI 科学家杨植麟在硅谷做了一笔精确的计算。他意识到,如果决定启动一场以 AGI 为目标的大模型创业,要在未来几个月立马筹措超 1 亿美金资本。...
AI Native 的生产力工具,商汤打算怎么做?
2014 年就成立的 AI 科技公司——商汤科技,在大模型之外,带来了他们对于大模型生产力工具产品的新思考。 「小浣熊家族」是基于商汤大语言模型打造的系列智能...
解剖Sora:37页论文逆向工程推测技术细节,微软参与,华人团队出品
西风 发自 凹非寺量子位 | 公众号 QbitAISora刚发布不久,就被逆向工程“解剖”了?! 来自理海大学、微软研究院的华人团队发布了首个Sora相关研究综述,足足有...
实测英伟达AI游戏引擎:与NPC实时,中文流畅爆了
克雷西 发自 国际庄量子位 | 公众号 QbitAI黄院士在《赛博朋克2077》里搞的智能NPC,已经飙起中文了? 量子位的一手体验,亲眼见证了NPC们流利地用中英双语对...
Sora发布两周后,关于Sora的一些冷思考
大数据文摘授权转载自AI科技评论 作者:王悦 编辑:陈彩娴 两周前的今天,北京时间 2 月 16 日,OpenAI 、谷歌、Meta、Stability 都在这一时间节点前后发布文...
今日Arxiv最热NLP大模型论文:Llama-2上下文扩大48倍的方法来了,港大发布,无需训练
夕小瑶科技说 原创作者 | 芒果 引言:大语言模型的长上下文理解能力在当今的人工智能领域,大语言模型(Large Language Models,简称LLMs)的长上下文理解能...
香港大学发布思维扩散DoT,让思维在时间上扩散,提效保质!
夕小瑶科技说 原创编辑 | Tscom 引言:探索结合扩散模型与思维链来提升大模型推理能力在人工智能领域,大语言模型(LLMs)已经引起了广泛的关注,它们在自然...
ControlNet作者又出新作:百万数据训练,AI图像生成迎来图层设计
机器之心报道 编辑:陈萍、杜伟有人表示:「等待已久的 AI 图像创建功能终于迎来了图层!」尽管用于生成图像的大模型已经成为计算机视觉和图形学的基础,但令...
模型偏好只与大小有关?上交大全面解析人类与32种大模型偏好的定量组分
机器之心专栏 机器之心编辑部在目前的模型训练范式中,偏好数据的的获取与使用已经成为了不可或缺的一环。在训练中,偏好数据通常被用作对齐(alignment)时...
试了下 Stable Video,我的建议是不如不用|AI 测评室
作者 | 褚杏娟 去年 11 月,人工智能初创公司 Stability AI 首次推出了 Stable Video,这款模型基于之前发布的 Stable Diffusion 文本转图片模型进行延伸,能...