标签:模型

Meta开发System 2蒸馏技术,Llama 2对话模型任务准确率接近100%

机器之心报道 编辑:杜伟研究者表示,如果 Sytem 2 蒸馏可以成为未来持续学习 AI 系统的重要特征,则可以进一步提升 System 2 表现不那么好的推理任务的性能...
阅读原文

7B最强长视频模型! LongVA视频理解超千帧,霸榜多个榜单

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

6700万参数比肩万亿巨兽GPT-4!微软MIT等联手Transformer推理密码

新智元报道编辑:桃子 乔杨 【新智元导读】来自微软、MIT等机构的学者提出了一种创新的训练范式,攻破了大模型的推理缺陷。他们通过因果模型构建数据集,直接...
阅读原文

AI大模型有望再扩1000倍!剑桥耶鲁康奈尔:PNN是变革关键

新智元报道编辑:编辑部 【新智元导读】最近,多个机构学者合著的一篇研究为AI的规模化指了一条新路:物理神经网络(PNN),这一新兴的前沿领域还鲜少有人涉...
阅读原文

明年,每个人都能零基础创作3D内容 | 对话VAST宋亚宸

视点 发自 凹非寺量子位|公众号 QbitAI大家对生成视觉领域有着这样的认知:先有图像生成、视频生成,再有3D生成。 图像生成的DALL·E、Midjourney,视频生成...
阅读原文

突发 | OpenAI 绝密项目「草莓」首次曝光,能做目前 AI 无法解决的事, 内部人士曾警告:可能威胁全人类

7月16日19点,「智猩猩AI新青年讲座」第244讲将开讲。上海交通大学和宁波东方理工大学联合培养博士生徐良将主要讲解通用的3D人体动作生成框架ActFormer和人体...
阅读原文

OpenAI 绝密项目「草莓」曝光,能做目前 AI 无法解决的事, 内部人士曾警告:可能威胁全人类

就在刚刚,OpenAI 去年大热的神秘项目「Q*」再次有了新动态。 据外媒路透社报道,OpenAI 内部正在一个代号为「草莓(Strawberry)」的项目中开发一种新的人工...
阅读原文

首个专为半导体行业设计的开源大模型 SemiKong 问世

作者 | 赵明华 7 月 10 日,国外初创公司 Aitomatic 宣布推出 SemiKong。这是世界上第一个专为半导体行业设计的开源 AI 大型语言模型(LLM)。它旨在通过将特...
阅读原文

清华汪玉教授团队支招:如何把“大”模型部署到“小”设备上 | Q福利

2024 年,由 AI 驱动的 GPT-4o 等应用产品爆红。这些热门产品的广阔应用前景令人振奋,吸引了大量资源投入 AI 的算法研究、数据清洗、算力等方面的基础建设中...
阅读原文

OpenAI神秘項目「草莓」曝光!自我进化已超越人类智能?马斯克嘲讽:回形针灾难

夕小瑶科技说 原创作者 | 付奶茶根据路透社的最新报道,OpenAI正在秘密开发代号为“草莓(Strawberry)”的全新项目! 根据路透社在五月份获得的OpenAI内部文件...
阅读原文

斯坦福提出大模型最强架构TTT,超越Transformers

夕小瑶科技说 原创作者 | 谢年年在Transformer被提出以前,以LSTMs为代表的RNNs网络结构由于计算简单、擅长处理序列数据常被用作NLP领域的基础架构。但受其结...
阅读原文

剑桥大学:基于语音的大模型攻击,轻松“操纵”多模态大模型

夕小瑶科技说 原创作者 | Richard随着人工智能技术的快速发展,基于语音的大模型正在成为一个热门领域。这些模型不仅能实现语音识别,还可以执行翻译等多种任...
阅读原文

OpenAI秘密武器「草莓」计划曝光!Q*推理能力大爆发,逼近AGI L2里程碑

新智元报道编辑:Aeneas 好困 【新智元导读】OpenAI被曝出了新项目「草莓」,据悉能提前计划,自主浏览网页,还能进行深度研究。草莓由大量通用数据上后训练...
阅读原文

Mamba真比Transformer更优吗?Mamba原作者:两个都要!混合架构才是最优解

新智元报道编辑:乔杨 【新智元导读】Mamba模型由于匹敌Transformer的巨大潜力,在推出半年多的时间内引起了巨大关注。但在大规模预训练的场景下,这两个架构...
阅读原文

大厂掀起视频生成「军备竞赛」,AI 真能干掉好莱坞?

机器之心报道 机器之心编辑部AI 视频圈正杀得你死我活。 前脚快手高调发布可灵,后脚 Luma 不甘示弱,推出最新视频模型 Dream Machine,紧接着 Runway 横插一...
阅读原文