标签:数据
硅谷深思:GPT应用迟未爆发,大模型泡沫根源初探丨华映资本全球化观察
大模型行业泡沫正在显现。 2022年诞生的ChatGPT,已经在相当程度上实现了大模型的Scaling law(尺度定律)和通用能力涌现。ChatGPT自身作为一个终端产品的商...
开源两周4.7k标星,港大LightRAG大幅降低大模型问答成本,全面理解复杂实体依赖关系
港大黄超团队 投稿量子位 | 公众号 QbitAI简单高效的大模型检索增强系统LightRAG,香港大学黄超团队最新研究成果。 开源两周时间在GitHub上获得将近5k标星,...
132年未解开的李雅普诺夫函数谜题,被Symbolic Transformer攻克了
机器之心报道 编辑:蛋酱、佳琪牛顿没解决的问题,AI给你解决了? AI的推理能力一直是研究的焦点。作为最纯粹、要求最高的推理形式之一,能否解决高级的数学...
大模型在装傻!谷歌苹果最新发现:LLM知道但不告诉你,掌握知识比表现出来的多
新智元报道编辑:alan 【新智元导读】近日,来自谷歌和苹果的研究表明:AI模型掌握的知识比表现出来的要多得多!这些真实性信息集中在特定的token中,利用这...
聊了一百位硅谷大模型从业者后,我们对 AGI 投资产生了新的思考
大模型尚在“前浏览器或前IOS时代”。大模型行业泡沫正在显现。 据2024年7月的非公开数据,OpenAI的ARR(年经常性收入)已经达到了相当可观的41亿美元。 但这些...
大模型二次开发技术选型思路
导读作者为StormBlafe 原文来自知乎,地址:https://zhuanlan.zhihu.com/p/708059967 本文只做学术/技术分享,如有侵权,联系删文。01开发方法分类1、领域知...
率先突破大规模多类数据损坏问题!中科大离线强化学习新方式入选NeurIPS 2024
中科大杨睿 投稿量子位 | 公众号 QbitAI机器人控制和自动驾驶的离线数据损坏问题有解了! 中科大王杰教授团队 (MIRA Lab) 提出了一种变分贝叶斯推断方法,有...
Archetype AI公司发布“牛顿”物理学大模型,能从传感器数据中学习物理原理
来源:DeepTech深科技 运营/排版:何晨龙 在科技不断进步的今天,AI 正在以惊人的速度拓展其能力边界,甚至今年的诺贝尔物理学和化学奖都颁给了与 AI 有关的...
对统计学“又爱又怕”,到底如何学统计?
不少学生抱怨统计学太难学,也有人提到,学生期间学了很多年统计,但是一遇到实际问题,始终无法入手,不知道该怎么分析。很多人曾问我:到底应该怎么学统计...
DenseNet共一作者刘壮官宣新去向,将任普林斯顿大学助理教授
机器之心报道 机器之心编辑部「还离这世界上最棒的地儿不远。」最新消息,DenseNet 作者之一刘壮将于 2025 年 9 月加盟普林斯顿大学,担任计算机科学系助理教...
全模态对齐框架align-anything来了:实现跨模态指令跟随
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
52万张GPU集群塞进一个「盒子」?AI神器破解百模争霸困局!
新智元报道编辑:编辑部 HYZ 【新智元导读】「算力」堪称是AI时代最大的痛。在国外,OpenAI因为微软造GPU集群的速度太慢而算力告急。在国内,企业则面临着「...
英伟达开源新王登基!70B刷爆SOTA,击败GPT-4o只服OpenAI o1
新智元报道编辑:编辑部 HYZ 【新智元导读】就在刚刚,英伟达开源了超强模型Nemotron-70B,后者一经发布就超越了GPT-4o和Claude 3.5 Sonnet,仅次于OpenAI o1...
国产大模型首次超过 GPT-4o!零一万物「闪电」只用 2000 张 GPU 追平马斯克 Grok
每百万 token 仅需 0.99 元,直逼行业最低价。该不该从零开始预训练一个千亿级大模型? 这个问题从 2023 年 ChatGPT 破圈之后就一直成为行业人士的 Top 讨论...
重新定义自监督学习!LeCun团队让MMCR再进一步
新智元报道编辑:alan 【新智元导读】近日,来自斯坦福、MIT、纽约大学和Meta-FAIR等机构的研究人员,通过新的研究重新定义了最大流形容量表示法(MMCR)的可...