标签:报告

从LLM中完全消除矩阵乘法,效果出奇得好,10亿参数跑在FPGA上接近大脑功耗

机器之心报道 机器之心编辑部让语言模型「轻装上阵」。一直以来,矩阵乘法(MatMul)稳居神经网络操作的主导地位,其中很大原因归结为 GPU 专门针对 MatMul ...
阅读原文

GPT-4人类高达99.16%惊人率!PNAS重磅研究曝出,LLM推理越强值越高

新智元报道编辑:桃子 乔杨 【新智元导读】最近,德国研究科学家发表的PANS论文揭示了一个令人担忧的现象:LLM已经涌现出「欺骗能力」,它们可以理解并诱导欺...
阅读原文

FineWeb技术报告出炉!揭秘HuggingFace规模最大、质量最高预训练数据集

新智元报道编辑:Mindy 【新智元导读】从大规模网络爬取、精细过滤到去重技术,通过FineWeb的技术报告探索如何打造高质量数据集,为大型语言模型(LLM)预训...
阅读原文

2024过半,AI卷到哪儿了?

大数据文摘受权转载自定焦(dingjiaoone) 作者 | 黎明 编辑 | 魏佳AI创业者陈冉,发现行业里有一些“怪现象”。 很多客户向他反馈,自己很困惑。一方面,大模...
阅读原文

腾讯回应可付费实习;支付宝发布AI 工具测脱发,最严重获称“人间蒲公英”;京东员工战618:凌晨3点下班、配行军床 |AI 周报

整理 | 褚杏娟、傅宇琪黄仁勋台北宴请行业大佬:总身价 1.5 万亿,人均消费不到 100 元;“脱发星人”福音?支付宝推出 AI 毛发自测黑科技;618 京东拉满战斗状...
阅读原文

发布即被山寨?字节跳动推出语音生成模型数小时后就被“盗版”,作者直呼离谱!

作者 | 褚杏娟 近日,被称为 GPT-4o 平替的 ChatTTS 文本转语音开源项目爆火。没多久,字节跳动也推出了自己的语音生成模型 Seed-TTS,能生成与人类语音几乎...
阅读原文

PRL速递:生命系统中对称性破缺的热力学限制

导语最近发表于 PRL 的一项研究开发了一种新的理论框架,用于研究非平衡条件下生物化学系统中的对称性破缺。这项研究的一个重要发现是,无论生物化学反应网络...
阅读原文

《细胞》:抗生素告急,AI显身手!新研究一举发现近百万个候选抗生素

来源:学术经纬 编辑:药明康德内容团队 自科学家发现青霉素以来,抗生素已经成为现代医学的基石之一,显著降低了细菌感染导致的死亡率。然而随着抗生素的滥...
阅读原文

Ai Pin 又翻车,充电盒有起火风险,官方还摆烂?

提了问题 没有方案正式向消费者推出后,初创公司 Humane 的设备 Ai Pin 收获了媒体和用户几乎一边倒的恶评,今天 Humane 公司向用户发了一封邮件,不过又是一...
阅读原文

苹果公布 2024 设计大奖/小米回应停车场相关事故,称正积极配合警方进行查验/百度以商业诋毁纠纷为由抖音

🔍 百度以商业诋毁纠纷为由起诉抖音 🧠 通义千问发布开源模型 Qwen2 🚗 小米回应停车场相关事故 🔒 iOS 18 控制中心将迎来改动 🚙 特斯拉辟谣与比亚迪子公司达成储...
阅读原文

阿里云发布最强开源大模型Qwen2,干翻Llama 3,比闭源模型还强

最强开源大模型一夜易主!阿里云Qwen2问鼎十几项全球权威榜单。 作者|三北 编辑|漠影 开源界最强大语言模型,Qwen2,来了! 智东西6月7日报道,今日,阿里云...
阅读原文

吵翻了:科学家能否就意识是如何产生的达成一致?|《自然》长文

本篇《自然》长文共4306字,干货满满,预计阅读时间13分钟,时间不够建议可以先“浮窗”或者收藏哦。原文作者:Mariana Lenharo关于大脑如何产生意识体验的理论...
阅读原文

纽约大学研究表明:大模型并没有利用思维链的推理能力,它只是加了计算!

思维链技术,可能要被推翻了!来自纽约大学的最新研究表明:大模型并没有利用思维链的推理能力,它只是偷偷加了计算!来源:悦智网 红极一时的思维链技术,可...
阅读原文

大语言模型何时需要检索?UCLA提出全新自监督选择性检索策略

来源:PaperWeekly 作者:吴迪 单位:UCLA 研究方向:自然语言处理前言最近一年开始做知识增强语言模型的方向。暑假去到了 AWS AI 的 CodeWhisperer 组实习,...
阅读原文

产业级AI原生应用的「超级外挂」,应用已在200+行业场景落地

衡宇 白交 发自 凹非寺量子位 | 公众号 QbitAI今年AI领域的热门词汇,非”AI原生应用”莫属。 而现在,这个浪潮之巅的方向,又一件神兵利器有了成绩单证明——百...
阅读原文
16566676869197