标签:模型
复旦邱锡鹏教授讲述MOSS 2 研发进展:如何实现世界模型?
演讲 | 邱锡鹏教授 整理 | 褚杏娟 去年 ChatGPT 爆火后,国内迅速迎来了“百模大战”。其中,复旦大学自然语言处理实验室在去年 2 月率先发布了国内首个类 Cha...
上帝视角下的蓝天白云?大模型改变气象预测格局 | 大模型一周大事
大模型的快节奏发展,让了解最新技术动态、积极主动学习成为每一位从业者的必修课。InfoQ 研究中心期望通过每周更新大模型行业最新动态,为广大读者提供全面...
港大北航等1bit大模型引热议,IEEE刊物评“解决AI能源需求”!作者亲自解读在此
BiLLM团队 发自 凹非寺量子位 | 公众号 QbitAI极限量化,把每个参数占用空间压缩到1.1bit! IEEE Spectrum专栏,一种名为BiLLM的训练后量化(PTQ)方法火了。...
5秒完成3D生成,真香合成数据集已开源,上交港中文新框架超越Instant3D
陈林 投稿自 凹非寺量子位 | 公众号 QbitAI使用大模型合成的数据,就能显著提升3D生成能力? 来自上海交大、香港中文大学等团队还真做到了。 他们推出Bootstr...
从LLM中完全消除矩阵乘法,效果出奇得好,10亿参数跑在FPGA上接近大脑功耗
机器之心报道 机器之心编辑部让语言模型「轻装上阵」。一直以来,矩阵乘法(MatMul)稳居神经网络操作的主导地位,其中很大原因归结为 GPU 专门针对 MatMul ...
大模型的高考数学成绩单:及格已经非常好了
机器之心发布 机器之心编辑部让考生头皮发麻的高考数学,可难倒了顶尖 AI 大模型。 一年一度的高考即将落幕,衷心希望各位考生都超常发挥,考出满意的好成绩...
SSM 能取代 Transformer 搞出更「牛」的大模型吗?
机器之心PRO · 会员通讯 Week 23---- 本周为您解读 ③个值得细品的AI & Robotics业内要事 ---- 1. SSM 能取代 Transformer 搞出更「牛」的大模型吗? SSM ...
可信度超越GPT-4V,清华&面壁揭秘「小钢炮」模型背后的高效对齐技术
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
GPT-4人类高达99.16%惊人率!PNAS重磅研究曝出,LLM推理越强值越高
新智元报道编辑:桃子 乔杨 【新智元导读】最近,德国研究科学家发表的PANS论文揭示了一个令人担忧的现象:LLM已经涌现出「欺骗能力」,它们可以理解并诱导欺...
FineWeb技术报告出炉!揭秘HuggingFace规模最大、质量最高预训练数据集
新智元报道编辑:Mindy 【新智元导读】从大规模网络爬取、精细过滤到去重技术,通过FineWeb的技术报告探索如何打造高质量数据集,为大型语言模型(LLM)预训...
2024过半,AI卷到哪儿了?
大数据文摘受权转载自定焦(dingjiaoone) 作者 | 黎明 编辑 | 魏佳AI创业者陈冉,发现行业里有一些“怪现象”。 很多客户向他反馈,自己很困惑。一方面,大模...
腾讯回应可付费实习;支付宝发布AI 工具测脱发,最严重获称“人间蒲公英”;京东员工战618:凌晨3点下班、配行军床 |AI 周报
整理 | 褚杏娟、傅宇琪黄仁勋台北宴请行业大佬:总身价 1.5 万亿,人均消费不到 100 元;“脱发星人”福音?支付宝推出 AI 毛发自测黑科技;618 京东拉满战斗状...
面对质疑,奥特曼终于公开了OpenAI 前沿大模型安全架构
译者丨明知山 策划丨褚杏娟 在 OpenAI 和 Google DeepMind 员工联名发表公开信,呼吁重视人工智能技术带来严重风险的同一天,OpenAI 官博发布了一篇文章,公...
发布即被山寨?字节跳动推出语音生成模型数小时后就被“盗版”,作者直呼离谱!
作者 | 褚杏娟 近日,被称为 GPT-4o 平替的 ChatTTS 文本转语音开源项目爆火。没多久,字节跳动也推出了自己的语音生成模型 Seed-TTS,能生成与人类语音几乎...
大模型已经卷到头了,AI 赛道还有哪些新机会?| Q福利
5 月 28 日,OpenAI 表示,它已经开始训练一种新的 AI 模型,该模型将接替驱动 ChatGPT 的 GPT-4。直至今日,OpenAI 仍被公认为掌握了大模型核心秘密的公司,...