标签:能力

思维链提出者Jason Wei:关于大模型的6个直觉

选自 jasonwei.net/blog作者:Jason Wei机器之心编译编辑:Panda大模型究竟从下一个词预测任务中学到了什么呢?还记得 Jason Wei 吗?这位思维链的提出者还曾...
阅读原文

大模型免微调解锁对话能力,RLHF没必要了!一作上交大校友:节省大量成本和时间

梦晨 发自 凹非寺量子位 | 公众号 QbitAI要搞大模型AI助手,像ChatGPT一样对齐微调已经是行业标准做法,通常分为SFT+RLHF两步走。来自艾伦研究所的新研究却发...
阅读原文

秒杀700亿Llama 2!最新国产大模型亮相,无需申请即可免费商用,背后公司来自私募巨头

丰色 发自 凹非寺量子位 | 公众号QbitAI国产大模型刚刚出了一位全新选手:参数670亿的DeepSeek。它在近20个中英文的公开评测榜单上直接超越了同量级、700亿的...
阅读原文

云知声董事长梁家恩:AGI 赋能未来的力量|甲子引力

当问题可以被计算时,超越人类智能或许只是时间问题。11月30日-12月1日,由中国科技产业智库「甲子光年」主办的「致追风赶月的你」2023甲子引力年终盛典在北...
阅读原文

大模型版“5年高考3年模拟”来了!6141道数学题,还是多模态的那种|微软&UCLA&UW联合出品

Pan Lu投稿量子位 | 公众号 QbitAI大模型的“5年高考3年模拟”数学题来了,还是加强强强版!微软、加州大学洛杉矶分校(UCLA)、华盛顿大学(UW)联合打造全新...
阅读原文

112页报告深挖GPT-4V!UCLA等发布全新「多模态数学推理」基准MathVista

新智元报道编辑:LRS 好困【新智元导读】大型多模态模型会做数学题吗?在UCLA等机构最新发布的MathVista基准上,即使是当前最强的GPT-4V也会感到「挫败感」。...
阅读原文

【重磅】解码OpenAI Q*:迈向AGI的信仰之跃

作者|费斌杰随着OpenAI CEO的罢免闹剧逐渐平息,隐藏在整个事件背后的“Q*”模型浮出水面。据路透社消息,在Sam Altman罢免前夕,几位OpenAI的科学家向董事会写...
阅读原文

微软教小模型推理进阶版:Orca 2性能媲美10倍参数模型,已开源

机器之心报道机器之心编辑部站在巨人的肩膀上会让你看的更远,而通过让大规模语言模型来「教」较小规模的语言模型进行推理,也会是事半功倍的效果。如你我所...
阅读原文

国产720亿参数开源免费模型来了!对标Llama2 70B,一手实测在此

鱼羊 发自 凹非寺量子位 | 公众号 QbitAI最强开源大模型,再次易主!就在刚刚,阿里云通义千问又双叒开源了,并且直接开大:甩出了720亿参数版本——在中国的开...
阅读原文

720亿参数大模型都拿来开源了!通义千问开源全家桶,最小18亿模型端侧都能跑

机器之心原创作者:张倩、杜伟目前,通义千问开源全家桶已经有了 18 亿、70 亿、140 亿、720 亿参数量的 4 款基础开源模型,以及跨语言、图像、语音等多种模...
阅读原文

打通大模型训练任督二脉!国内首个千亿参数、全面开源大模型来了,还联手开发者共训

浪潮信息算法、数据、计算三大创新黑科技,大幅提升大模型智力水平。作者|程茜编辑|漠影智东西11月30日报道,11月27日,算力龙头企业浪潮信息发布了完全开源...
阅读原文

大模型深入智慧之地,手机厂商会如何交卷?

受访嘉宾 | 刘海锋OPPO 数智工程事业部总裁作者 | 罗燕珊1一条新路出现:跟风与乘势?大模型浪潮下的未见与先见在蓬勃发展的 AI 浪潮中,各行各业似乎都在积...
阅读原文

对话360集团梁志辉:360是如何做大模型的?|甲子光年

1个千亿的大模型+N个百亿小模型的部署方式或许是最优路线。作者|苏霍伊‍‍‍编辑|赵健‍‍‍明天,是 ChatGPT 问世一周年的日子。过去的一年时间已证明,AI 大模...
阅读原文

大模型+自动驾驶=?普渡大学等最新《自动驾驶领域多模态大型语言模型》综述

来源:专知随着大型语言模型(LLMs)和视觉基础模型(VFMs)的出现,利用大型模型的多模态AI系统有潜力像人类一样感知现实世界、做出决策和控制工具。近几个...
阅读原文

大模型时代,“人人可AI”的百度开发者平台长什么样?

转载自 51CTO技术栈,作者:云昭,嘉宾:张瑞星大模型时代的开发者平台,不仅要提供 AI 原生能力,还要具备生态打造和商业化闭环能力。提及“灵境”,人们在脑...
阅读原文
1424344454656