标签：能力

思维链提出者Jason Wei：关于大模型的6个直觉

选自 jasonwei.net/blog作者：Jason Wei机器之心编译编辑：Panda大模型究竟从下一个词预测任务中学到了什么呢？还记得 Jason Wei 吗？这位思维链的提出者还曾...

阅读原文

AIGC动态

3年前 (2023)

大模型免微调解锁对话能力，RLHF没必要了！一作上交大校友：节省大量成本和时间

梦晨发自凹非寺量子位 | 公众号 QbitAI要搞大模型AI助手，像ChatGPT一样对齐微调已经是行业标准做法，通常分为SFT+RLHF两步走。来自艾伦研究所的新研究却发...

阅读原文

AIGC动态

3年前 (2023)

秒杀700亿Llama 2！最新国产大模型亮相，无需申请即可免费商用，背后公司来自私募巨头

丰色发自凹非寺量子位 | 公众号QbitAI国产大模型刚刚出了一位全新选手：参数670亿的DeepSeek。它在近20个中英文的公开评测榜单上直接超越了同量级、700亿的...

阅读原文

AIGC动态

3年前 (2023)

云知声董事长梁家恩：AGI 赋能未来的力量｜甲子引力

当问题可以被计算时，超越人类智能或许只是时间问题。11月30日-12月1日，由中国科技产业智库「甲子光年」主办的「致追风赶月的你」2023甲子引力年终盛典在北...

阅读原文

AIGC动态

3年前 (2023)

大模型版“5年高考3年模拟”来了！6141道数学题，还是多模态的那种｜微软&UCLA&UW联合出品

Pan Lu投稿量子位 | 公众号 QbitAI大模型的“5年高考3年模拟”数学题来了，还是加强强强版！微软、加州大学洛杉矶分校（UCLA）、华盛顿大学（UW）联合打造全新...

阅读原文

AIGC动态

3年前 (2023)

112页报告深挖GPT-4V！UCLA等发布全新「多模态数学推理」基准MathVista

新智元报道编辑：LRS 好困【新智元导读】大型多模态模型会做数学题吗？在UCLA等机构最新发布的MathVista基准上，即使是当前最强的GPT-4V也会感到「挫败感」。...

阅读原文

AIGC动态

3年前 (2023)

【重磅】解码OpenAI Q*：迈向AGI的信仰之跃

作者|费斌杰随着OpenAI CEO的罢免闹剧逐渐平息，隐藏在整个事件背后的“Q*”模型浮出水面。据路透社消息，在Sam Altman罢免前夕，几位OpenAI的科学家向董事会写...

阅读原文

AIGC动态

3年前 (2023)

微软教小模型推理进阶版：Orca 2性能媲美10倍参数模型，已开源

机器之心报道机器之心编辑部站在巨人的肩膀上会让你看的更远，而通过让大规模语言模型来「教」较小规模的语言模型进行推理，也会是事半功倍的效果。如你我所...

阅读原文

AIGC动态

3年前 (2023)

国产720亿参数开源免费模型来了！对标Llama2 70B，一手实测在此

鱼羊发自凹非寺量子位 | 公众号 QbitAI最强开源大模型，再次易主！就在刚刚，阿里云通义千问又双叒开源了，并且直接开大：甩出了720亿参数版本——在中国的开...

阅读原文

AIGC动态

3年前 (2023)

720亿参数大模型都拿来开源了！通义千问开源全家桶，最小18亿模型端侧都能跑

机器之心原创作者：张倩、杜伟目前，通义千问开源全家桶已经有了 18 亿、70 亿、140 亿、720 亿参数量的 4 款基础开源模型，以及跨语言、图像、语音等多种模...

阅读原文

AIGC动态

3年前 (2023)

打通大模型训练任督二脉！国内首个千亿参数、全面开源大模型来了，还联手开发者共训

浪潮信息算法、数据、计算三大创新黑科技，大幅提升大模型智力水平。作者|程茜编辑|漠影智东西11月30日报道，11月27日，算力龙头企业浪潮信息发布了完全开源...

阅读原文

AIGC动态

3年前 (2023)

大模型深入智慧之地，手机厂商会如何交卷？

受访嘉宾 | 刘海锋OPPO 数智工程事业部总裁作者 | 罗燕珊1一条新路出现：跟风与乘势？大模型浪潮下的未见与先见在蓬勃发展的 AI 浪潮中，各行各业似乎都在积...

阅读原文

AIGC动态

3年前 (2023)

对话360集团梁志辉：360是如何做大模型的？｜甲子光年

1个千亿的大模型+N个百亿小模型的部署方式或许是最优路线。作者｜苏霍伊‍‍‍编辑｜赵健‍‍‍明天，是 ChatGPT 问世一周年的日子。过去的一年时间已证明，AI 大模...

阅读原文

AIGC动态

3年前 (2023)

大模型+自动驾驶=？普渡大学等最新《自动驾驶领域多模态大型语言模型》综述

来源：专知随着大型语言模型（LLMs）和视觉基础模型（VFMs）的出现，利用大型模型的多模态AI系统有潜力像人类一样感知现实世界、做出决策和控制工具。近几个...

阅读原文

AIGC动态

3年前 (2023)

大模型时代，“人人可AI”的百度开发者平台长什么样？

转载自 51CTO技术栈，作者：云昭，嘉宾：张瑞星大模型时代的开发者平台，不仅要提供 AI 原生能力，还要具备生态打造和商业化闭环能力。提及“灵境”，人们在脑...

阅读原文

AIGC动态

3年前 (2023)

1…42 434445 46…56