标签:模型
比C语言还快20%!Mojo首个大模型开放下载,性能达Python版250倍
明敏 发自 凹非寺量子位 公众号 | QbitAI专为AI而来的新语言Mojo,推理LLaMA2性能比Python提升250倍!比C语言也要快上20%。上周五才开放下载,Mojo这么快就自...
玩10次ChatGPT就要消耗1升水|加州大学河滨分校研究结果
西风 发自 凹非寺量子位 | 公众号 QbitAI用5次ChatGPT,最高可消耗500毫升水。这是研究人员对OpenAI训模型耗水量调查后给出的结果。此外,据微软最新环境报告...
AIGC最新动态丨9月12日行业大事件汇总!
AIGC行业资讯国外热点速览俄罗斯科技巨头 Yandex 开发 GPT 大模型;消息称 Meta 计划明年初开发全新的大型语言模型;戴尔和利默里克大学合作,搭建 AI 平台用...
大模型应用创业大赛开启,与顶级投资人和技术大咖共同打造你的创意产品!
夕小瑶科技说 分享来源 | 百度飞桨亲爱的科技探险家们和代码魔法师们:未来的钟声已经敲响,预示着一场极度炫酷的虚拟现实游戏即将展开。从初期简单的智能识...
大模型偏见有多严重?柏林洪堡大学发布新工具OpinionGPT,你的AI真的公正吗?
夕小瑶科技说 原创作者 | 谢年年近年来,指令调优的大型语言模型(LLM)在各个问答任务上表现出色。然而,受训练数据的影响,这些模型的回答可能存在隐含的偏...
超越ToT,苏黎世理工发布新一代思维图GoT:推理质量提升62%,成本降低31%
新智元报道编辑:LRS【新智元导读】推理速度、推理质量二者兼得,全新一代思维图GoT可以处理更复杂推理任务!大型语言模型在推理上仍然是弱势项目,需要依赖...
李云龙、谢耳朵专业陪聊!角色扮演系统ChatHaruhi爆火:支持32个中外角色,开源5.4万条对话数据
新智元报道编辑:LRS【新智元导读】GitHub斩获700+stars,除了二次元角色,ChatHaruhi还支持《武林外传》、《亮剑》、《生活大爆炸》、于谦等经典角色!「角...
碾压H100!英伟达GH200超级芯片首秀MLPerf v3.1,性能跃升17%
新智元报道编辑:编辑部【新智元导读】传说中的英伟达GH200在MLPerf 3.1中惊艳亮相,性能直接碾压H100,领先了17%。继4月份加入LLM训练测试后,MLPerf再次迎...
推理飙升2倍!普林斯顿北大校友祭出多头「美杜莎」,33B模型与13B一样快
新智元报道编辑:桃子 好困【新智元导读】大模型推理加速如何破局?普林斯顿、UIUC等机构华人团队提出一个简单框架Medusa,训练多个解码头,直接让LLM推理速...
CIKM 2023|TASTE:通过文本匹配缓解序列化推荐中流行偏差问题
作者丨刘正皓1、梅森1、熊辰炎2、李晓华1、于是 3、刘知远3、谷峪1、于戈1机构丨1. 东北大学;2. 卡内基梅隆大学;3. 清华大学该论文发表于CIKM-2023论文链接...
汤道生的下一场战事:大模型时代的产业「智能化」升级战怎么打?
机器之心原创作者:张倩汤道生谈大模型时代产业「智能化」打法:直奔主题、跑「马拉松」、保持开放。2023 年上半年,百模大战如火如荼,成了国内 AI 领域最热...
32卡176%训练加速,开源大模型训练框架Megatron-LLaMA来了
机器之心发布机器之心编辑部9 月 12 日,淘天集团联合爱橙科技正式对外开源大模型训练框架 ——Megatron-LLaMA,旨在让技术开发者们能够更方便的提升大语言模型...
GPT太「奢侈」,平替大汇总来了,再也不用担心部署大难题
机器之心报道机器之心编辑部超多平替,按需选取。近年来,生成式预训练模型(如 GPT)的兴起彻底颠覆了自然语言处理领域,其影响甚至已经延伸到其他多种模态...
大模型热潮下的实习生:人均985?却在大厂“打标签”|甲子光年
好奇和憧憬背后,感受到真实的混乱和价值感匮乏。作者|朱悦编辑|栗子正式实习的第一天,晨曦感觉自己可能“被骗”了。刚刚结束完学校的毕业论文,准研究生晨...
大模型时代的输入法革命:从输入工具,到“超会写”的AI创作助手
深度体验百度“超会写”,看大模型时代输入法如何被带飞。作者|程茜编辑|漠影解锁手机、回微信、刷小红书、刷微博、刷抖音、淘宝购物……这可能是你用手机“冲浪”...