标签:模型

十问复旦邱锡鹏:大模型进入安卓时代,希望有国产模型能代替LIama

杨净 发自 凹非寺量子位 | 公众号 QbitAI大模型进入安卓时代,希望有国产模型能代替LIama。千模大战序幕拉起,复旦邱锡鹏教授这样说。作为国内最早推出类Chat...
阅读原文

清华智能体宇宙火了,AI模拟“囚徒困境”等实验只需几行简单配置

丰色 发自 凹非寺量子位 | 公众号 QbitAI可以轻松模拟社会实验的多智能体宇宙来了——它由清华大学联合北邮、微信团队推出,目前已在GitHub揽获1.1k标星。名字...
阅读原文

比C语言还快20%!Mojo首个大模型开放下载,性能达Python版250倍

明敏 发自 凹非寺量子位 公众号 | QbitAI专为AI而来的新语言Mojo,推理LLaMA2性能比Python提升250倍!比C语言也要快上20%。上周五才开放下载,Mojo这么快就自...
阅读原文

玩10次ChatGPT就要消耗1升水|加州大学河滨分校研究结果

西风 发自 凹非寺量子位 | 公众号 QbitAI用5次ChatGPT,最高可消耗500毫升水。这是研究人员对OpenAI训模型耗水量调查后给出的结果。此外,据微软最新环境报告...
阅读原文

AIGC最新动态丨9月12日行业大汇总!

AIGC行业资讯国外热点速览俄罗斯科技巨头 Yandex 开发 GPT 大模型;消息称 Meta 计划明年初开发全新的大型语言模型;戴尔和利默里克大学合作,搭建 AI 平台用...
阅读原文

大模型应用创业大赛开启,与顶级投资人和技术大咖共同打造你的创意产品!

夕小瑶科技说 分享来源 | 百度飞桨亲爱的科技探险家们和代码魔法师们:未来的钟声已经敲响,预示着一场极度炫酷的虚拟现实游戏即将展开。从初期简单的智能识...
阅读原文

大模型偏见有多严重?柏林洪堡大学发布新工具OpinionGPT,你的AI真的公正吗?

夕小瑶科技说 原创作者 | 谢年年近年来,指令调优的大型语言模型(LLM)在各个问答任务上表现出色。然而,受训练数据的影响,这些模型的回答可能存在隐含的偏...
阅读原文

碾压H100!英伟达GH200超级芯片首秀MLPerf v3.1,性能跃升17%

新智元报道编辑:编辑部【新智元导读】传说中的英伟达GH200在MLPerf 3.1中惊艳亮相,性能直接碾压H100,领先了17%。继4月份加入LLM训练测试后,MLPerf再次迎...
阅读原文

推理飙升2倍!普林斯顿北大校友祭出多头「美杜莎」,33B模型与13B一样快

新智元报道编辑:桃子 好困【新智元导读】大模型推理加速如何破局?普林斯顿、UIUC等机构华人团队提出一个简单框架Medusa,训练多个解码头,直接让LLM推理速...
阅读原文

超越ToT,苏黎世理工发布新一代思维图GoT:推理质量提升62%,成本降低31%

新智元报道编辑:LRS【新智元导读】推理速度、推理质量二者兼得,全新一代思维图GoT可以处理更复杂推理任务!大型语言模型在推理上仍然是弱势项目,需要依赖...
阅读原文

李云龙、谢耳朵专业陪聊!角色扮演系统ChatHaruhi爆火:支持32个中外角色,开源5.4万条对话数据

新智元报道编辑:LRS【新智元导读】GitHub斩获700+stars,除了二次元角色,ChatHaruhi还支持《武林外传》、《亮剑》、《生活大爆炸》、于谦等经典角色!「角...
阅读原文

CIKM 2023|TASTE:通过文本匹配缓解序列化推荐中流行偏差问题

作者丨刘正皓1、梅森1、熊辰炎2、李晓华1、于是 3、刘知远3、谷峪1、于戈1机构丨1. 东北大学;2. 卡内基梅隆大学;3. 清华大学该论文发表于CIKM-2023论文链接...
阅读原文

汤道生的下一场战事:大模型时代的产业「智能化」升级战怎么打?

机器之心原创作者:张倩汤道生谈大模型时代产业「智能化」打法:直奔主题、跑「马拉松」、保持开放。2023 年上半年,百模大战如火如荼,成了国内 AI 领域最热...
阅读原文

32卡176%训练加速,开源大模型训练框架Megatron-LLaMA来了

机器之心发布机器之心编辑部9 月 12 日,淘天集团联合爱橙科技正式对外开源大模型训练框架 ——Megatron-LLaMA,旨在让技术开发者们能够更方便的提升大语言模型...
阅读原文

GPT太「奢侈」,平替大汇总来了,再也不用担心部署大难题

机器之心报道机器之心编辑部超多平替,按需选取。近年来,生成式预训练模型(如 GPT)的兴起彻底颠覆了自然语言处理领域,其影响甚至已经延伸到其他多种模态...
阅读原文