标签：模型

十问复旦邱锡鹏：大模型进入安卓时代，希望有国产模型能代替LIama

杨净发自凹非寺量子位 | 公众号 QbitAI大模型进入安卓时代，希望有国产模型能代替LIama。千模大战序幕拉起，复旦邱锡鹏教授这样说。作为国内最早推出类Chat...

阅读原文

AIGC动态

3年前 (2023)

清华智能体宇宙火了，AI模拟“囚徒困境”等实验只需几行简单配置

丰色发自凹非寺量子位 | 公众号 QbitAI可以轻松模拟社会实验的多智能体宇宙来了——它由清华大学联合北邮、微信团队推出，目前已在GitHub揽获1.1k标星。名字...

阅读原文

AIGC动态

3年前 (2023)

比C语言还快20%！Mojo首个大模型开放下载，性能达Python版250倍

明敏发自凹非寺量子位公众号 | QbitAI专为AI而来的新语言Mojo，推理LLaMA2性能比Python提升250倍！比C语言也要快上20%。上周五才开放下载，Mojo这么快就自...

阅读原文

AIGC动态

3年前 (2023)

玩10次ChatGPT就要消耗1升水｜加州大学河滨分校研究结果

西风发自凹非寺量子位 | 公众号 QbitAI用5次ChatGPT，最高可消耗500毫升水。这是研究人员对OpenAI训模型耗水量调查后给出的结果。此外，据微软最新环境报告...

阅读原文

AIGC动态

3年前 (2023)

AIGC最新动态丨9月12日行业大汇总！

AIGC行业资讯国外热点速览俄罗斯科技巨头 Yandex 开发 GPT 大模型；消息称 Meta 计划明年初开发全新的大型语言模型；戴尔和利默里克大学合作，搭建 AI 平台用...

阅读原文

AIGC动态

3年前 (2023)

大模型应用创业大赛开启，与顶级投资人和技术大咖共同打造你的创意产品！

夕小瑶科技说分享来源 | 百度飞桨亲爱的科技探险家们和代码魔法师们：未来的钟声已经敲响，预示着一场极度炫酷的虚拟现实游戏即将展开。从初期简单的智能识...

阅读原文

AIGC动态

3年前 (2023)

大模型偏见有多严重？柏林洪堡大学发布新工具OpinionGPT，你的AI真的公正吗？

夕小瑶科技说原创作者 | 谢年年近年来，指令调优的大型语言模型（LLM）在各个问答任务上表现出色。然而，受训练数据的影响，这些模型的回答可能存在隐含的偏...

阅读原文

AIGC动态

3年前 (2023)

李云龙、谢耳朵专业陪聊！角色扮演系统ChatHaruhi爆火：支持32个中外角色，开源5.4万条对话数据

新智元报道编辑：LRS【新智元导读】GitHub斩获700+stars，除了二次元角色，ChatHaruhi还支持《武林外传》、《亮剑》、《生活大爆炸》、于谦等经典角色！「角...

阅读原文

AIGC动态

3年前 (2023)

碾压H100！英伟达GH200超级芯片首秀MLPerf v3.1，性能跃升17%

新智元报道编辑：编辑部【新智元导读】传说中的英伟达GH200在MLPerf 3.1中惊艳亮相，性能直接碾压H100，领先了17%。继4月份加入LLM训练测试后，MLPerf再次迎...

阅读原文

AIGC动态

3年前 (2023)

推理飙升2倍！普林斯顿北大校友祭出多头「美杜莎」，33B模型与13B一样快

新智元报道编辑：桃子好困【新智元导读】大模型推理加速如何破局？普林斯顿、UIUC等机构华人团队提出一个简单框架Medusa，训练多个解码头，直接让LLM推理速...

阅读原文

AIGC动态

3年前 (2023)

超越ToT，苏黎世理工发布新一代思维图GoT：推理质量提升62%，成本降低31%

新智元报道编辑：LRS【新智元导读】推理速度、推理质量二者兼得，全新一代思维图GoT可以处理更复杂推理任务！大型语言模型在推理上仍然是弱势项目，需要依赖...

阅读原文

AIGC动态

3年前 (2023)

CIKM 2023｜TASTE：通过文本匹配缓解序列化推荐中流行偏差问题

作者丨刘正皓1、梅森1、熊辰炎2、李晓华1、于是 3、刘知远3、谷峪1、于戈1机构丨1. 东北大学；2. 卡内基梅隆大学；3. 清华大学该论文发表于CIKM-2023论文链接...

阅读原文

AIGC动态

3年前 (2023)

汤道生的下一场战事：大模型时代的产业「智能化」升级战怎么打？

机器之心原创作者：张倩汤道生谈大模型时代产业「智能化」打法：直奔主题、跑「马拉松」、保持开放。2023 年上半年，百模大战如火如荼，成了国内 AI 领域最热...

阅读原文

AIGC动态

3年前 (2023)

32卡176%训练加速，开源大模型训练框架Megatron-LLaMA来了

机器之心发布机器之心编辑部9 月 12 日，淘天集团联合爱橙科技正式对外开源大模型训练框架 ——Megatron-LLaMA，旨在让技术开发者们能够更方便的提升大语言模型...

阅读原文

AIGC动态

3年前 (2023)

GPT太「奢侈」，平替大汇总来了，再也不用担心部署大难题

机器之心报道机器之心编辑部超多平替，按需选取。近年来，生成式预训练模型（如 GPT）的兴起彻底颠覆了自然语言处理领域，其影响甚至已经延伸到其他多种模态...

阅读原文

AIGC动态

3年前 (2023)

1…470 471472473 474…483