标签:模型

“幻觉”问题根本无解!为什么我们的大模型会“说胡话”?

来源:CSDN 整理:王启隆 “幻觉”(Hallucination),现在已经是大语言模型领域无人不知、无人不晓的热词。我们在和 ChatGPT 等聊天机器人对话的时候,有时会...
阅读原文

大模型如何用因果性?最新《大型语言模型与因果推断在协作中的应用》全面综述

来源:专知 因果推断在提高自然语言处理(NLP)模型的预测准确性、公平性、鲁棒性和可解释性方面显示出潜力,它通过捕捉变量间的因果关系来实现这一点。生成...
阅读原文

不如 Mistral-8x7B,开源没有诚意!马斯克开源的Grok-1问题分析

智猩猩与智东西将于4月18-19日在北京共同举办2024中国生成式AI大会,阿里巴巴通义千问大模型技术负责人周畅,潞晨科技创始人尤洋,生数科技CEO唐家渝,优必选...
阅读原文

腾讯研究科学家张驰:基于多模态大语言模型的GUI智能体|GenAICon演讲预告

4月18日-19日,由智猩猩和智东西共同发起主办的2024中国生成式AI大会(GenAICon 2024)将在北京JW万豪酒店正式举行。 大会将由主会场会议+分会场论坛+展览+榜...
阅读原文

全球首个类Sora开源复现方案来了!全面公开所有训练细节和模型权重

明敏 发自 凹非寺量子位 | 公众号 QbitAI全球首个开源的类Sora架构视频生成模型,来了! 整个训练流程,包括数据处理、所有训练细节和模型权重,全部开放。 ...
阅读原文

大模型落地“诸神之战”,场景玩家先杀出重围了

明敏 发自 凹非寺量子位 | 公众号 QbitAI都说今年是大模型落地元年,但实际进展还是快得超出想象了。 这不,在一年一度的AWE(中国家电及消费电子博览会)现...
阅读原文

马斯克突然开源Grok:3140亿参数巨无霸,免费可商用

鱼羊 克雷西 发自 凹非寺量子位 | 公众号 QbitAI马斯克说到做到: 旗下大模型Grok现已开源! 代码和模型权重已上线GitHub。官方信息显示,此次开源的Grok-1是...
阅读原文

月之暗面Kimi模型升级:200万字窗口版可申请,新增“继续”功能

衡宇 发自 凹非寺量子位 | 公众号 QbitAI继2月以投后约25亿美金估值炸场后,杨植麟的大模型公司月之暗面终于有了一次公开对媒体的活动。 虽然杨植麟本人并未...
阅读原文

AI手机,只是噱头?

大数据文摘受权转载自定焦 作者 | 黎明 编辑 | 魏佳今年的手机圈很热闹,一开年就弥漫着一股火药味。 先是三星赶在年前发布了Galaxy S24系列手机,特意把发布...
阅读原文

GPT-4级模型Grok开源可商用!卷底层大模型的公司危了

夕小瑶科技说 原创作者 | 醒醒上周,马斯克宣布 xAI 将开源 Grok。 刚刚,马斯克终于兑现诺言,xAI 宣布开源了 Grok-1 的模型权重和网络架构。 Grok-1 是一个...
阅读原文

今日arXiv最热大模型论文:何恺明重提十年之争——模型表现好是源于能力提升还是捕获数据集偏见

夕小瑶科技说 原创作者 | 松果2011年,知名学者Antonio Torralba和Alyosha Efros提出了“数据集偏差之战”,他们发现机器学习模型很容易“过拟合”到特定的数据集...
阅读原文

警惕城市「慢性病」:中南大学柳建新教授团队,用 AI 预测未来 40 年的地面沉降风险

作者:田小幺 编辑:李宝珠,三羊 中南大学柳建新教授团队,联合广东省地质环境监测总站、广东省第四地质大队、科特迪瓦博瓦尼大学,使用极端梯度提升回归与...
阅读原文

别等OpenAI了,全球首个类Sora抢先开源!所有训练细节/模型权重全公开,成本仅1万美元

新智元报道编辑:编辑部 【新智元导读】OpenAI Sora还没用上,国产Sora刚刚正式宣布全面开源!「Open-Sora 1.0」所有的训练细节模型权重全面开源,1万美元64...
阅读原文

马斯克打脸OpenAI,全球最大巨无霸模型Grok-1开源!3140亿参数8个MoE,GitHub狂揽6k星

新智元报道编辑:编辑部 【新智元导读】xAI的Grok,在七天后如期开源了!公开Grok背后代码,让马斯克对OpenAI啪啪打脸。3140亿参数8个MoE,权重架构全开放,...
阅读原文

巧解「数据稀缺」问题!清华开源GPD:用扩散模型生成神经网络参数|ICLR 2024

新智元报道编辑:LRS 好困 【新智元导读】清华大学电子工程系城市科学与计算研究中心最近提出了一种新的时空少样本学习方法,旨在解决城市计算中广泛存在的数...
阅读原文