标签:模型

DeepMind升级Transformer,前向通过FLOPs最多可降一半

机器之心报道 编辑:Panda W引入混合深度,DeepMind 新设计可大幅提升 Transformer 效率。Transformer 的重要性无需多言,目前也有很多研究团队致力于改进这...
阅读原文

惊!2023年人工智能投资狂跌20%,超级泡沫即将破裂?

点击上方蓝字关注我们“全球人工智能产业在经历多年资金热潮后迎来深度调整期。据斯坦福大学人本人工智能研究所(HAI)报告,2023年AI投资连续第二年下滑,涉及...
阅读原文

阿里、腾讯专家领衔,ChatDev一作与MetaGPT团队也来了,AI智能体技术研讨会周五举行

自ChatGPT面世以来,生成式AI加速狂飙,在学术界、产业界、投资界掀起滔天巨浪,冲击着千行百业。 AI大模型飞速迭代,创新应用层出不穷。我们正处于技术野蛮...
阅读原文

RAG实战全解析:一年探索之路

4月18-19日,由智猩猩与智东西共同主办的2024中国生成式AI大会将在北京JW万豪酒店举行。大会完整议程出炉,55位嘉宾出席!免费票申请通道即将关闭,大会通票...
阅读原文

张鹏对话无问芯穹夏立雪:中国的Scaling Law是场景优势,异构算力解决大模型落地难题

Scaling Law 已成为大模型进化的「不二法门」。 参数量越大、数据集规模越大、算力消耗越大,大模型性能就越好。相比较海外的大模型公司,国内的大模型公司会...
阅读原文

贝叶斯脑计算与能原理:Karl Friston访谈 | NSR

采写:卢文联|(复旦大学类脑智能科学与技术研究院教授)自由能原理蕴含了“贝叶斯大脑”假设,该假设可以通过相关领域提出的许多方案来实现。多模态脑影像和...
阅读原文

人在B站,要被AI公司们挤爆了

金磊 发自 凹非寺量子位 | 公众号 QbitAI现在,AI大模型公司们有了新的必争高地—— 把流量打出去,普通用户抢过来。 例如现在逛个B站,画风简直就是“五步一AI...
阅读原文

融合ChatGPT+DALL·E 3,贾佳亚团队新作开源畅玩:识图推理生图一站解决

允中 发自 凹非寺量子位 | 公众号 QbitAI在开源社区中把GPT-4+Dall·E 3能⼒整合起来的模型该有多强? 香港中文大学终身教授贾佳亚团队提出多模态模型Mini-Gem...
阅读原文

北大字节开辟图像生成新范式!超越Sora核心组件DiT,不再预测下一个token

鱼羊 发自 凹非寺量子位 | 公众号 QbitAI北大和字节联手搞了个大的: 提出图像生成新范式,从预测下一个token变成预测下一级分辨率,效果超越Sora核心组件Dif...
阅读原文

万兴科技副总裁朱伟:天幕已启 共赴AI大时代 | GenAICon 2024

自ChatGPT面世以来,生成式AI已加速狂飙16个月,在学术界、产业界、投资界掀起滔天巨浪,冲击着千行百业。 AI大模型飞速迭代,创新应用层出不穷。我们正处于...
阅读原文

巨头们火力全开:AI应用边界再扩张 | 大模型一周大事

大模型的快节奏发展,让了解最新技术动态、积极主动学习成为每一位从业者的必修课。InfoQ 研究中心期望通过每周更新大模型行业最新动态,为广大读者提供全面...
阅读原文

今日arXiv最热NLP大模型论文:北京大学&快手发布统一的图文视频生成大模型Video-LaVIT

夕小瑶科技说 原创作者 | 芒果引言:探索视频与语言模型的新融合随着多模态大语言模型(LLMs)的新发展,人们越来越关注如何将它们从图像-文本数据扩展到更具...
阅读原文

贾佳亚团队新模型对标ChatGPT+DALL-E 3王炸组合!读懂梗图刷爆榜单,代码复现数学函数

新智元报道编辑:编辑部 【新智元导读】贾佳亚团队提出VLM模型Mini-Gemini,堪比GPT-4+DALL-E 3王炸组合,一上线就刷爆了多模态任务榜单!读得懂梗图,做得了...
阅读原文

马斯克新作!Grok-1.5V多模态模型震撼发布:数字与物理世界完美融合

新智元报道编辑:编辑部 【新智元导读】马斯克xAI的多模态模型Grok-1.5V横空出世了!不仅多项基准测试超越GPT-4V,而且看懂梗图写Python代码也都不在话下。并...
阅读原文

GPT-4整治学术不端!人大/浙大团队实测7000篇论文,撤稿预测与人类95%一致

新智元报道编辑:LRS 【新智元导读】人大与浙大学者发现,GPT-4对于论文给出的撤稿预测结果,竟然和人类审稿人有将近95%的相似性。看来大模型虽然有可能引发...
阅读原文