超越Devin!姚班带队,他们创大模型编程新世界纪录

允中 发自 凹非寺量子位 | 公众号 QbitAI超越Devin!SWEBench排行榜上迎来了新玩家—— StarShip CodeGen Agent,姚班带队初创公司OpenCSG出品,以23.67%的成绩...
阅读原文

英伟达新研究:上下文长度虚标严重,32K性能合格的都不多

西风 发自 凹非寺量子位 | 公众号 QbitAI无情戳穿“长上下文”大模型的虚标现象—— 英伟达新研究发现,包括GPT-4在内的10个大模型,生成达到128k甚至1M上下文长...
阅读原文

ICML2024高分!魔改注意力,让小模型能打两倍大的模型

彩云科技团队 投稿量子位 | 公众号 QbitAI改进Transformer核心机制注意力,让小模型能打两倍大的模型! ICML 2024高分论文,彩云科技团队构建DCFormer框架,...
阅读原文

重磅!斯坦福 AI 团队被曝抄袭中国大模型开源成果,舆论开始发酵

美国也有投机分子。作者 | 西西 编辑 | 陈彩娴 过去一年,中国大模型一直被贴上「追赶美国」的标签,但近日,推特上却有人曝出:美国斯坦福大学的一个 AI 团...
阅读原文

《AI替我上班》底层策划篇 — “秒出PPT”

我今天真的不想上班鸭。省流:https://10sppt.com/ppt“秒出PPT”一款功能够用,使用方便,比WPS便宜少许,比微软全家桶便宜很多的 PPT 生成工具。 能做到不厌...
阅读原文

斯坦福AI团队被曝抄袭中国大模型开源成果,面壁回应;传沙特将参与智谱4亿美元投资;OpenAI重启机器人团队丨AI情报局

01 融资快报AI软件开发公司Poolside AI正在筹集4.5亿美元的融资:Poolside AI正在研发一种为软件开发者专门设计的大型语言模型,目前正在与投资者进行谈判,...
阅读原文

英伟达剧透新一代最强 GPU/iPhone 15 官方全系降至历史最低价/京东采销回应磨铁停止发货一事

🔥 英伟达剧透新一代最强GPU ☁️ Google 云部门进行大规模裁员 🚘 周鸿祎首次回应卖车事件 🚗 多家车企公布 5 月交付量 🍎 iPadmini 7 或将继续搭载 A 系列芯片 📖 ...
阅读原文

无实验数据指导蛋白质定向进化,上海交大洪亮课题组发表微环境感知图神经网络 ProtLGN

作者:加零 编辑:李宝珠,三羊 上海交通大学洪亮课题组研发了一种名为 PROTLGN 的微环境感知图神经网络,能够从蛋白质三维结构中学习并预测有益的氨基酸突变...
阅读原文

一键部署LLaMA 3 Chinese Chat,含中文训练数据集;Food2K数据集下载,含2千类别,100万张图片

前段时间 Llama 3 的重磅开源让 AI 圈的众人都兴奋了一把,但它对纯中文的支持不是很好,不能灵活地根据中文提问切换至相应语言进行回答。 hyper.ai 本周上线...
阅读原文

老黄一口气解密三代GPU!粉碎摩尔定律打造AI帝国,量产Blackwell解决ChatGPT全球耗电难题

新智元报道编辑:编辑部 【新智元导读】刚刚,老黄又高调向全世界秀了一把:已经量产的Blackwell,8年内将把1.8万亿参数GPT-4的训练能耗狂砍到1/350;英伟达...
阅读原文

LLM的「母语」是什么?

新智元报道编辑:alan 【新智元导读】在以英语为主的语料库上训练的多语言LLM,是否使用英语作为内部语言?对此,来自EPFL的研究人员针对Llama 2家族进行了一...
阅读原文

Neuralink劲敌破纪录,4096个电极微创植入人脑!脑机接口有望进入「5G」时代

新智元报道编辑:乔杨 【新智元导读】在脑机接口领域取得突破性进展的公司不止Neuralink一家。Precision Neuroscience发布公告称,他们采用与Neuralink不同的...
阅读原文

next-token被淘汰!Meta实测「多token」训练方法,推理提速3倍,性能大涨10%+

新智元报道编辑:LRS 【新智元导读】研究人员提出了一种新的大型语言模型训练方法,通过一次性预测多个未来tokens来提高样本效率和模型性能,在代码和自然语...
阅读原文

脑细胞做成16核芯片,用Python就能编程,9个机构开展实验36所大学排队

梦晨 发自 凹非寺量子位 | 公众号 QbitAI首个“脑PU”来了!由“16核”类人脑器官(human brain organoids)组成。 这项研究来自瑞士生物计算创业公司FinalSpark...
阅读原文

多模态大模型+自动驾驶=?ECCV'24这场Workshop开启招募啦

CK 投稿量子位 | 公众号 QbitAI多模态,已经成为大模型最重要的发展方向之一。 从GPT-4V到GPT-4o,多模态大模型在多模态感知与理解方面的进展,正在不断惊艳...
阅读原文