标签:模型

高通的自研架构芯片,正在整合生成式AI世界

机器之心报道 编辑:泽南生成式 AI 的驱动力,就在这块「至尊」芯片上? 身处 2024 年末的我们,已经能感觉到大模型就在身边。 新一代的旗舰手机上,动态壁纸...
阅读原文

发力了,Mistral对标ChatGPT全面升级le Chat,还祭出超大杯多模态模型

机器之心报道 编辑:蛋酱、陈陈一觉醒来,Mistral AI 又发力了。 就在今天,Mistral AI 多模态家族迎来了第二位成员:一个名为 Pixtral Large 的超大杯基础模...
阅读原文

大模型承重墙,去掉了就开始摆烂!苹果给出了「超级权重」

机器之心报道 编辑:蛋酱、佳琪去掉一个「超权重」的影响,比去掉其他 7000 个离群值权重加起来还要严重。大模型的参数量越来越大,越来越聪明,但它们也越来...
阅读原文

面向代码语言模型的安全性研究全新进展,南大&NTU联合发布全面综述

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

含284个数据集,覆盖18项临床任务,上海AI Lab等发布多模态医疗基准GMAI-MMBench

作者:李姝 编辑:李宝珠 上海人工智能实验室联合华盛顿大学/莫纳什大学/华东师范大学等多所科研单位提出了 GMAI-MMBench 基准,包含来自全球的 284 个下游任...
阅读原文

独家|腾讯杰出科学家、混元大模型技术负责人之一刘威离职

编辑 | 褚杏娟、蔡芳芳 AI 前线独家获悉,腾讯杰出科学家、腾讯混元大模型技术负责人之一刘威,目前已经从腾讯离职。 今年 5 月,刘威以混元大模型技术负责...
阅读原文

Scaling Law,撞墙了吗?| 直播预告

近期,关于大语言模型(LLM)在 Scaling Law 方面的瓶颈引发热议。据报道,OpenAI 新一代模型在性能提升上的表现未达预期,尤其在编程任务中的改进幅度有限。...
阅读原文

全球超万亿使用量的热门数据库,首次被大模型揪出了严重漏洞

作者 | 罗燕珊 谷歌的研究人员日前声称,他们首次利用大语言模型发现了一个重要漏洞。 在一篇博客文章中,谷歌表示,他们相信这是 AI agent 在广泛使用的现...
阅读原文

如祺出行跑进智驾深水区 “数据闭环”为技术迭代提供更优解

允中 发自 凹非寺量子位 | 公众号 QbitAI随着汽车进入“AI驱动”的时代,不止各大品牌新车拼智能,出行平台也在布局面向智驾产业的“自动驾驶工具链”。 这是今年...
阅读原文

AI一键解析九大生物医学成像模式,用户只需文字prompt交互,微软UW等新研究登Nature Methods

BiomedParse团队 投稿量子位 | 公众号 QbitAI用AI大模型一键解析MRI、CT和病理学等九大生物医学成像模式。 不仅复杂、不规则形状对象能高精度识别: 而且通过...
阅读原文

当大模型升级速度变缓,AI Infra 还是一门「好生意」吗?

大会预告12月5-6日,2024中国生成式AI大会(上海站)将举办,20+位嘉宾已确认参会演讲。其中,上海交大副教授、无问芯穹联合创始人兼首席科学家戴国浩,GMI C...
阅读原文

对话月之暗面创始人杨植麟:AI 未来最重要的能力是思考和交互

月之暗面和杨植麟大概是近期最受关注的国产大模型公司和创始人,仲裁争议和出海产品收缩的消息让其站在风口浪尖。 更重要的原因,当然还是月之暗面的 Kimi 是...
阅读原文

AI 求解量子多体问题:GPT 理解人类语言,也理解量子语言吗?

导语加州大学圣地亚哥分校副教授、集智科学家尤亦庄等人在最新研究中,提出一种名为 ShadowGPT 的新方法,让 GPT 语言模型生成经典阴影(classical shadows)...
阅读原文

英伟达 Blackwell 芯片又又又曝问题!老黄大半年没搞定,微软们被迫换货、换方案

整理 | 燕珊 据 The Information 最新报道,英伟达下一代 Blackwell 芯片在高密度服务器机架中出现严重过热问题,导致设计变更和客户方面的部署延迟。这让 G...
阅读原文

网易CodeWave:当低代码+AIGC 进入深水区,我们如何继续发展?

作者 |网易 CodeWave 团队 何少甫、赵雨森、姜天意 低代码 +AIGC 在很多人眼里貌似是一个很“新”的领域,怎么就深水区了?去年在同样的时间点,我们规划并上线...
阅读原文
1234483