标签:模型

中科院张家俊团队最新综述,谈大模型研究的新领域:多模型协作

夕小瑶科技说 原创作者 | Richard“没有什么是一个大模型不能解决的。如果不能,那就两个!”这并不是一句玩笑话,而是人工智能领域的一个热门趋势。最近,中科...
阅读原文

ICML2024: 华中科大发现大模型具有自我认知

夕小瑶科技说 原创作者 | 谢年年不知道大家是否记得之前传到沸沸扬扬的Bing的 Sydney事件。 起因是一位网友晒出了其与Bing的聊天记录,其中Bing自述自己名叫S...
阅读原文

从零训练一个多模态LLM:预训练+指令微调+对齐+融合多模态+链接外部系统

7月25日上午10点,中国科学技术大学与微软亚洲研究院联合培养博士生张博文将在智猩猩直播讲解微软亚洲研究院开源成果GaussianCube,主题为《结构化3DGS为高质...
阅读原文

大模型风向变了,OpenAI苹果掉头布阵

大模型迈入“小而强”时代。 作者|ZeR0 编辑|漠影 生成式AI似乎有个隐形规律:每隔一段时间,就会上演一场令人瞠目的大型“撞车”事件。 仅是今年,就有谷歌Gemin...
阅读原文

独家丨硅基流动新增两位联创,主打商业化

继两位技术联创后,硅基流动又有两位商业化联创加盟。作者 | 朱可轩 编辑 | 陈彩娴 AI 科技评论独家获悉,AGI 基建赛道明星创企硅基流动近日新增两位联合创始...
阅读原文

科大讯飞将在港投资 4 亿港元,专注大语言模型等开发;英伟达 Mistral AI 联手发布 12B 参数小模型丨AI情报局

01 今日融资快报科大讯飞将在香港投资 4 亿港元,并设立国际总部 科大讯飞公布了一项为期 5 年的 4 亿港元、投资计划,并在香港设立了国际总部。公司表示,这...
阅读原文

苹果开源7B大模型,训练过程数据集一口气全给了,网友:开放得不像苹果

一水 发自 凹非寺量子位 | 公众号 QbitAI苹果最新杀入开源大模型战场,而且比其他公司更开放。 推出7B模型,不仅效果与Llama 3 8B相当,而且一次性开源了全部...
阅读原文

“具身智能小镇”来了!机器人逛超市买菜满街跑,AI充当NPC,来自上海AI Lab

明敏 发自 凹非寺量子位 | 公众号 QbitAI超逼真的机器人小镇来了! 在这里,机器人可以像人一样在超市里购物: 买菜回家做饭: 在办公室里接咖啡(旁边还有人...
阅读原文

电脑平板组AI集群,在家就能跑400B大模型,GitHub狂揽2.5K星​

克雷西 发自 凹非寺量子位 | 公众号 QbitAI不用H100,三台苹果电脑就能带动400B大模型。 背后的功臣,是GitHub上的一个开源分布式AI推理框架,已经斩获了2.5k...
阅读原文

Claude Sonnet 3.5 口碑爆棚!10 倍速开发,“2 个月内用 Rust 从零构建完一款产品”

整理 | 褚杏娟 昨天,技术创始人 lapurita 关于“使用 Claude Sonnet 3.5 实现了 10 倍开发速度”的帖子火了。 “我震惊地发现,原来 Sonnet 3.5 可以让开发速...
阅读原文

大模型在汽车、法律等行业落地,有哪些挑战和机遇?| 直播预告

7 月 22 日晚 20:00 点,InfoQ 联合蔚来汽车、华院计算以及智源研究院等专家,将为您带来一场关于大模型行业落地心得的深度分享,深入探讨大模型技术的最新进...
阅读原文

Google DeepMind 最新研究:搞定这三个任务?人类不行,AI 也不行

撰文 | 赵雅琦前言人工智能(AI)并非完美的推理者,即使是当前大热的语言模型(LMs),也同样会表现出与人类类似的错误倾向,尤其是出现显著的“内容效应”(C...
阅读原文

“安全智能”的背后,Ilya 究竟看到了什么?

作者| 李维 高佳 当 Ilya Sutskever 离开 OpenAI重归大众视野,带着他名为SSI(Safe Superintelligence Inc.)的新公司。 这一举动惊讶之余又在意料之中——Ily...
阅读原文

从空间智能到具身智能,跨维践行Sim2Real AI最高效路径

机器之心发布 机器之心编辑部具身智能狂潮降临的一年多里,物理世界与信息的生产与交互方式发生着革命性变化。 与此同时,一场新的争夺战正悄然打响:各大厂...
阅读原文

盛名一时的BERT哪去了?这个问题的答案昭示了LLM范式的转变

机器之心报道 编辑:Panda编码器模型哪去了?如果 BERT 效果好,那为什么不扩展它?编码器 - 解码器或仅编码器模型怎么样了?在大型语言模型(LLM)领域,现...
阅读原文