标签:模型

大模型的新战场

大数据文摘受权转载自定焦(dingjiaoone)作者 | 温故编辑 | 方展博9月5日一早,北京国贸大厦,这座北京CBD核心区曾经的最高楼,A座一层入口处挤满了人。两位...
阅读原文

Falcon 180B 开源影响了谁?

中国开源是需要一些理想主义在其中的。作者丨张 进编辑丨陈彩娴近日,TII研究中心推出的开源大模型Falcon 180B一经发布,便被认为是当前最好的开源大模型。原...
阅读原文

英伟达新王者登场!GH200超级芯片碾压H100,性能飙升17%!

夕小瑶科技说 分享来源 | 新智元继4月份加入LLM训练测试后,MLPerf再次迎来重磅更新!刚刚,MLCommons发布了MLPerf v3.1版本更新,并加入了两个全新基准:LLM...
阅读原文

李云龙、谢耳朵专业陪聊!ChatHaruhi爆火:支持32个中外角色,开源5.4万条对话数据

夕小瑶科技说 分享来源 | 新智元作者 | LRS「角色扮演」是大型语言模型众多应用场景中比较有意思的,LLM可以用指定角色的口吻跟用户对话,还可以实现诸如「乔...
阅读原文

马毅教授新作:白盒ViT成功实现「分割涌现」,经验深度学即将结束?

新智元报道编辑:LRS【新智元导读】CRATE模型完全由理论指导设计,仅用自监督学习即可实现分割语义涌现。基于Transformer的视觉基础模型在各种下游任务,如分...
阅读原文

想让大模型在prompt中学习更多示例,这种方法能让你输入更多字符

机器之心报道编辑:Panda W我们知道在使用 GPT 和 LLaMA 等大型语言模型时,输入的 prompt 存在字符数限制,比如 ChatGPT 目前的输入字符限制是 4096 个字符...
阅读原文

蚂蚁集团保险科技探索与实践:AI新科技重塑保险服务,带来行业新体验

机器之心发布机器之心编辑部保险行业对于社会民生和国民经济的重要性不言而喻,其作为风险管理工具,为人民群众提供保障和福利,推动经济的稳定和可持续发展...
阅读原文

10人俩月搞出大模型!一年16篇顶会论文加持:市面上做得好的都没有开源

衡宇 发自 凹非寺量子位 | 公众号 QbitAI一家今年5月份成立在深圳的公司,团队至今不到10人。他们要做的却不是小事:挑战AGI。底气在哪?一看过往履历,二看...
阅读原文

智源:70万预算从头开发千亿参数大模型,挑战成功

克雷西 发自 凹非寺量子位 | 公众号 QbitAI预算10万美元(约73万人民币),从头训练一个全新的千亿参数大模型。智源研究院与国内多所高校及南洋理工联合团队...
阅读原文

Google 基于 GNN 开发气味识别 AI,工作量相当于人类评价员连续工作 70 年

:By 超神经内容一览:气味总是萦绕我们身边。然而,我们却很难对气味准确描述。最近,Google Research 的子公司 Osom 基于图神经网络,开发了气味分析 AI。...
阅读原文

大模型如何可解释?新泽西理工学院等最新《大型语言模型可解释性》综述

来源:专知大型语言模型(LLMs)在自然语言处理方面展示了令人印象深刻的能力。然而,它们的内部机制仍然不清楚,这种不透明性对下游应用带来了不希望的风险...
阅读原文

MIT研究人员将Transformer与图神经网络结合,用于设计全新蛋白质

将 ScienceAI设为星标第一时间掌握新鲜的 AI for Science 资讯编辑 | 萝卜皮凭借其复杂的排列和动态功能,蛋白质通过采用简单构建块的独特排列(其中几何形状...
阅读原文

英伟达GH200芯片刷榜MLPerf;阿里首提AI驱动为战略重心;Dojo或为特斯拉带来6000亿美元增长丨AIGC大事日报

09/12全球AIGC产业要闻1、英伟达GH200芯片在MLPerf新测试中表现最佳2、英伟达的AI芯片主导地位或使芯片创企融资困难3、微软发布13亿参数phi-1.5 多步骤处理表...
阅读原文

9.12丨AIGC大事日报

09/12全球AIGC产业要闻1、英伟达GH200芯片在MLPerf新测试中表现最佳2、英伟达的AI芯片主导地位或使芯片创企融资困难3、微软发布13亿参数phi-1.5 多步骤处理表...
阅读原文

扒一扒腾讯混元大模型“老底”

鱼羊 萧箫 发自 凹非寺量子位 | 公众号 QbitAI腾讯自研混元通用大模型,终于正式在腾讯全球数字生态大会上亮相。模型亮相的同时,腾讯还宣布几大腾讯业务就已...
阅读原文