标签:语言

图像AI那么耗算力,问题出在 RGB 格式上?

Hello,大家好,我是 JioNLP。 最近一直在想一个问题。为什么我们的图像 AI 模型那么耗算力?比如,现在多模态图文理解 AI 模型本地化部署一个节点,动不动就...
阅读原文

曝 OpenAI 神秘模型「草莓」秋季推出,ChatGPT 或迎来今年最重大升级

OpenAI 传说中的「Strawberry(草莓)」模型终于要来了。 据外媒 The Information 报道,随着 OpenAI 不断筹集更多资金,其研究人员正在尝试推出一款新的 AI ...
阅读原文

面向边缘端大语言模型的RPP架构芯片与落地实践 | 演讲预告

生成式AI时代,大模型及AIGC的快速发展推动着计算需求的高速增长。 从服务器到边缘,再到AI手机、AI PC、AIoT、智能汽车,各个领域的AI芯片玩家都面临着新的...
阅读原文

如何提升大模型推理能力

来源:清熙 一.大模型的推理能力 现在的大模型是茶壶里煮饺子,从预训练中学习了很多,但简单粗暴的采样推理的方式却限制了它的能力输出。 正如在降低大模型...
阅读原文

统一transformer与diffusion!Meta融合新方法剑指下一代多模态王者

机器之心报道 编辑:陈陈本文引入了 Transfusion,这是一种可以在离散和连续数据上训练多模态模型的方法。一般来说,多模态生成模型需要能够感知、处理和生成...
阅读原文

三个程序员奋战三天重写推理堆栈,Grok-2 mini直接提速两倍,马斯克亲发贺电

机器之心报道 机器之心编辑部一直在用 Grok-2 的用户可能察觉到,这两天,它好像变快了:上周,xAI 发布了 Grok-2 聊天机器人,并在 X 平台上以每月 8 美元的...
阅读原文

李沐:大模型发展趋势与个人职业选择

生成式AI时代最火AI芯片峰会下月来袭!9月6-7日,智猩猩发起主办的2024全球AI芯片峰会将在北京盛大举行。峰会设有开幕式、数据中心AI芯片专场、边缘/端侧AI芯...
阅读原文

《黑神话:悟空》的第二个受害者出现了,竟是AI搜索惹的祸!

整理 | 华卫、核子可乐 近日,国产 3A 游戏大作《黑神话:悟空》火爆全网,上线不久便引发全球关注。据国游畅销榜统计的数据,仅仅一日,该游戏在多个平台的...
阅读原文

入选ACL2024主会 | InstructProtein:利用知识指令对齐蛋白质语言与人类语言

作者:梅菜 编辑:十九,李宝珠 浙江大学研究团队提出InstructProtein,利用知识指令对齐蛋白质语言与人类语言,展示了将生物序列整合到大型语言模型的能力。...
阅读原文

世界模型又近了?MIT惊人研究:LLM已模拟现实世界,绝非随机鹦鹉!

新智元报道编辑:编辑部 【新智元导读】MIT CSAIL的研究人员发现,LLM的「内心深处」已经发展出了对现实的模拟,模型对语言和世界的理解,绝不仅仅是简单的「...
阅读原文

DeepMind科学家万字分享:50个AI提效用例详解,工作中我是这么用AI的

文章作者是 DeepMind 的机器学习专家 Nicholas Carlini,不同于别人的介绍 AI 应用实例的文章,这次 Nicholas Carlini 详细讲解了自己在日常中如何使用 ChatG...
阅读原文

DeepMind科学家:LLM没有过度炒作!亲身分享50个AI用例让工作效率飞升50%

新智元报道编辑:庸庸 乔杨 【新智元导读】现存的LLM是否真的有用?在工作中真实使用LLM的场景都有哪些?谷歌DeepMind科学家详细分享了他是如何「玩转」AI,...
阅读原文

从电梯故障到编程新宠,Rust为何连续七年称霸「最受推崇语言」

新智元报道编辑:乔杨 【新智元导读】几十年来,程序员一直用C和C++编写关键系统,现在Rust正逐渐成为这类任务的首选。在StackOverflow每年发布的开发者调查...
阅读原文

入选ACL 2024!实现蛋白质数据与文本信息跨模态解读,中科大王翔团队提出蛋白质-文本生成框架ProtT3

作者:十九 编辑:李宝珠 中国科学技术大学王翔,联合新加坡国立大学刘致远团队、北海道大学研究团队提出了一个全新的蛋白质-文本建模框架 ProtT3,该框架通...
阅读原文

ACL 2024大奖揭晓!全华人团队用AI3000年前甲骨文密码

新智元报道编辑:编辑部 【新智元导读】一年一度NLP顶会ACL揭晓了最终获奖论文。今年,共有7篇论文荣获最佳论文,时间检验奖颁给斯坦福GloVe、康奈尔大学相似...
阅读原文
13456729