标签:语言

0.5秒,无需GPU,Stability AI与华人团队VAST开源单图生成3D模型TripoSR

机器之心报道 机器之心编辑部最近,文生视频模型 Sora 掀起了新一轮生成式 AI 模型浪潮,模型的多模态能力引起广泛关注。 现在,AI 模型在 3D 内容生成方面又...
阅读原文

复旦等发布AnyGPT:任意模态输入输出,图像、音乐、文本、语音都支持

机器之心报道 机器之心编辑部最近,OpenAI 的视频生成模型 Sora 爆火,生成式 AI 模型在多模态方面的能力再次引起广泛关注。 现实世界本质上是多模态的,生物...
阅读原文

大视频模型是世界模型?DeepMind/UC伯克利华人一作:预测下一帧就能改变世界

新智元报道编辑:润 好困 【新智元导读】谷歌DeepMind、UC伯克利和MIT的研究人员认为,如果用大语言模型的思路来做大视频模型,能解决很多语言模型不擅长的问...
阅读原文

香港大学发布思维扩散DoT,让思维在时间上扩散,提效保质!

夕小瑶科技说 原创编辑 | Tscom 引言:探索结合扩散模型与思维链来提升大模型推理能力在人工智能领域,大语言模型(LLMs)已经引起了广泛的关注,它们在自然...
阅读原文

白宫发文,呼吁开发者放弃C、C++:Rust被「钦点」内存安全

机器之心报道 编辑:杜伟、小舟近年来,C、C++ 编程语言成了美国官方的「眼中钉」,而内存安全的 Rust 等语言摇身一变成了「新宠」。近日,在一份 19 页的报...
阅读原文

今日arXiv最热NLP大模型论文:中科院发布!针对初学者的大语言模型综述

夕小瑶科技说 原创作者 | 谢年年、Python大语言模型,作为自然语言处理领域火热的方向,如今已经真正“破圈”成为了科技界的明星。特别是其中的佼佼者——ChatGPT...
阅读原文

Mistral 发布全新旗舰 LLM,参与欧洲 GPT-4 的竞争

点击上方蓝字关注我们“Mistral AI发布新会话助手Le Chat及语言模型Mistral Large,与微软合作引入Azure AI。Mistral Large在多任务语言理解基准测试中排名第...
阅读原文

AI芯片黑马一夜爆红:成本推算争议不断,前员工现员工互撕

AI芯片是时候上演新故事了。 作者|ZeR0 编辑|漠影 智东西2月21日报道,在OpenAI推出又一爆款力作AI视频生成模型Sora后,连带着偏上游的AI芯片赛道热度一点即...
阅读原文

GPT-4可能也在用的推测解码是什么?一文综述前世今生和应用情况

机器之心报道 机器之心编辑部推测解码(Speculative Decoding)是谷歌等机构在 2022 年发现的大模型推理加速方法。它可以在不损失生成效果前提下,获得 3 倍...
阅读原文

Pieter Abbeel新工作“大世界模型”:轻松玩转 1 小时长视频,一对一QA视频内容细节

大数据文摘授权转载自AI科技评论 作者:赖文昕 编辑:陈彩娴 自3天前Sora发布以来,由图灵奖得主、Meta首席科学家Yann LeCun提出的“世界模型”又一次引起了广...
阅读原文

Pieter Abbeel 新工作“大世界模型”:轻松玩转 1 小时长视频,一对一 QA 视频内容细节

伯克利发布的“大世界模型”,究竟大在哪里?作者丨赖文昕 编辑丨陈彩娴 自3天前Sora发布以来,由图灵奖得主、Meta首席科学家Yann LeCun提出的“世界模型”又一次...
阅读原文

RNN模型挑战Transformer霸权!1%成本性能比肩Mistral-7B,支持100+种语言全球最多

新智元报道编辑:alan 【新智元导读】大模型内卷时代,也不断有人跳出来挑战Transformer的统治地位,RWKV最新发布的Eagle 7B模型登顶了多语言基准测试,同时...
阅读原文

亚马逊工程师严选,超 40 篇 LLM 论文汇总

作者:Eugene Yan 编辑:李宝珠,三羊 亚马逊工程师 Eugene Yan 等人建立了一个语言模型论文阅读清单,持续分享前沿论文,目前已经汇总了 40 余篇高质量论文...
阅读原文

大型语言模型的模型压缩与高效推理:综述

来源:专知 基于Transformer的大型语言模型取得了巨大成功。然而,在推理过程中产生的显著内存和计算成本,使得在资源受限的设备上部署大型模型变得具有挑战...
阅读原文

PRO | MLLM:下一代自动驾驶的新解法

2023 年,几乎 AI 的每个领域都在以前所未有的速度进化,同时,AI 也在不断地推动着具身智能、自动驾驶等关键赛道的技术边界。 多模态趋势下,Transformer 作...
阅读原文
1141516171829