标签:文本

语言图像模型大一统!Meta将Transformer和Diffusion融合,多模态AI王者登场

来源:新智元编辑:Aeneas 好困 【导读】就在刚刚,Meta最新发布的Transfusion,能够训练生成文本和图像的统一模型了!完美融合Transformer和扩散领域之后,...
阅读原文

统一transformer与diffusion!Meta融合新方法剑指下一代多模态王者

机器之心报道 编辑:陈陈本文引入了 Transfusion,这是一种可以在离散和连续数据上训练多模态模型的方法。一般来说,多模态生成模型需要能够感知、处理和生成...
阅读原文

ECCV 2024 | 机器遗忘之后,扩散模型真正安全了吗?

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

一句话生成《黑神话:悟空》3D资产,胡渊鸣创业项目Meshy上新,免费试用

机器之心报道 编辑:佳琪、张倩几何更干净、细致,工作流更合理,Meshy的3D生成能力又进化了,所有人都可以免费试用。天命人,你现在已经到哪儿了? 毫无疑问...
阅读原文

Midjourney官宣网页版免费用!前谷歌大佬祭出AI生图2.0,全网惊艳实测

新智元报道编辑:编辑部 【新智元导读】Midjourney一度稳居AI生图的第一梯队,甚至是很多人心中的Top1。但是Ideogram 2.0的发布,抢夺了Midjourney的荣光,不...
阅读原文

难倒了Midjourney和FLux的问题,被它解了!AI生图的终结者杀出来了

夕小瑶科技说 原创作者 | 海野Ideogram,一个一年前发布的AI生图模型,在生成图片领域一直不温不火,甚至大有要被遗忘的趋势。 但就在昨晚,Ideogram重磅推出...
阅读原文

Ideogram 发布 2.0,效果优于 Midjourney 和 DALL-E

点击上方蓝字关注我们Idogram AI 于周三推出了其文本到图像模型的下一代——Idogram 2.0,目标是挑战在生成性 AI 领域中已经确立地位的公司。 这一发布紧随 Flu...
阅读原文

LLM大模型:预训练、微调与产品化落地的科普之旅

大数据文摘受权转载自数据派THU 作者:李媛媛 编辑:王菁在人工智能的浩瀚星空中,大型语言模型(Large Language Model,简称LLM)无疑是一颗璀璨的明星。这...
阅读原文

Nature:AI让抄袭问题更加复杂,科学家该如何应对?

新智元报道编辑:庸庸 乔杨 【新智元导读】生成式人工智能在写作中的爆炸性应用让抄袭变得难以界定,引发了学术圈的一场大讨论。从哈佛大学校长因抄袭指控在1...
阅读原文

多篇3D生成顶会成果!斯坦福大学吴佳俊教授团队提出交互式3D世界生成 | 讲座预告

「智猩猩AI新青年讲座」由智猩猩出品,致力于邀请青年学者,主讲他们在生成式AI、LLM、AI Agent、CV等人工智能领域的最新重要研究成果。 AI新青年是加速人工...
阅读原文

别等GPT-4o啦,国产「开源版」GPT-4o 来了!支持全模态、无障碍交流

夕小瑶科技说 原创作者 | 谢年年腾讯最近的多模态进展有点子“一路高歌”,先是腾讯元宝升级了一波多模态能力,就差把GPT-4o从榜一拉下来了。 最近,又搞了一个...
阅读原文

浙江大学发布全能多模态大模型OmniBind,刷榜13大benchmark

夕小瑶科技说 原创作者 | Richard在人工智能快速发展的今天,多模态大模型成为了研究的热点。近日,浙江大学的研究团队在这一领域取得了重大突破,发布了名为...
阅读原文

入选ACL 2024!实现蛋白质数据与文本信息跨模态解读,中科大王翔团队提出蛋白质-文本生成框架ProtT3

作者:十九 编辑:李宝珠 中国科学技术大学王翔,联合新加坡国立大学刘致远团队、北海道大学研究团队提出了一个全新的蛋白质-文本建模框架 ProtT3,该框架通...
阅读原文

清华唐杰团队新作:一口气生成2万字,大模型开卷长输出

明敏 发自 凹非寺量子位 | 公众号 QbitAI一口气生成2万字,大模型输出也卷起来了! 清华&智谱AI最新研究,成功让GLM-4、Llama-3.1输出长度都暴增。 相同...
阅读原文

月之暗面对谈 Zilliz:长文本和 RAG 如何选择?

关于长文本和 RAG 到底如何选择,一直有争论,从基模公司到应用开发者。 今天这篇文章,是来自基模公司月之暗面和中间层 Zilliz 的技术对话,值得一看。 本期...
阅读原文
12345622