谷歌被爆正在开发高级版Bard,欲对标 ChatGPT Plus

夕小瑶科技说 原创作者 | 松果、王二狗据 Theverge 报道,谷歌正在开发升级版的 Bard ——名为“Bard Advanced”,且需付费订阅。该消息最早由 Dylan Roussel在推...
阅读原文

“百模大战”诞生各种编程工具,但GPT-4 依然是天花板

作者 | 凌敏 20 世纪 60 年代末出现的“软件危机”揭示了软件开发中的诸多问题,也是在此时,软件工程概念正式诞生。此后,软件工程的发展经历了多个阶段。自...
阅读原文

没有这些事儿,就没有现在的大模型 |2023 AI 热点地图

当我们迈入新年,回顾人工智能领域过去一年的发展,如同翻开了一本丰富多彩的故事集。在这个快速发展的科技纪元,每个月都有着值得关注的里程碑。AI 前线为此...
阅读原文

AI画中国退休老太太微博大火!「傻鹅之王」和快乐小狗挑战GPT-4想象力极限

新智元报道编辑:润 好困 【新智元导读】最近,来自NUS、斯坦福、谷歌DeepMind等机构的研究人员,尝试开发了一个评估人类和AI的创造力的框架。而当人类用尽所...
阅读原文

英伟达中国版RTX 5880发布!性能比旗舰大砍近25%,比RTX 5000只高6%

新智元报道编辑:好困 润 【新智元导读】英伟达公布国区特供版专业级显卡RTX 5880 Ada,性能大砍接近25%,价格未知。去年年底,英伟达正式发布了「减量不减价...
阅读原文

攻克图像「文本生成」难题,碾压同级扩散模型!两代TextDiffuser架构深度解析

新智元报道编辑:LRS 好困 【新智元导读】解决扩散模型「不识字」的问题,Textdiffuser采用两阶段(布局+图像)生成框架,显著提升了相关性能的指标!近年来...
阅读原文

模型A:幸亏有你,我才不得0分,模型B:俺也一样

机器之心报道 机器之心编辑部现在大模型都学会借力了。琳琅满目的乐高积木,通过一块又一块的叠加,可以创造出各种栩栩如生的人物、景观等,不同的乐高作品相...
阅读原文

看见这张图没有,你就照着画:谷歌图像生成AI掌握多模态指令

机器之心报道 编辑:Panda用图 2 的风格画图 1 的猫猫并给它戴上一顶帽子。谷歌新设计的一种图像生成模型已经能做到这一点了!通过引入指令微调技术,多模态...
阅读原文

语言模型是如何感知时间的?「时间向量」了解一下

机器之心报道 编辑:赵阳语言模型究竟是如何感知时间的?如何利用语言模型对时间的感知来更好地控制输出甚至了解我们的大脑?最近,来自华盛顿大学和艾伦人工...
阅读原文

专补大模型短板的RAG有哪些新进展?这篇综述讲明白了

机器之心专栏 机器之心编辑部同济大学王昊奋研究员团队联合复旦大学熊赟教授团队发布检索增强生成(RAG)综述,从核心范式,关键技术到未来发展趋势对 RAG 进...
阅读原文

无需文本标注,TF-T2V把AI量产视频的成本打下来了!华科阿里等联合打造

机器之心专栏 机器之心编辑部在过去短短两年内,随着诸如LAION-5B 等大规模图文数据集的开放,Stable Diffusion、DALL-E 2、ControlNet、Composer ,效果惊人...
阅读原文

大翻车!斯坦福超火机器人自曝,研究者救场还受伤了,网友:放心了

金磊 丰色 发自 凹非寺量子位 | 公众号 QbitAI爆火的斯坦福全能家务机器人Mobile ALOHA,大!翻!!车!!! 你以为它擦个红酒轻而易举,但实际上却是这样的...
阅读原文

一张图500元是目前AIGC最高“回报”?小冰李笛:调用API的商业模式不适用于未来 | MEET 2024

编辑部 发自 凹非寺量子位 | 公众号 QbitAIAIGC在商业界中,最大的一笔回报是多少? 答案可能是:一张图片,500元。 而且这就是发生在最近、号称人工智能著作...
阅读原文

一句话精准视频片段定位!清华新方法拿下SOTA|已开源

陈厚伦 投稿量子位 | 公众号 QbitAI只需一句话描述,就能在一大段视频中定位到对应片段! 比如描述“一个人一边下楼梯一边喝水”,通过视频画面和脚步声的匹配...
阅读原文

连「男妈妈」都有的 emoji,成了价值几千万美元的「呈堂证供」

表情包 也不是 法外之地2023 年火了很多表情包,各个都是精神代言人,我们用「吗喽」感慨打工的卑微,以「水豚」为榜样劝自己平心静气,借「Loopy」抒发想怨...
阅读原文