标签:文本

让大模型看图比打字管用!NeurIPS 2023新研究提出多模态查询方法,准确率提升7.8%

转载自 沁园夏量子位 | 公众号 QbitAI大模型“识图”能力都这么强了,为啥还老找错东西?例如,把长得不太像的蝙蝠和拍子搞混,又或是认不出一些数据集中的稀有...
阅读原文

一行代码提高大模型10%性能,开发者:免费午餐

克雷西 发自 凹非寺量子位 | 公众号 QbitAI大模型微调有“免费的午餐”了,只要一行代码就能让性能提升至少10%。在7B参数量的Llama 2上甚至出现了性能翻倍的结...
阅读原文

DALL·E 3关键技术公开!同时向企业版和Plus会员开放

本文来源:量子位出场即炸场的DALL·E 3,又有新动向了!这次直接宣布对ChatGPT Plus和企业版用户开放,还连带公开了更多“官方推荐案例”。不仅如此,OpenAI还...
阅读原文

OpenAI终于Open一回:DALL-E 3论文公布、上线ChatGPT,作者一半是华人

机器之心报道机器之心编辑部打开 ChatGPT 就能用 DALL・E 3 生成图片了,OpenAI 还罕见地发布了一些技术细节。终于,「OpenAI 又 Open 了」。在看到 OpenAI ...
阅读原文

DALL·E 3关键技术公开!19页论文揭秘如何对提示词“唯命是从”

萧箫 发自 凹非寺量子位 | 公众号 QbitAI出场即炸场的DALL·E 3,又有新动向了!这次直接宣布对ChatGPT Plus和企业版用户开放,还连带公开了更多“官方推荐案例...
阅读原文

OpenAI图像检测工具曝光,CTO:AI生成的99%都能认出

丰色 发自 凹非寺量子位 | 公众号 QbitAIOpenAI要出手AI图像识别了。最新消息,他们公司正在开发一种检测工具。根据首席技术官Mira Murat透露:该工具精度非...
阅读原文

精确率提升7.8%!首个多模态开放世界检测大模型MQ-Det登NeurIPS 2023

新智元报道编辑:LRS【新智元导读】MQ-Det在已有基于文本查询的检测大模型基础上,加入了视觉示例查询功能,同时保留了高泛化性能和细粒度多模态查询,在ODin...
阅读原文

超低训练成本文生图模型PixArt来了,效果媲美MJ,只需SD 10%训练时间

机器之心专栏机器之心编辑部训练一个媲美 MJ 的文生图模型,26K 美元就能实现了。当前,最先进的文本到图像(T2I)模型需要大量的训练成本(例如,数百万个 G...
阅读原文

谷歌视觉语言模型PaLI-3问世,参数仅5B,更小、更快、更强

机器之心报道编辑:杜伟、陈萍在多模态(视觉语言)大模型领域,拼参数赢性能的同时,追求参数更小、速度更快、性能更强是另一条研究路径。在大模型时代,视...
阅读原文

谷歌重磅发布 PaLI-3,四两拨千斤!

夕小瑶科技说 原创作者 | 智商掉了一地、ZenMoore视觉语言模型(VLM)的参数规模已经扩展到数百亿,甚至数千亿,这使得其性能持续提升。然而,小规模模型仍然...
阅读原文

开源标杆!最强中英双语大模型来了,340亿参数,超越 Llama2-70B等所有开源模型

金磊 发自 凹非寺量子位 | 公众号 QbitAI开源界最强的中英双语大模型,悟道·天鹰 34B,来了!有多强?一言蔽之:中英综合能力、逻辑推理能力等,全面超越 Lla...
阅读原文

国产大模型开源一哥再登场,最强双语LLM「全家桶」级开源!340亿参数超越Llama2-70B

新智元报道编辑:编辑部【新智元导读】就在刚刚,340亿参数的国产大模型悟道·天鹰Aquila2强势冲上榜首,成为最强开源中英双语大模型。更YYDS的是,这次智源不...
阅读原文

一键读完《三体》!港中文联MITAI遗忘魔咒,2行代码引领超长文本!

夕小瑶科技说 分享来源 | 新智元中途迷失、模型偷懒、上下文越长大模型越笨……体验过LLM的人,多少都会对文本输入长度带来的限制有所感触:想和大模型讨论一些...
阅读原文

AI天才杨植麟交卷大模型产品,特点:长长长长长

衡宇 发自 凹非寺量子位 | 公众号 QbitAI千亿参数大模型,支持输入的长文本首次达20万字!在任何规模的大模型产品化队伍中,这个长度堪称目前的全球最长。用...
阅读原文

支持20万字输入,月之暗面杨植麟:千亿大模型进入“长文本”时代 | 甲子光年

一口气读完一本《三体》。作者|赵健在百模大战当下,谁会是中国的OpenAI?今年6月,科技媒体The Information盘点了中国AI初创企业Top5,分别为MiniMax、澜舟...
阅读原文
11819202122