标签：视觉

计算机视觉的十年：深度学习带来变革，经典元素仍主导特定挑战

大数据文摘出品编译：文摘菌近些年来，计算机视觉（CV）的发展势如破竹，渗透到了我们生活的方方面面。对于大众而言，这可能像是一项新鲜且令人兴奋的科技创...

阅读原文

AIGC动态

3年前 (2023)

大语言模型击败扩散模型！视频图像生成双SOTA，谷歌CMU最新研究，一作北大校友

白交发自凹非寺量子位 | 公众号 QbitAI语言模型击败扩散模型，在视频和图像生成上实现双SOTA！这是来自谷歌CMU最新研究成果。据介绍，这是语言模型第一次在...

阅读原文

AIGC动态

3年前 (2023)

美图视觉大模型 3.0：让设计师做甲方

AI工作流提效之战正式开启。作者丨郭思编辑丨陈彩娴ChatGPT之前，国内最近一次的AI热潮是以“AI四小龙”的发展为代表，但这些公司烧钱程度与落地产出的不匹配，...

阅读原文

AIGC动态

3年前 (2023)

在图像、视频生成上，语言模型首次击败扩散模型，tokenizer是关键

机器之心报道编辑：张倩、陈萍为什么语言模型在视觉生成方面落后于扩散模型？来自谷歌、CMU 的研究表明，tokenizer 是关键。大型语言模型（LLM 或 LM）一开始...

阅读原文

AIGC动态

3年前 (2023)

挑战GPT-4V！清华唐杰&智谱开源多模态14边形战士，在线可玩

梦晨发自凹非寺量子位 | 公众号 QbitAI看看这张图中有几个房子？如果你回答3个，就和GPT-4V的答案一样。但是最新开源的国产多模态模型CogVLM-17B，就能看出...

阅读原文

AIGC动态

3年前 (2023)

美图秀秀上车最新自研大模型，各类AIGC玩法可直接体验

明敏发自厦门量子位 | 公众号 QbitAI美图自研大模型3.0，正式发布！并且全面应用于美图旗下影像与设计产品。这是自美图大模型面世100天后的最新迭代。相较...

阅读原文

AIGC动态

3年前 (2023)

野心勃勃的MiniGPT-5出现了！Token变Voken，支持图文交叉生成

夕小瑶科技说分享来源 | 机器之心大模型正在实现语言和视觉的跨越，有望无缝地理解和生成文本和图像内容。在最近的一系列研究中，多模态特征集成不仅是一种...

阅读原文

AIGC动态

3年前 (2023)

前百度高管接手AWS大中华区；英伟达取消AI峰会；华为剧透小艺语音转写功能丨AIGC大事日报

10/09全球AIGC产业要闻1、谷歌前高管出任微软副总裁主攻AIGC2、英伟达宣布取消原定下周的以色列AI峰会3、百度前副总裁出任亚马逊云科技大中华区负责人4、百...

阅读原文

AIGC动态

3年前 (2023)

美图自研视觉大模型3.0发布！能“脑补”生图和精准修图，100天全面进化

迈向AI视觉大模型的未来：万物皆可生成。作者|ZeR0编辑|漠影智东西10月9日报道，今日下午，美图自研AI视觉大模型MiracleVision（奇想智能）3.0版本发布，并将...

阅读原文

AIGC动态

3年前 (2023)

统一图像和文字生成的MiniGPT-5来了：Token变Voken，模型不仅能续写，还会自动配图了

机器之心报道机器之心编辑部OpenAI 的 GPT-5 大模型似乎还遥遥无期，但已经有研究者率先推出了创新视觉与语言交叉生成的模型 MiniGPT-5。这对于生成具有连贯...

阅读原文

AIGC动态

3年前 (2023)

正面硬刚GPT-4V！浙大校友开源多模态大模型LLaVA-1.5，130亿参数8个A100一天训完

新智元报道编辑：Aeneas 好困【新智元导读】GPT-4V风头正盛，LLaVA-1.5就来踢馆了！它不仅在11个基准测试上都实现了SOTA，而且13B模型的训练，只用8个A100就...

阅读原文

AIGC动态

3年前 (2023)

微软发布多模态大模型GPT-4V使用指南，长达166页，一文速览

夕小瑶科技说分享来源 | 机器之心作者 | 陈萍、张倩一周之前，ChatGPT迎来重大更新，不管是 GPT-4 还是 GPT-3.5 模型，都可以基于图像进行分析和对话。与之...

阅读原文

AIGC动态

3年前 (2023)

鼠鼠我呀，也有VR头显了！康奈尔给小鼠开颅，沉浸式研究大脑和行为

新智元报道编辑：Aeneas【新智元导读】最近，康奈尔大学的研究者们，给老鼠也戴上VR头显了。虽然拥有了VR体验，但鼠鼠们也付出了一些代价——比如，需要提前做...

阅读原文

AIGC动态

3年前 (2023)

ICCV'23论文颁奖“神仙打架”！Meta分割一切和ControlNet共同入选，还有一篇让评委们很惊讶

克雷西萧箫发自凹非寺量子位 | 公众号 QbitAI刚刚，计算机视觉巅峰大会ICCV 2023，在法国巴黎正式“开奖”！今年的最佳论文奖，简直是“神仙打架”。例如，获...

阅读原文

AIGC动态

3年前 (2023)

微软最新166页测评报告：视觉模态GPT-4V到底有多强？

本文来源：机器之心一周之前，ChatGPT 迎来重大更新，不管是 GPT-4 还是 GPT-3.5 模型，都可以基于图像进行分析和对话。与之对应的，多模态版 GPT-4V 模型相...

阅读原文

AIGC动态

3年前 (2023)

1…16 171819 20