AIGC动态欢迎阅读
原标题:多模态大模型线上闭门会:通义实验室/港中文/港科大三位学者主讲ControlLLM、LLaMA-VID和mPLUG-DocOwl
关键字:模型,语言,达摩,视觉,猩猩
文章来源:算法邦
内容字数:5744字
内容摘要:
智猩猩,由智东西公开课升级而来,定位硬科技讲解与服务平台,提供讲座、线上闭门会、公开课、在线研讨会、峰会等线上线下产品。
「线上闭门会」由智猩猩全新企划,将持续邀请行业、领域专家担任出品人共同策划出品,探讨人工智能、自动驾驶领域中的最新技术研究与应用。2023 年可谓是多模态大模型爆发的元年。从OpenAI 的 GPT-4V,到谷歌的 Gemini,再到国内众多机构发布的多模态大模型。大模型的能力已经不仅仅局限于传统的文本输入和输出,通过处理包括文本、图像、音频和视频在内的多种数据类型,使得它能够执行更加复杂和多样化的任务,从而扩展到了图像生成、视频处理、文档处理、语音识别和生成等领域。
多模态大模型是智猩猩重点关注的领域,今年也将持续深入挖掘学术界和工业界在多模态大模型上的研究进展和最新成果。1月17日晚7点,智猩猩推出「多模态大模型线上闭门会」。本次闭门会由阿里巴巴通义实验室 NLP 高级算法专家严明参与出品,并聚焦于大语言模型工具调用 ControlLLM、长视频理解视觉语言模型 LLaMA-VID和多模态文档理解大模型 mPLUG-DocOwl。
出品人严明的主要研究方向为对话
原文链接:多模态大模型线上闭门会:通义实验室/港中文/港科大三位学者主讲ControlLLM、LLaMA-VID和mPLUG-DocOwl
联系作者
文章来源:算法邦
作者微信:allplusai
作者简介:「算法邦」,隶属于智猩猩,关注大模型、生成式AI、计算机视觉三大领域的研究与开发,提供技术文章、讲座、在线研讨会。