多模态12B参数模型,结合视觉编码器处理图像和文本。
先进的多模态理解模型,融合视觉与语言能力。
先进的大型混合专家视觉语言模型
多模态大型语言模型,提升视觉和语言的综合理解能力
多模态大型语言模型,提升视觉与语言的交互能力。