AIGC动态欢迎阅读
原标题:超越 GPT-4V 和 Gemini Pro!HyperGAI 发布最新多模态大模型 HPT,已开源
关键字:模型,视觉,示例,基准,语言
文章来源:夕小瑶科技说
内容字数:5356字
内容摘要:
夕小瑶科技说 原创作者 | 任同学随着AI从有限数据迈向真实世界,极速增长的数据规模不仅赋予了模型令人惊喜的能力,也给多模态模型提供了更多的可能性。OpenAI在发布GPT-4V时就已经明确表示:
将额外模态(如图像输入)融入大语言模型(LLMs)被认为是 AI 研究和发展的一个关键新领域。
昨天,HyperGAI 研究团队推出了 HPT(Hyper-Pretrained Transformers)系列,包含两个模型,HPT Air 和 HPT Pro。
其中HPT Pro 在部分基准测试中已经超越了 GPT-4V 和 Gemini Pro 的表现。同时,高效的版本 HPT Air 也相当强大,在同等小规模的模型中效果达到了最优,且已经开源。
图1.HPT(Hyper-Pretrained Transformers)模型结构的介绍。
项目地址:
Github: https://github.com/hyperGAI/HPT
huggingface: https://huggingface.co/HyperGAI/HPT
过去模型只处理单一类型的数据,如文本、图像或者音频,往往单一模态下
原文链接:超越 GPT-4V 和 Gemini Pro!HyperGAI 发布最新多模态大模型 HPT,已开源
联系作者
文章来源:夕小瑶科技说
作者微信:xixiaoyaoQAQ
作者简介:更快的AI前沿,更深的行业洞见。聚集25万AI一线开发者、互联网中高管和机构投资人。一线作者来自清北、国内外顶级AI实验室和大厂,兼备行业嗅觉与报道深度。