标签:基准
力压70B Llama 3,Gemma 2成最强开源模型!大佬质疑用榜单prompt微调引全网热议
新智元报道编辑:乔杨 好困 【新智元导读】导读:时隔4个月上新的Gemma 2模型在LMSYS Chatbot Arena的排行上,以27B的参数击败了许多更大规模的模型,甚至超...
一次可输入多张图像,还能多轮对话!最新开源数据集,让AI更接近现实
刘子煜 投稿量子位 | 公众号 QbitAI大模型对话能更接近现实了! 不仅可以最多输入20张图像,还能支持多达27轮对话。可处理文本+图像tokens最多18k。 这就是最...
完全开源!谢赛宁发布最新SOTA多模态模型Cambrian-1,“不与GPT-4V媲美”
夕小瑶科技说 原创作者 | 21# 6月15日,智源大会「多模态大模型」论坛中,纽约大学助理教授谢赛宁从哲学的角度出发,分享了AI是否需要更强的视觉基础来实现理...
LeCun谢赛宁首发全新视觉多模态模型,等效1000张A100干翻GPT-4V
新智元报道编辑:编辑部 【新智元导读】近日,LeCun和谢赛宁等大佬,共同提出了这一种全新的SOTA MLLM——Cambrian-1。开创了以视觉为中心的方法来设计多模态模...
考考大模型视频理解能力,中科院人大百川提出新基准合成框架
VideoNIAH团队 投稿量子位 | 公众号 QbitAI测试Gemini1.5 Pro、GPT-4o等多模态大模型的新基准来了,针对视频理解能力的那种。 直接在视频内容中插入多个无关...
ACL 2024: ChatGPT栽了!数据标注还得靠人类
夕小瑶科技说 原创作者 | 谢年年 人工智能领域苦于数据标注久已,ChatGPT的出现似乎打破了这个僵局。 早在2023年,苏黎世大学一篇论文[1]发现,无论成本还是效...
李沐老师回归B站!带着大模型创业成果填坑来了
西风 发自 凹非寺量子位 | 公众号 QbitAI终于,AI大神李沐回来了!带着他的大模型创业最新成果—— 一个专门为复杂场景角色扮演设计的大模型,名为Higgs-Llama-...
AI训练数据成本高昂,仅剩巨头玩得起!
点击上方蓝字关注我们“随着AI训练数据成本的不断攀升,仅有资金雄厚的科技巨头如谷歌和Meta能够承担。这导致AI发展日益集中化,小型企业和学术机构难以参与竞...
速度秒掉GPT-4o、22B击败Llama 3 70B,Mistral AI开放首个代码模型
机器之心报道 编辑:杜伟、陈萍开放但禁止商用用途。对标 OpenAI 的法国 AI 独角兽 Mistral AI 有了新动作:首个代码大模型 Codestral 诞生了。作为一个专为...
CoT提出者Jason Wei:大模型评估基准的「」
机器之心报道 机器之心编辑部Jason Wei 是思维链提出者,并和 Yi Tay、Jeff Dean 等人合著了关于大模型涌现能力的论文。目前他正在 OpenAI 进行工作。在 CV ...
谷歌数学版Gemini奥赛难题,堪比人类数学家!
新智元报道编辑:编辑部 【新智元导读】I/O大会上,谷歌Gemini 1.5 Pro一系列更新让开发者们再次沸腾。最新技术报告中,最引人注目的一点是,数学专业版1.5 P...
众包新玩法!LLM竞技场诞生基准测试,严格分离学渣学霸
新智元报道编辑:alan 【新智元导读】最公平的大模型基准测试诞生了!来自LLM竞技场,最接近人类偏好,数据新鲜、速度快、成本低,严格分离学渣和学霸。大模...
GPT-4o成为全领域SOTA!基准测试远超Gemini和Claude,多模态功能远超GPT-4
新智元报道编辑:编辑部 【新智元导读】OpenAI半小时的发布会让很多人第一反应是直呼「失望」,但随着官网放出更多demo以及更多网友开始试用,大家才发现GPT-...
谷歌Gemini 1.5技术报告:轻松证明奥数题,Flash版比GPT-4 Turbo快5倍
机器之心报道 编辑:泽南谷歌表示,Gemini 1.5 相比 Claude 3.0和 GPT-4 Turbo 实现了代际提升。 今年 2 月,谷歌上线了多模态大模型 Gemini1.5,通过工程和...
今日arXiv最热CV大模型论文:国产开源视觉大模型InternVL 1.5发布,赶超GPT-4V水准
夕小瑶科技说 原创作者 | 墨墨2023年9月,OpenAI发布了多模态大模型GPT-4V,开启了多模态研究热潮。短短8个月时间内,闭源模型如Gemini系列, Qwen-VL-Max,开...