标签：基准

力压70B Llama 3，Gemma 2成最强开源模型！大佬质疑用榜单prompt微调引全网热议

新智元报道编辑：乔杨好困【新智元导读】导读：时隔4个月上新的Gemma 2模型在LMSYS Chatbot Arena的排行上，以27B的参数击败了许多更大规模的模型，甚至超...

阅读原文

AIGC动态

2年前 (2024)

一次可输入多张图像，还能多轮对话！最新开源数据集，让AI更接近现实

刘子煜投稿量子位 | 公众号 QbitAI大模型对话能更接近现实了！不仅可以最多输入20张图像，还能支持多达27轮对话。可处理文本+图像tokens最多18k。这就是最...

阅读原文

AIGC动态

2年前 (2024)

完全开源！谢赛宁发布最新SOTA多模态模型Cambrian-1，“不与GPT-4V媲美”

夕小瑶科技说原创作者 | 21# 6月15日，智源大会「多模态大模型」论坛中，纽约大学助理教授谢赛宁从哲学的角度出发，分享了AI是否需要更强的视觉基础来实现理...

阅读原文

AIGC动态

2年前 (2024)

LeCun谢赛宁首发全新视觉多模态模型，等效1000张A100干翻GPT-4V

新智元报道编辑：编辑部【新智元导读】近日，LeCun和谢赛宁等大佬，共同提出了这一种全新的SOTA MLLM——Cambrian-1。开创了以视觉为中心的方法来设计多模态模...

阅读原文

AIGC动态

2年前 (2024)

考考大模型视频理解能力，中科院人大百川提出新基准合成框架

VideoNIAH团队投稿量子位 | 公众号 QbitAI测试Gemini1.5 Pro、GPT-4o等多模态大模型的新基准来了，针对视频理解能力的那种。直接在视频内容中插入多个无关...

阅读原文

AIGC动态

2年前 (2024)

ACL 2024: ChatGPT栽了！数据标注还得靠人类

夕小瑶科技说原创作者 | 谢年年人工智能领域苦于数据标注久已，ChatGPT的出现似乎打破了这个僵局。早在2023年,苏黎世大学一篇论文[1]发现，无论成本还是效...

阅读原文

AIGC动态

2年前 (2024)

李沐老师回归B站！带着大模型创业成果填坑来了

西风发自凹非寺量子位 | 公众号 QbitAI终于，AI大神李沐回来了！带着他的大模型创业最新成果—— 一个专门为复杂场景角色扮演设计的大模型，名为Higgs-Llama-...

阅读原文

AIGC动态

2年前 (2024)

AI训练数据成本高昂，仅剩巨头玩得起！

点击上方蓝字关注我们“随着AI训练数据成本的不断攀升，仅有资金雄厚的科技巨头如谷歌和Meta能够承担。这导致AI发展日益集中化，小型企业和学术机构难以参与竞...

阅读原文

AIGC动态

2年前 (2024)

速度秒掉GPT-4o、22B击败Llama 3 70B，Mistral AI开放首个代码模型

机器之心报道编辑：杜伟、陈萍开放但禁止商用用途。对标 OpenAI 的法国 AI 独角兽 Mistral AI 有了新动作：首个代码大模型 Codestral 诞生了。作为一个专为...

阅读原文

AIGC动态

2年前 (2024)

CoT提出者Jason Wei：大模型评估基准的「」

机器之心报道机器之心编辑部Jason Wei 是思维链提出者，并和 Yi Tay、Jeff Dean 等人合著了关于大模型涌现能力的论文。目前他正在 OpenAI 进行工作。在 CV ...

阅读原文

AIGC动态

2年前 (2024)

谷歌数学版Gemini奥赛难题，堪比人类数学家！

新智元报道编辑：编辑部【新智元导读】I/O大会上，谷歌Gemini 1.5 Pro一系列更新让开发者们再次沸腾。最新技术报告中，最引人注目的一点是，数学专业版1.5 P...

阅读原文

AIGC动态

2年前 (2024)

众包新玩法！LLM竞技场诞生基准测试，严格分离学渣学霸

新智元报道编辑：alan 【新智元导读】最公平的大模型基准测试诞生了！来自LLM竞技场，最接近人类偏好，数据新鲜、速度快、成本低，严格分离学渣和学霸。大模...

阅读原文

AIGC动态

2年前 (2024)

GPT-4o成为全领域SOTA！基准测试远超Gemini和Claude，多模态功能远超GPT-4

新智元报道编辑：编辑部【新智元导读】OpenAI半小时的发布会让很多人第一反应是直呼「失望」，但随着官网放出更多demo以及更多网友开始试用，大家才发现GPT-...

阅读原文

AIGC动态

2年前 (2024)

谷歌Gemini 1.5技术报告：轻松证明奥数题，Flash版比GPT-4 Turbo快5倍

机器之心报道编辑：泽南谷歌表示，Gemini 1.5 相比 Claude 3.0和 GPT-4 Turbo 实现了代际提升。今年 2 月，谷歌上线了多模态大模型 Gemini1.5，通过工程和...

阅读原文

AIGC动态

2年前 (2024)

今日arXiv最热CV大模型论文：国产开源视觉大模型InternVL 1.5发布，赶超GPT-4V水准

夕小瑶科技说原创作者 | 墨墨2023年9月，OpenAI发布了多模态大模型GPT-4V，开启了多模态研究热潮。短短8个月时间内，闭源模型如Gemini系列, Qwen-VL-Max，开...

阅读原文

AIGC动态

2年前 (2024)

1…3 456 7…12