标签:模型

谷歌数学版Gemini奥赛难题,堪比人类数学家!

新智元报道编辑:编辑部 【新智元导读】I/O大会上,谷歌Gemini 1.5 Pro一系列更新让开发者们再次沸腾。最新技术报告中,最引人注目的一点是,数学专业版1.5 P...
阅读原文

150B token从头训练,普林斯顿Meta发布完全可微MoE架构Lory

新智元报道编辑:乔杨 好困 【新智元导读】前几天,普林斯顿大学联合Meta在arXiv上发表了他们最新的研究成果——Lory模型,论文提出构建完全可微的MoE模型,是...
阅读原文

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

新智元报道编辑:庸庸乔杨 【新智元导读】 5月14日,开源的大语言模型Falcon 2发布,性能超越Llama 3,消息登上了Hacker News热榜第一。「猎鹰」归来,开源宇...
阅读原文

众包新玩法!LLM竞技场诞生基准测试,严格分离学渣学霸

新智元报道编辑:alan 【新智元导读】最公平的大模型基准测试诞生了!来自LLM竞技场,最接近人类偏好,数据新鲜、速度快、成本低,严格分离学渣和学霸。大模...
阅读原文

国产端侧小模型超越 GPT-4V,「多模态」能力飞升

端侧大模型的解耦难题:是模型适配终端,还是终端适配模型?作者 | 西西 编辑 | 陈彩娴 在刚刚过去的机器人学术顶会 ICRA 2024 上,「具身智能」成为热议,其...
阅读原文

大模型进入「实用」时代!腾讯助力「销冠」量产,5 分钟创建智能助手

机器之心原创 作者:张倩今年年初,英伟达 CEO 黄仁勋因为劝人「别再学习计算机」被送上热搜。但其实,他的原话是「过去,几乎每个人都会告诉你,学习计算机...
阅读原文

Karpathy称赞,从零实现LLaMa3项目爆火,半天1.5k star

机器之心报道 编辑:杜伟、陈萍项目中代码很多很全,值得细读。一个月前,Meta 发布了开源大模型 llama3 系列,在多个关键基准测试中优于业界 SOTA 模型,并...
阅读原文

数据更多更好还是质量更高更好?这项研究能帮你做出选择

机器之心报道 编辑:Panda W当计算预算低时,重复使用高质量数据更好;当不差钱时,使用大量数据更有利。对基础模型进行 scaling 是指使用更多数据、计算和参...
阅读原文

让大模型理解手机屏幕,苹果多模态Ferret-UI用自然语言操控手机

机器之心报道 编辑:陈萍此次,苹果提出的多模态大语言模型(MLLM) Ferret-UI ,专门针对移动用户界面(UI)屏幕的理解进行了优化,其具备引用、定位和推理...
阅读原文

大模型国产化适配2-基于昇腾910使用ChatGLM-6B进行模型推理

直播预告 | 5月23日晚7点,「智猩猩机器人新青年讲座」第6讲正式开讲,论文一作、清华大学在读博士郭旭东将直播讲解《大模型在具身多智能体合作中的研究进展...
阅读原文

另辟蹊径挑战GPT-4o!Meta首发混合模态大模型Chameleon

直播预告 | 5月23日晚7点,「智猩猩机器人新青年讲座」第6讲正式开讲,论文一作、清华大学在读博士郭旭东将直播讲解《大模型在具身多智能体合作中的研究进展...
阅读原文

Kimi开启付费了,你还会陪它一起登月吗?

直播预告 | 5月23日晚7点,「智猩猩机器人新青年讲座」第6讲正式开讲,论文一作、清华大学在读博士郭旭东将直播讲解《大模型在具身多智能体合作中的研究进展...
阅读原文

首个中文原生DiT架构,已开源!大模型Hunyuan-DiT技术报告详解

直播预告 | 5月23日晚7点,「智猩猩机器人新青年讲座」第6讲正式开讲,论文一作、清华大学在读博士郭旭东将直播讲解《大模型在具身多智能体合作中的研究进展...
阅读原文

万字实录:投钱、烧钱与赚钱,五位AI大咖的不同AI观|甲子光年

五个鲜明而极致角色之间的排列组合,映射了今天AI行业最受关注的话题。今天谈到AI,大共识已经形成:AI是未来。 但也有很多认知没有收敛:AI基础模型技术是否...
阅读原文

OpenAI 联创 Ilya 离职曝光;微软中国AI团队集体打包去美国?最新回应;华为回应大模型发布会演示造假 | AI周报

整理 | 傅宇琪、褚杏娟 Ilya 离开 OpenAI 内幕曝光:奥特曼砍他团队算力,优先搞产品赚钱,离职吐槽就要失去股权;李彦宏:百度云实现盈利,PC、电动汽车加入...
阅读原文