标签:模型
180B参数的Falcon登顶Hugging Face,超越Llama 2 ,自称当前最好开源大模型
夕小瑶科技说 分享来源 | 新智元作者 | 桃子一夜之间,世界最强开源大模型Falcon 180B引爆全网!1800亿参数,Falcon在3.5万亿token完成训练,直接登顶Hugging...
苹果日砸百万,挖角谷歌,Apple GPT研发大提速。Siri即将迎来革命性升级!
夕小瑶科技说 分享来源 | 新智元作者 | Aeneas 好困苹果急了?据The Information报道,为了加速开发LLM,苹果现在不仅大幅增加了研究经费——每天烧掉数百万美...
腾讯混元大模型正式亮相,我们抢先试了试它的生产力
机器之心报道作者:泽南腾讯这个重量级玩家终于出手了。上个星期,国内首批大模型备案获批,开始面向全社会开放服务,大模型正式进入了规模应用的新阶段。在...
LLaMA微调显存需求减半,清华提出4比特优化器
机器之心专栏作者:李炳睿大模型的训练和微调对显存要求很高,优化器状态是显存主要开销之一。近日,清华大学朱军、陈键飞团队提出了用于神经网络训练的 4 比...
“OpenAI春晚”定档11.6;蚂蚁将发纯自研大模型;苹果每天投数百万美元做AI丨AIGC大事日报
09/08全球AIGC产业要闻1、OpenAI首届开发者大会定档11月6日2、OpenAI CEO:人类可能在2030年之前开发出AGI3、苹果AI预算扩大至每天数百万美元4、谷歌将限制选...
苹果 5G 自研基带曝光,iPhone 信号或改善 / 瑞幸将再向茅台采购飞天茅台酒 / 腾讯混元大模型上线
📶苹果计划于 2025 年推出自研 5G 基带🤖蚂蚁集团井贤栋:自研大模型进展将于 9 月 8 日发布📲中国移动辟谣将停售新版 iPhone📱高通 CEO:AI 或将给智能手机带来...
在线研讨会预告!主讲 NVIDIA AI 气象预测模型 FourCastNet 与 InfiniBand 网络计算技术
天气预报是我们日常生活中不可或缺的一项服务。然而要实现精准的天气预报并非易事,它需要处理海量的观测数据,运用复杂的物理模型和数值方法,消耗大量的计...
“OpenAI春晚”定档11.6;蚂蚁将发纯自研大模型;苹果每天投数百万美元做AI
09/07全球AIGC产业要闻1、OpenAI首届开发者大会定档11月6日2、OpenAI CEO:人类可能在2030年之前开发出AGI3、苹果AI预算扩大至每天数百万美元4、谷歌将限制选...
百川智能开源最新商用大模型!王小川:比LLaMA更香,下一枪打ChatGPT
衡宇 发自 凹非寺量子位 | 公众号 QbitAI我们现在可以获得比LLaMA更友好,且能力更强的开源模型。这次在发布会现场表达出“遥遥领先”之意的,是百川智能CEO王...
这一次,大模型颠覆广告行业!
梦晨 鱼羊 发自 凹非寺量子位 | 公众号 QbitAI百度用大模型重构一切,包括现金奶牛业务。就在刚刚,百度营销官宣接入文心一言,推出新一代营销平台轻舸,也是...
沙龙招募|探讨AIGC大模型领军团队养成方法论
量子位智库 发自 凹非寺量子位 | 公众号 QbitAIChatGPT和各类大模型的陆续问世,点燃了国内创业者们的激情。在这一轮大模型热潮中,「人才」成为各大科技公司...
一手实测腾讯混元大模型:重逻辑降幻觉,鹅厂自家应用已加持
鱼羊 萧箫 发自 凹非寺量子位 | 公众号 QbitAI鹅厂的通用大模型,终于来了!就在今天,腾讯千亿参数大模型混元正式亮相,号称全自研,具备3大特点:中文创作...
混元大模型姗姗来迟,腾讯为什么不着急?|甲子光年
腾讯混元大模型体验手记。作者|武静静编辑|赵健9月7日,在一年一度的腾讯全球数字生态大会上,腾讯自研的通用大语言模型——混元大模型正式亮相。腾讯集团高...
百川智能发布Baichuan2,王小川:中国企业用LLaMA2的时代过去了|甲子光年
百川智能的又一座里程碑。作者|刘杨楠编辑|栗子王小川又发大模型了。自今年4月成立以来,王小川新公司百川智能便保持着极快的发展节奏。6月开始,百川...
腾讯混元大模型亮相!实测上手,对话腾讯副总裁蒋杰
实测腾讯混元大模型:不止于聊天,四大能力狙击行业痛点。作者|三北编辑|漠影“今天我们非常高兴地告诉大家,腾讯自主研发通用大模型混元正式向产业亮相。”腾...