标签:模型
小扎官宣Code Llama重量级更新,新增70B版本,但还有能力限制
机器之心报道 编辑:蛋酱、陈萍功能更强大的 Code Llama 70B 模型来了。今天,Meta 正式发布 Code Llama 70B,这是 Code Llama 系列有史以来最大、性能最好的...
ICLR 2024|把图像视为外语,快手、北大多模态大模型媲美DALLE-3
机器之心报道 机器之心编辑部动态视觉分词统一图文表示,快手与北大合作提出基座模型 LaVIT 刷榜多模态理解与生成任务。 当前的大型语言模型如 GPT、LLaMA 等...
中文数据让LLM变笨?
事情的起因是知乎上有人针对一篇文章的疑问: 文章链接: https://arxiv.org/abs/2401.10286 题目:Top in Chinese Data Propecessing: English Code Models...
RSS23 Best System Paper提名:基于模型的主动感知机器人强化学习系统|上海交大MVIG吕峻博士主讲
智猩猩是智一科技打造的硬科技讲解与服务平台,关注AI、芯片、算力、智能网联汽车、机器人,提供讲座、公开课、在线研讨会、峰会等线上线下产品。 「机器人新...
百川发布超千亿大模型 Baichuan 3:多项中文任务评测超 GPT-4、中文医疗任务最佳大模型
1 月 29 日,百川智能发布超千亿参数的大模型 Baichuan 3,除了在多个通用能力测试中表现出色,尤其是中文任务超越 GPT-4 以外,这次 Baichuan 3 在专业性要...
OpenAI出手后,GPT-4真的不懒了?网友不买账:只靠打补丁恐怕无济于事!
整理 | 凌敏、核子可乐 大模型会从人类经验中学习,如果人类本身越来越懒,那模仿人类的程序是不是也会越来越懒? OpenAI 发布更新, 解决 GPT-4“变懒”问题 ...
百川智能发布超千亿大模型Baichuan 3,中文评测超越GPT-4
作者 | 褚杏娟 1 月 29 日,百川智能发布超千亿参数的大语言模型 Baichuan 3。 在多个权威通用能力评测如 CMMLU、GAOKAO 和 AGI-Eval 中,Baichuan 3 都展现...
从零手搓MoE大模型,大神级教程来了
克雷西 发自 凹非寺量子位 | 公众号 QbitAI传说中GPT-4的“致胜法宝”——MoE(混合专家)架构,自己也能手搓了! Hugging Face上有一位机器学习大神,分享了如何...
百川智能上新超千亿大模型Baichuan 3,冲榜成绩:若干中文任务超车GPT-4
衡宇 发自 凹非寺量子位 | 公众号 QbitAI走月更路线的百川智能,在年前猛地加速,变成了半月更: 发布了超千亿参数的最新版本大模型Baichuan 3,是百川智能基...
500行代码打造AI搜索引擎!贾扬清周末项目登顶GitHub热榜
梦晨 发自 凹非寺量子位 | 公众号 QbitAI只用500行代码搭出来的AI搜索引擎,登顶GitHub趋势榜。 作者:贾扬清的LeptonAI团队。 Lepton Search耗时一个周末打...
腾讯发表多模态大模型最新综述,从26个主流大模型看多模态效果提升关键方法
夕小瑶科技说 原创作者 | 小戏、Python在大规模语言模型(LLMs)通往通用人工智能(AGI)的道路中,从传统的单一的“语言模态”扩展到“图像”、“语音”等等的“多...
今日arXiv最热NLP大模型论文:伯克利&DeepMind联合研究,RaLMSpec让检索增强LLM速度提升2-7倍!
夕小瑶科技说 原创编辑 | Tscom引言:知识密集型NLP任务中的挑战与RaLM的潜力在知识密集型自然语言处理(NLP)任务中,传统的大语言模型面临着将海量知识编码...
GPT-4准确率最高飙升64%!斯坦福OpenAI重磅研究:全新Meta-Prompting方法让LLM当老板
新智元报道编辑:桃子 好困 【新智元导读】大模型幻觉问题还有另一种解法?斯坦福联手OpenAI研究人员提出「元提示」新方法,能够让大模型成为全能「指挥家」...
美国AI战争再升级,全力阻止中国获得算力!或将禁止中国企业用云计算训模型
新智元报道编辑:Aeneas 【新智元导读】雷蒙多表示,拜登政府要求美国云计算公司确定外国实体是否在利用他们的算力训练AI模型。现在,美国政府在尽全力阻止我...