标签:数据
突破『逆转诅咒』!新数学推理数据集揭秘,让大语言模型逆向推理能力翻倍
夕小瑶科技说 分享来源 | 机器之心复杂数学推理是评价大语言模型推理能力的重要指标,目前常用的数学推理数据集样本量有限且问题多样性不足,导致大语言模型...
陈丹琦团队新作:5%成本拿下SOTA,“羊驼剪毛”大法火了
梦晨 发自 凹非寺量子位 | 公众号 QbitAI只用3%的计算量、5%的成本取得SOTA,统治了1B-3B规模的开源大模型。这一成果来自普林斯顿陈丹琦团队,名为LLM-Sheari...
城市5000高速3000落地NOH,中国智驾方案成本新低!
贾浩楠 发自 副驾寺智能车参考 | 公众号 AI4Auto自动驾驶圈,竟也卷成这样!3000元,比一次高档汽车贴膜服务,或一个洗车店年卡更便宜…但它是现在最新量产L2+...
Meta再放「长文本」杀器Llama 2-Long:70B尺寸登顶最强「32k上下文」模型,超越ChatGPT
新智元报道编辑:LRS【新智元导读】Llama 2-Long计算量需求比重新训练降低40%,还不影响短任务性能!虽然大型语言模型在处理日常问答、总结文本等任务上表现...
MetaMath:新数学推理语言模型,训练大模型的逆向思维
机器之心专栏机器之心编辑部复杂数学推理是评价大语言模型推理能力的重要指标,目前常用的数学推理数据集样本量有限且问题多样性不足,导致大语言模型存在 [...
AI「鸟口普查」,康奈尔大学利用深度学习分析北美林莺分布
点击上方蓝字,关注我们!By 超神经据世界自然基金会统计,1970-2016 年,全球代表物种种群数量减少了 68%,生物多样性不断下降。保护生物多样性,需要对当地...
TradeMaster最新发布沙盒工具箱,探索量化交易的全新维度
TradeMaster 是由新加坡南洋理工大学开发的一款基于强化学习的开源量化交易平台。为了更全面地评价和提升算法性能,我们推出了沙盒工具箱,同时搭配了易于使...
专题丨国内外数字孪生城市建设的经验及启示
※ 信息社会政策探究的思想库 ※※ 信息通信技术前沿的风向标 ※作者简介易雪琴河南省社会科学院城市与生态文明研究所副研究员,主要从事区域与城市经济等方面的...
OBIA:900+ 患者、193w+ 影像,中科院基因组所发布我国首个生物影像共享数据库
点击上方蓝字,关注我们!By 超神经看病就医,拍片已是常例。CT、核磁、X 光等影像资料可以用非侵入式手段透过人体,使内部器官、组织状况清晰可见,为临床诊...
融资超2亿美元,月之暗面发布超长文本模型产品,目标C端Super-App
国内大模型最神秘的创业公司之一,月之暗面 Moonshot AI 终于发布了第一款模型和产品。这是一家有着很多光环的大模型创业公司,创始人杨植麟曾就职于 FAIR 和...
DeepMind 全新 AI 项目曝光:可控制各类机器人,数据集有望开源
作者|Ben Dickson译者|核子可乐、冬梅DeepMind 的新项目是什么?开发机器人技术的一大挑战,就在于必须投入大量精力来为每台机器人、每项任务和每种环境训...
媲美GPT-4V,仅使用1.2M数据、8个A100,一天内完成训练,LLaVA-1.5刷新11个基准SOTA
机器之心报道编辑:蛋酱、小舟多模态大模型落地的风,最终还是刮了起来。十几天前,OpenAI 为 ChatGPT 添加了图像识别功能,允许用户使用上传一张或多张图像...
最好的7B模型易主,笔记本轻松跑,免费开源可商用,来自“欧洲的OpenAI”
梦晨 发自 凹非寺量子位 | 公众号 QbitAI一个神秘磁力链接,成了开源大模型社区的新宠。里面是来自法国的开源大模型Mistral-7B,大家试用下来,觉得Llama 2都...
Astronomaly:利用 CNN 和主动学习识别 400 万张星系图像中的异常
点击上方蓝字,关注我们!By 超神经星系中的异常现象是我们了解宇宙的关键。然而,随着天文观测技术的发展,天文数据正以指数级别增长,超出了天文工作者的分...
正面硬刚GPT-4V!浙大校友开源多模态大模型LLaVA-1.5,130亿参数8个A100一天训完
新智元报道编辑:Aeneas 好困【新智元导读】GPT-4V风头正盛,LLaVA-1.5就来踢馆了!它不仅在11个基准测试上都实现了SOTA,而且13B模型的训练,只用8个A100就...