标签:数据
为什么AI数不清Strawberry里有几个 r?Karpathy:我用表情包给你解释一下
机器之心报道 机器之心编辑部让模型知道自己擅长什么、不擅长什么是一个很重要的问题。还记得这些天大模型被揪出来的低级错误吗? 不知道 9.11 和 9.9 哪个大...
反转了?在一场新较量中,号称替代MLP的KAN只赢一局
机器之心报道 机器之心编辑部KAN 在符号表示中领先,但 MLP 仍是多面手。 多层感知器 (Multi-Layer Perceptrons,MLP) ,也被称为全连接前馈神经网络,是当今...
万亿token!史上最大多模态数据集诞生
机器之心报道 编辑:Panda W开源多模态大模型或将开始腾飞。值此 Llama 3.1 占领各大头条之际,又突然冒出了另一个也非常重要的发布 —— 一个规模空前的开源多...
ECCV 2024|是真看到了,还是以为自己看到了?多模态大模型对文本预训练知识的过度依赖该解决了
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
AI浪潮下的“首届”奥运会!AI员助手、AI裁判员齐上场
大数据文摘授权转载自夕小瑶科技说作者:谷雨龙泽 在璀璨夺目的塞纳河畔、高耸入云的埃菲尔铁塔下,巴黎,即将迎来一场前所未有的体育盛会——第34届夏季奥林匹...
老黄不止卖铲子了:英伟达配合Llama3.1推出定制模型、推理服务
梦晨 发自 凹非寺量子位 | 公众号 QbitAI芯片巨头英伟达,在AI时代一直被类比为在淘金热中“卖铲子”的背后赢家。 现在他不装了,也要亲自下场“挖金矿”: 配合...
智谱 AI 张鹏:「清影」和 Sora 有不少差距,我们在用自己的方式往前追
AI 视频生成赛道又有了新玩家。 7 月 26 日,智谱 AI 发布自家的视频生成产品——智谱清影(Ying),发布即全面上线官网及移动端,所有用户无需预约都能使用,...
三大流派与热点技术!一文看懂小模型与端侧模型
9月6-7日,2024全球AI芯片峰会将在北京召开。目前,AMD人工智能事业部高级总监王宏强,清华大学交叉信息研究院助理教授、北极雄芯创始人马恺声,珠海芯动力创...
GPT-4o mini实榜,限时2个月微调不花钱!每天200万训练token免费薅
新智元报道编辑:桃子 【新智元导读】Llama 3.1 405B巨兽开源的同时,OpenAI又抢了一波风头。从现在起,每天200万训练token免费微调模型,截止到9月23日。Lla...
LLM对齐数据全自动合成!UW华人博士生提出Magpie方法,Macbook Air即可运行
新智元报道编辑:乔杨 【新智元导读】华盛顿大学和Allen AI最近发表的论文提出了一种新颖有趣的数据合成方法。他们发现,充分利用LLM的自回归特性,可以引导...
ICML最佳论文SD3上线公共教程!DreamBench++图像自动评估新基准来了,实现人类偏好深度对齐
近日,ICML 2024 最佳论文公布了!其中就包含年度图像生成的「网红模型」——Stable Diffusion 3(简称 SD3)。SD3 是由 Stability AI 开发的最新文本到图像生...
138 亿美元的 Scale AI:解决正确的问题,做「技术含量最低」的生意
Scale AI 的创始人 8 年前意识到,所有干 AI 的都认为数据至关重要,但没多少人把数据当成主业。 他从 MIT 辍学,创业做数据标注。 2016 年,Alex Wang 成立 ...
Nature 重磅论文:用 AI 生成的数据训练 AI,会让大模型崩溃
文章转载自「新智元」。我们知道,训练大模型需要大量的数据积累,随着技术的发展,高质量数据逐渐成为AI进步的强烈需求。 面对这样的情况下,为了提升模型能...
万字长文,腾讯、清华等多位生物大模型作者专访,畅谈AI生物学,解析大型细胞模型技术
来源:ScienceAI 编辑:KX 大型语言模型(LLM)在自然语言处理和理解领域已取得重大突破。 在生物学领域,一些采用类似 LLM 结构的大型细胞模型(Large Cellu...