标签:数据
每个问题的答案都是贝叶斯模型比较,假设竞争
来源:CreateAMind Bayesian model reduction https://arxiv.org/pdf/1805.07092.pdf 具身智能系列文章 事实上,人们常说,每个问题的答案都是贝叶斯模型比较...
大模型对齐阶段的Scaling Laws
大数据文摘受权转载自李rumor 随着过去一年大模型技术的发展,数据、模型尺寸scale up后的能力已经不容置疑,scaling law也被越来越多研究者重视起来。在预训...
告别微软,姜大昕带领这支精英团队攀登Scaling Law,万亿参数模型已有预览版
机器之心原创 作者:张倩攀登 Scaling Law,打造万亿参数大模型,前微软 NLP 大牛姜大昕披露创业路线图。前段时间,OpenAI 科学家 Jason Wei 的一份作息时间...
ICLR 2024 | 鸡生蛋蛋生鸡?再论生成数据能否帮助模型训练
机器之心专栏 机器之心编辑部随着生成模型(如 ChatGPT、扩散模型)飞速发展,一方面,生成数据质量越来越高,到了以假乱真的程度;另一方面,随着模型越来越...
基于 7 大城市实景数据,清华大学团队开源 GPD 模型
作者:李宝珠 编辑:三羊 清华大学电子工程系城市科学与计算研究中心提出 GPD 模型,利用扩散模型生成神经网络参数,将时空少样本学习转变为扩散模型的预训练...
融合RL与LLM思想,探寻世界模型以迈向AGI「中·下篇」
本篇文章与2023年底尝试挖掘并探寻以chatGPT为代表的LLM和以AlphaGO/AlphaZero及当下AlphaDev为代表的RL思想的背后底层理论及形式上的统一,同时与最近OpenAI...
暴跑六天也不累,她说诀窍是「打工人」心态
在最极端 的挑战中 感受自由晚上的时候,因为我近视眼,我看所有东西都觉得像个人,在和你交流。或者你看的时候看花了眼,它就变成新的一种雕塑,觉得这个场...
何恺明重提十年之争——模型表现好是源于能力提升还是捕获数据集偏置?
智猩猩与智东西将于4月18-19日在北京共同举办2024中国生成式AI大会,阿里巴巴通义千问大模型技术负责人周畅,「清华系Sora」生数科技CEO唐家渝,云天励飞“云...
AI成足球比赛「关键先生」:DeepMind发布TacticAI,战术布局实用性高达90%
大数据文摘授权转载自HyperAI超神经 作者:十九 编辑:李宝珠,三羊 在刚刚结束的世界杯预选赛中,国足在天津主场以 4:1 的得分大胜新加坡,一扫上一场在领先...
大模型生成的下一个范式:从“能说会道”到贯通行业
从单一文字到“X”的跃迁,开启大模型落地新纪元。 作者|程茜 编辑|漠影 行业需要怎样的大模型能力? 目前,大语言模型的生成、理解能力目前大多以文字为载体,...
Sora 的算力困局:如果正式推出,可能需要 72 万张 H100
在上个月推出视频生成模型 Sora 后,就在昨天,OpenAI 又发布了一系列创意工作者借助 Sora 进行的创作,效果极为惊艳。毫无疑问,就生成质量,Sora 是迄今为...
基础模型、长文本、数据库、应用落地:读懂大模型行业的关键问题
3 月 23 日-24 日,聚焦全球开发者精英,由上海市人工智能行业协会(SAIA)主办的 2024 全球开发者先锋大会(2024 GDC)在上海举办。 这场大会是中国大模型公...
只要千元级,人人可用百亿级多模态大模型!国产「AI模盒」秒级训练推理
新智元报道编辑:编辑部 【新智元导读】从今天起,千元级就能解锁专属大模型了!这款搭载首颗纯国产14nm Chiplet大模型推理芯片的「深目」AI模盒,可以轻松实...
大佬出走后首个发布!Stability官宣代码模型Stable Code Instruct 3B
新智元报道编辑:alan 好困 【新智元导读】Stability AI在大佬出走后似乎并未受到影响,最近又官宣了新的代码模型Stable Code Instruct 3B,在之前的基础上更...