标签:模型
告别微软,姜大昕带领这支精英团队攀登Scaling Law,万亿参数模型已有预览版
机器之心原创 作者:张倩攀登 Scaling Law,打造万亿参数大模型,前微软 NLP 大牛姜大昕披露创业路线图。前段时间,OpenAI 科学家 Jason Wei 的一份作息时间...
AI行业买英伟达GPU,花的钱比赚的多17倍
机器之心报道 编辑:泽南、小舟有人却表示「很合理」。搞 AI 大模型,实在太烧钱了。 我们知道,如今的生成式 AI 有很大一部分是资本游戏,科技巨头利用自身...
比LoRA还快50%的微调方法来了!一张3090性能超越全参调优,UIUC联合LMFlow团队提出LISA
机器之心专栏 机器之心编辑部2022 年底,随着 ChatGPT 的爆火,人类正式进入了大模型时代。然而,训练大模型需要的时空消耗依然居高不下,给大模型的普及和发...
最神秘国产大模型团队冒泡,一出手就是万亿参数MoE,两款应用敞开玩
衡宇 艳艳 发自 凹非寺量子位 | 公众号 QbitAI国内基础大模型创业公司,最后一位强实力选手终于正式来到台前。 它就是微软前全球副总裁姜大昕所创办的阶跃星...
大模型实时打《街霸》捉对PK,GPT-4居然不敌3.5,新型Benchmark火了
梦晨 发自 凹非寺量子位 | 公众号 QbitAI让大模型直接操纵格斗游戏《街霸》里的角色,捉对PK,谁更能打? GitHub上一种你没有见过的船新Benchmark火了。 与ll...
0门槛免费商用!孟子3-13B大模型正式开源,万亿token数据训练
白交 发自 凹非寺量子位 | 公众号 QbitAI澜舟科技官宣:孟子3-13B大模型正式开源! 这一主打高性价比的轻量化大模型,面向学术研究完全开放,并支持免费商用...
谷歌狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理训练最快选择
新智元报道编辑:编辑部 【新智元导读】JAX在最近的基准测试中的性能已经不声不响地超过了Pytorch和TensorFlow,也许未来会有更多的大模型诞生在这个平台上。...
基于 7 大城市实景数据,清华大学团队开源 GPD 模型
作者:李宝珠 编辑:三羊 清华大学电子工程系城市科学与计算研究中心提出 GPD 模型,利用扩散模型生成神经网络参数,将时空少样本学习转变为扩散模型的预训练...
宫崎骏看完 AI 制作的动画:强烈感受到对生命的侮辱 | Hunt Good 周报
欢迎收看最新一期的 Hunt Good 周报! 在本期内容你会看到: 5 条新鲜资讯3 个有用工具1 个有趣案例4 个鲜明观点 Hunt for News|先进头条 💰 GPT Store 开启...
融合RL与LLM思想,探寻世界模型以迈向AGI「中·下篇」
本篇文章与2023年底尝试挖掘并探寻以chatGPT为代表的LLM和以AlphaGO/AlphaZero及当下AlphaDev为代表的RL思想的背后底层理论及形式上的统一,同时与最近OpenAI...
知名学者与顶级投资人领衔!视频、3D、音乐生成玩家都来了,中国生成式AI大会嘉宾阵容更新,4月开启!
2024中国生成式AI大会4月18-19日北京举行,报名已进入最后阶段。 自ChatGPT面世以来,生成式AI已加速狂飙16个月,在学术界、产业界、投资界掀起滔天巨浪,冲...
技术共享:类Sora开源架构模型与训练细节 | 尤洋教授GenAICon 2024演讲预告
自ChatGPT面世以来,生成式AI已加速狂飙16个月,在学术界、产业界、投资界掀起滔天巨浪,冲击着千行百业。 AI大模型飞速迭代,创新应用层出不穷。我们正处于...
杨立昆教授在哈佛大学数学系演讲稿-关于人工智能世界新模型
摘要:杨立昆教授在哈佛大学数学系的演讲,概括下来基本是杨立昆一贯的观点,目前自回归LLM重重缺陷(最终输出是概率模型),支持联合嵌入架构,放弃概率模型,...
「大型语言模型评测」综述
来源:专知 大语言模型(LargeLanguageModels,LLMs)在多种自然语言处理(NaturalLanguageProcessing,NLP)任 务中展现出了卓越性能,并为实现通用语言智能提供了...
百亿tokens免费额度,清华系明星AI公司的羊毛薅起来
允中 发自 凹非寺量子位 | 公众号 QbitAI百亿token补贴,4月起免费! 这次的羊毛来自清华系AI公司无问芯穹,企业与个人皆可薅~ 这家公司成立于2023年5月,目...