标签:模型
纯国产万卡集群炼出万亿参数大模型,被这家央企率先做到了!
金磊 发自 凹非寺量子位 | 公众号 QbitAI首个由万卡集群训练出来的万亿参数大模型,被一家央企解锁了。 具体而言,为纯国产人工智能探索出这条路的正是中国电...
非Transformer架构新模型爆火,从第一性原理出发,MIT CSAIL衍生团队打造
西风 发自 凹非寺量子位 | 公众号 QbitAI挑战Transformer,MIT初创团队推出LFM(Liquid Foundation Model)新架构模型爆火。 LFM 1.3B、LFM 3B两个不同大小的...
沈向洋:我对大模型时代的十个思考
来源:新基石科学基金会 导语:2024年9月28日,南方科技大学、腾讯可持续社会价值事业部、新基石科学基金会联合主办第四届“青年科学家50²论坛”。香港科技大学...
OpenAI 的“愚蠢”把戏,已经把大型科技企业“彻底毒害”了
作者丨 Edward Zitron 译者丨明知山 策划丨褚杏娟 “OpenAI 匆忙推出 o1 模型(一个大型、愚蠢的把戏)、有关未来 OpenAI 模型价格上涨的传闻、Scale AI 的裁...
MIT系初创打破Transformer霸权!液体基础模型刷新SOTA,非GPT架构首次显著超越Transformer
新智元报道编辑:Aeneas 好困 【新智元导读】就在刚刚,MIT系初创公司Liquid AI推出液体基础模型LFM,1B模型在基准测试中成为SOTA,这是非GPT架构首次显著超...
给机器人装上「虫脑」?非Transformer液态神经网络终于来了!MIT CSAIL负责人创业成果
机器之心报道 机器之心编辑部一个受线虫启发的全新架构,三大「杯型」均能实现 SOTA 性能,资源高度受限环境也能部署。移动机器人可能更需要一个虫子的大脑。...
手把手教你部署端侧大模型,10月26日相约上海
机器之心报道 机器之心编辑部历经 2023 年的「百模大战」,AI 正在各行业领域沉淀、落地。科技巨头们的比拼焦点正在从把模型越做越大,转向端侧大模型的研发...
280页PDF,全方位评估OpenAI o1,Leetcode刷题准确率竟这么高
机器之心报道 编辑:张倩计算机科学、数学、自然科学、医学、语言学、社会科学……OpenAI o1擅长什么?还有哪些不足?OpenAI 的 o1-preview 模型已经发布两周了...
一手训练,多手应用:国防科大提出灵巧手抓取策略迁移新方案
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
AI教育应用落地的首枪终于打响,但扣动扳机的居然不是GPT?
GPT做不到的,国内垂直教育大模型可以了! 作者|三北 编辑|漠影 9月19日13:05,在去云栖大会的车上,杨仁斌很紧张。他是AI教育公司精准学集团的CEO,也是本次...
联想集团首席研究员颜毅强:面向大模型的个人计算体系和交互创新
10月11日下午,GTIC 2024中国AI PC创新峰会将在上海正式举行。 峰会由智一科技旗下智能产业第一媒体「智东西」、AI与硬科技知识分享社区「智猩猩」共同主办,...
学术前沿 | 进步对齐:让AI跟上人类道德的脚步
来源:北京大学人工智能研究院 供稿:邱天异 排版:梁文凯玥AI引发的价值锁定与进步对齐的定义随着AI技术的发展,AI系统已经开始在多个领域对人类的观念和价...
HPC 2024:上半年建 140 个智算中心,但实际需求正萎缩
超算与智算正在加速融合。作者|朱可轩 编辑|陈彩娴 9 月 24 日至 26 日,第 20 届 CCF 全国高性能计算学术年会(CCF HPC China 2024)在武汉市中国光谷科技...
OpenAI CFO 称高管离职不影响公司前景;智谱再掀价格战,所有模型 1 折调用;雇佣专家训练大模型成新生意丨AI情报局
01 要闻提示OpenAI CFO 安抚投资者:高管离职不影响公司前景 本科生已不够,AI公司雇佣各领域专家训练大模型 AI独角兽特斯联赴港IPO:估值超200亿 神秘“蓝莓”...
图解大模型训练之:数据并行上篇(DP, DDP与ZeRO)
GTIC 2024中国AI PC创新峰会将于10月11日,在2024上海国际消费电子展TechG同期举办。联想集团首席研究员颜毅强、荣耀终端有限公司PC产品研发系统部部长席迎军...