标签:模型
Karpathy新视频又火了:从头构建GPT Tokenizer
丰色 鱼羊 发自 凹非寺量子位 | 公众号 QbitAI技术大神卡帕西离职OpenAI以后,营业可谓相当积极啊。 这不,前脚新项目刚上线,后脚全新的教学视频又给大伙整...
运行LIama2得8400万元!最快AI推理芯片成本推算引热议
白交 发自 凹非寺量子位 | 公众号 QbitAI想实现史上最快大模型推理,得要1171万美元(8410万元)??? 同等项目下,使用英伟达GPU成本只需30万美元…… 关于最...
今日arXiv最热NLP大模型论文:微软发布:大模型时代的可解释机器学习,现状与挑战
夕小瑶科技说 原创作者 | 谢年年、Python自深度学习开启了人工智能的黑盒模式,模型的可解释性一直都是专家学者讨论研究的重点。 为什么可解释性问题这么重要...
大语言模型的深度裁剪法
夕小瑶科技说 原创作者 | 芒果、Python引言:大语言模型的计算挑战与优化需求在人工智能领域,大语言模型(LLMs)已经成为推动语言理解和生成任务进步的重...
出圈的Sora带火DiT,连登GitHub热榜,已进化出新版本SiT
机器之心报道 编辑:杜伟好的研究不会被埋没,只会历久弥新。虽然已经发布近一周时间,OpenAI 视频生成大模型 Sora 的影响仍在继续! 其中,Sora 研发负责人...
金融研报数据魔改Yi-34B & DeepSeek 67B 谁更强? Deepmoney金融大模型魔改方案分享&在线实测
在微调大型模型的过程中,一个常用的策略是“知识蒸馏”,这意味着借助高性能模型,如GPT-4,来优化性能较低的开源模型。这种方法背后隐含的哲学理念与logos中...
Sora为何出自OpenAI?一线员工作息时间线揭秘:我们疯狂地卷
机器之心报道 编辑:泽南、张倩数数每天几个小时?为什么是 OpenAI 率先打造出了 Sora? 现在全世界不论研究员、工程师还是投资人都在问这个问题。 最近几天...
独家|世界模拟器才是AGI终局,12态势预测!首席专家万字长文专业解读Sora里程碑
新智元报道作者:胡延平 编辑:好困 桃子 【新智元导读】生成60秒逼真视频,只是未来的一个小功能,母模型根科技原力觉醒。来自未来实验室的首席专家胡延平就...
单GPU就能压缩模型,性能不变参数少25%!微软提出模型稀疏化新方法
新智元报道编辑:拉燕 【新智元导读】大语言模型之大,成本之高,让模型的稀疏化变得至关重要。众所周知,对于大语言模型来说,规模越大,所需的算力越大,自...
Yann LeCun:人工智能的智商还不如一只猫
点击上方蓝字关注我们“Meta(META)公司首席人工智能科学家Yann LeCun认为,当前人工智能技术远未达到人类水平的智能,甚至不如猫。尽管相信人工智能最终会达...
扒开68家Sora概念股真面目!
Sora引爆A股概念!5家公司涨幅超40%,有的蹭热度有的忙辟谣。作者|程茜 编辑|李水青 OpenAI文生视频大模型Sora横空降世,再掀生成式AI热潮。 智东西2月20日消...
“今天,所有VC的会上都在谈Sora”
谈一则估值800亿美元的新故事。作者| 刘燕秋、蒲凡 仿佛梦回2023。去年年初,ChatGPT引发了普通人澎湃的讨论热情,此后海内外在AI大模型投资上展开了军备竞赛...
虚假Sora视频刷屏;传马斯克X正与Midjourney谈合作;前百度老将回归搜索丨AIGC大事日报
02/20 全球AIGC产业要闻 1、虚假Sora视频刷屏 2、杨立昆:Sora的训练方式无法构建世界模型 3、传马斯克X正与Midjourney谈合作 4、贾扬清评创企芯片推理速度达...
“世界模型”大争议:杨立昆狠批Sora不是世界模型,生成式路线注定失败|甲子光年
杨立昆:Sora不是世界模型,V-JEPA才是。作者 | 苏霍伊 编辑 | 赵健 过去一周,Sora 的光芒有多耀眼,谷歌与 Meta 就有多落寞。 就在 Sora 发布的同一天,另...
谷歌DeepMind CEO哈萨比斯:Scale只能带你走这么远|甲子光年
人工智能领域最大的突破尚未到来,并且需要的不仅仅是芯片。编译|刘杨楠 去年大部分时间,OpenAI在科技行业的地位似乎很难撼动,他们推出的ChatGPT在全球引...