标签:知乎

迈向复现 OpenAI o1 的一小步:Steiner 开源模型阶段性进展报告

讲座预告11月1日上午10点,南开大学在读博士李森茂,将以《基于扩散模型编码器模块的推理加速》为主题进行直播讲解,欢迎扫码报名~导读作者为季逸超 原文来自...
阅读原文

人在知乎,被AI总结了

金磊 发自 凹非寺量子位 | 公众号 QbitAI只是闲逛了下知乎,真是有被 AI 吓震惊到。 事情是这样的。 量子位公众号每天推送的文章,都会顺手同步到知乎上;而...
阅读原文

万字长文梳理LLM+RL(HF)的脉络

讲座预告11月1日上午10点,南开大学在读博士李森茂,将以《基于扩散模型编码器模块的推理加速》为主题进行直播讲解,欢迎扫码报名~导读作者为王小惟 Weixun ...
阅读原文

LLM实践系列-数据去重之Simhash&Minhash分析与实现

讲座预告11月1日上午10点,南开大学在读博士李森茂,将以《基于扩散模型编码器模块的推理加速》为主题进行直播讲解,欢迎扫码报名~今天给大家带来知乎@真中合...
阅读原文

北大校友张益唐:会将“朗道-西格尔零点猜想”彻底完成

来源:数学与通识 10月15日,传奇数学家张益唐在知乎上发表文章与年轻人交流,首次讲述了此前从未公开过的诸多往事:小时候读过的介绍俄罗斯科学家罗蒙诺索夫...
阅读原文

训练视觉语言模型VLM的经验

讲座预告11月1日上午10点,南开大学在读博士李森茂,将以《基于扩散模型编码器模块的推理加速》为主题进行直播讲解,欢迎扫码报名~导读作者为lym 原文来自知...
阅读原文

长序列(Long Context)大模型笔记

导读作者为Rooters 原文来自知乎,地址:https://zhuanlan.zhihu.com/p/926602895 本文只做学术/技术分享,如有侵权,联系删文。记录下过去一年业界长序列LLM...
阅读原文

OpenAI o1能否支撑AGI的新Scaling?

导读作者为mackler 原文来自知乎,地址:https://zhuanlan.zhihu.com/p/730982539 本文只做学术/技术分享,如有侵权,联系删文。OpenAI o1的推出带来了一波新...
阅读原文

LLM实践系列-详谈Tokenizer训练细节

今天给大家带来知乎@真中合欢的一篇文章,《LLM实践--Tokenizer训练》。 知乎:https://zhuanlan.zhihu.com/p/739078635 经过了数据收集、筛选、去重,马上就...
阅读原文

10年后手机有多科幻?清华孙茂松:人手一个超级大脑,诊病翻译搞研发

新智元报道编辑:编辑部 HYZ 【新智元导读】十年后的AI手机,能有多科幻?AI已成为每个人生活中,不可或缺的一部分。从个人助理、医疗诊断、到产品研发等领域...
阅读原文

致敬小镇做题家的OpenAI o1

OAI的草莓从去年11月开始炒作Q*, 已经预热了快一年了, 似乎伴随着最近Cursor+Claude的压力, 以及最近一轮OAI融资, 把o1放出来了. 本以为是给微软Copilot:Wave...
阅读原文

如何提升角色扮演大模型的拟人能力?

GTIC 2024中国AI PC创新峰会将于10月11日,在2024上海国际消费电子展TechG同期举办。联想集团首席研究员颜毅强、荣耀终端有限公司PC产品研发系统部部长席迎军...
阅读原文

10个AI驱动的小产品,展现100种创新力量|甲子光年

在S创上海2024大会,智能、高效、具有人文关怀的AI产品,正在不断涌现。作者|八度‍‍ 编辑|王博 2024年9月20日至21日,上海西岸艺术中心A馆迎来了S创上海202...
阅读原文

如何从零训练多模态大模型(预训练方向)

开讲预约导读原文来自知乎,作者为HelloWorld,标题为《LLaVA(六)训练你自己的多模态模型》。作者详细介绍了如何从零训练LLaVA v1.5多模态模型,包括特征对...
阅读原文

知乎高赞:从0到1做大语言模型Pretrain的经验

开讲预约导读原文来自知乎,作者为ybp,标题为《LLM训练-pretrain》。作者详细介绍了如何从零到一进行 pretrain 工作,分为背景篇、数据篇、训练篇、评估篇和...
阅读原文
123419