标签：知乎

迈向复现 OpenAI o1 的一小步：Steiner 开源模型阶段性进展报告

讲座预告11月1日上午10点，南开大学在读博士李森茂，将以《基于扩散模型编码器模块的推理加速》为主题进行直播讲解，欢迎扫码报名~导读作者为季逸超原文来自...

阅读原文

AIGC动态

2年前 (2024)

人在知乎，被AI总结了

金磊发自凹非寺量子位 | 公众号 QbitAI只是闲逛了下知乎，真是有被 AI 吓震惊到。事情是这样的。量子位公众号每天推送的文章，都会顺手同步到知乎上；而...

阅读原文

AIGC动态

2年前 (2024)

万字长文梳理LLM+RL(HF)的脉络

讲座预告11月1日上午10点，南开大学在读博士李森茂，将以《基于扩散模型编码器模块的推理加速》为主题进行直播讲解，欢迎扫码报名~导读作者为王小惟 Weixun ...

阅读原文

AIGC动态

2年前 (2024)

LLM实践系列-数据去重之Simhash&Minhash分析与实现

讲座预告11月1日上午10点，南开大学在读博士李森茂，将以《基于扩散模型编码器模块的推理加速》为主题进行直播讲解，欢迎扫码报名~今天给大家带来知乎@真中合...

阅读原文

AIGC动态

2年前 (2024)

北大校友张益唐：会将“朗道-西格尔零点猜想”彻底完成

来源：数学与通识 10月15日，传奇数学家张益唐在知乎上发表文章与年轻人交流，首次讲述了此前从未公开过的诸多往事：小时候读过的介绍俄罗斯科学家罗蒙诺索夫...

阅读原文

AIGC动态

2年前 (2024)

训练视觉语言模型VLM的经验

讲座预告11月1日上午10点，南开大学在读博士李森茂，将以《基于扩散模型编码器模块的推理加速》为主题进行直播讲解，欢迎扫码报名~导读作者为lym 原文来自知...

阅读原文

AIGC动态

2年前 (2024)

长序列（Long Context）大模型笔记

导读作者为Rooters 原文来自知乎，地址：https://zhuanlan.zhihu.com/p/926602895 本文只做学术/技术分享，如有侵权，联系删文。记录下过去一年业界长序列LLM...

阅读原文

AIGC动态

2年前 (2024)

OpenAI o1能否支撑AGI的新Scaling？

导读作者为mackler 原文来自知乎，地址：https://zhuanlan.zhihu.com/p/730982539 本文只做学术/技术分享，如有侵权，联系删文。OpenAI o1的推出带来了一波新...

阅读原文

AIGC动态

2年前 (2024)

LLM实践系列-详谈Tokenizer训练细节

今天给大家带来知乎@真中合欢的一篇文章，《LLM实践--Tokenizer训练》。知乎：https://zhuanlan.zhihu.com/p/739078635 经过了数据收集、筛选、去重，马上就...

阅读原文

AIGC动态

2年前 (2024)

10年后手机有多科幻？清华孙茂松：人手一个超级大脑，诊病翻译搞研发

新智元报道编辑：编辑部 HYZ 【新智元导读】十年后的AI手机，能有多科幻？AI已成为每个人生活中，不可或缺的一部分。从个人助理、医疗诊断、到产品研发等领域...

阅读原文

AIGC动态

2年前 (2024)

致敬小镇做题家的OpenAI o1

OAI的草莓从去年11月开始炒作Q*, 已经预热了快一年了, 似乎伴随着最近Cursor+Claude的压力, 以及最近一轮OAI融资, 把o1放出来了. 本以为是给微软Copilot:Wave...

阅读原文

AIGC动态

2年前 (2024)

如何提升角色扮演大模型的拟人能力？

GTIC 2024中国AI PC创新峰会将于10月11日，在2024上海国际消费电子展TechG同期举办。联想集团首席研究员颜毅强、荣耀终端有限公司PC产品研发系统部部长席迎军...

阅读原文

AIGC动态

2年前 (2024)

10个AI驱动的小产品，展现100种创新力量｜甲子光年

在S创上海2024大会，智能、高效、具有人文关怀的AI产品，正在不断涌现。作者｜八度‍‍ 编辑｜王博 2024年9月20日至21日，上海西岸艺术中心A馆迎来了S创上海202...

阅读原文

AIGC动态

2年前 (2024)

如何从零训练多模态大模型（预训练方向）

开讲预约导读原文来自知乎，作者为HelloWorld，标题为《LLaVA（六）训练你自己的多模态模型》。作者详细介绍了如何从零训练LLaVA v1.5多模态模型，包括特征对...

阅读原文

AIGC动态

2年前 (2024)

知乎高赞：从0到1做大语言模型Pretrain的经验

开讲预约导读原文来自知乎，作者为ybp，标题为《LLM训练-pretrain》。作者详细介绍了如何从零到一进行 pretrain 工作，分为背景篇、数据篇、训练篇、评估篇和...

阅读原文

AIGC动态

2年前 (2024)

123 4…19