标签:数据

以Qwen 2、Llama 3.1等四大模型为例,谈LLM预训练和后训练新范式!

9月6-7日,智猩猩发起主办的2024全球AI芯片峰会将在北京辽宁大厦盛大举行。峰会设有开幕式、数据中心AI芯片专场、AI芯片架构创新专场、边缘/端侧AI芯片专场、...
阅读原文

上交大推出“可进化游戏引擎”!大模型加持代码自动成长,虚拟世界演化无需预设

WY 投稿 凹非寺量子位 | 公众号 QbitAI试问谁小时候没有幻想过有一只专属于自己的宝可梦?(可以DIY的那种~) 最近来自上海交通大学的团队整了个“可进化游戏...
阅读原文

最强笔记软件Obsidian中也能使用LLM,让它成为你的智慧第二大脑

机器之心报道 编辑:Panda知识管理软件,也上大模型了。工欲善其事,必先利其器。使用好用的工具可以极大地提升我们生产和学习的效果和效率。今天我们要介绍...
阅读原文

在线教程 | 1 分钟生成万字悬疑小说,LongWriter-glm4-9b 突破长文输出瓶颈

近年来,大语言模型 (LLM)在理解和生成复杂文本时展现出强大的能力,能够处理高达 100,000 个 tokens 的输入,但在生成超过 2,000 词的连贯输出时,往往会遇...
阅读原文

LLM的范式转移:RL带来新的 Scaling Law

9月6-7日,智猩猩发起主办的2024全球AI芯片峰会将在北京辽宁大厦盛大举行。峰会设有开幕式、数据中心AI芯片专场、AI芯片架构创新专场、边缘/端侧AI芯片专场、...
阅读原文

KDD2024重磅奖项出炉:“最大奖项”创新奖花落加州大学Lise Getoor,李骏东摘得新星奖

大数据文摘受权转载自学术头条 恭喜所有获奖者! 全球顶级学术会议 KDD 2024,正在巴塞罗那“火热上演”。 今天,KDD 2024 正式公布了多个重磅奖项,包括创新奖...
阅读原文

MoE再下一城!港大提出AnyGraph:首次开启「图大模型」Scaling Law之路

新智元报道编辑:LRST 【新智元导读】AnyGraph聚焦于解决图数据的核心难题,跨越多种场景、特征和数据集进行预训练。其采用混合专家模型和特征统一方法处理结...
阅读原文

专注AI+制造:创新奇智大模型工业落地初显成效,探索工业智能机器人新方向

机器之心报道 编辑:泽南最近的大模型行业,似乎有一种「暴风雨来临前的平静」。 整个 8 月,OpenAI 连续不断的行动似乎在告诉我们:风向要变了。从发布 Syst...
阅读原文

用Mac训练个机器人叠衣服,HuggingFace开源全套教程,开源AI机器人要来了?

机器之心报道 机器之心编辑部‍这是机器人界的 Llama?靠 100 条轨迹数据,在 Mac 上训练几个小时,就能拥有一个可以抓取乐高积木的机械臂,这是 HuggingFace ...
阅读原文

Cross-Embodiment/数据集/VLA,具身智能今年的研究重点在哪?

机器之心PRO · 会员通讯 Week 35---- 本周为您解读 ③个值得细品的AI & Robotics业内要事 ---- 1.Cross-Embodiment/数据集/VLA,具身智能今年的研究重点在...
阅读原文

整合 200 多项相关研究,大模型「终生学习」最新综述来了

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

李沐交大演讲全文:创业的动机要么来自欲望,要么来自恐惧

AI大神李沐在母校上海交大的演讲火了。 在这场一个半小时的演讲里,李沐从大模型的算力和技术、多模态趋势、应用现状聊到了自己的AI创业心得、以及创业的痛苦...
阅读原文

KDD2024最佳学生论文解读,中科大、华为诺亚:序列推荐新范式DR4SR

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

OpenCity大模型预测交通路况,零样本下表现出色,来自港大百度

OpenCity团队 投稿量子位 | 公众号 QbitAI长时间交通状况预测,可以用大模型实现了。 香港大学联合华南理工大学和百度,推出了长时间城市交通预测模型——OpenC...
阅读原文

情感分析的终极形态:全景式细粒度多模态对话情感分析基准PanoSent

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文
11920212223126