火山引擎发布大模型训练视频预处理方案，已应用于豆包视频生成模型

AIGC动态2年前 (2024)发布 AI前线

AIGC动态欢迎阅读

原标题：火山引擎发布大模型训练视频预处理方案，已应用于豆包视频生成模型
关键字：小米,模型,视频,火山,方案
文章来源：AI前线
内容字数：0字

内容摘要：

整理 | 褚杏娟
10 月 15 日，火山引擎在视频云技术大会上发布了大模型训练视频预处理方案，助力解决视频大模型训练的成本、质量和性能等方面的技术挑战。目前，该技术方案已应用于豆包视频生成模型。
对训练视频进行预处理是保障大模型训练效果的重要前提。预处理过程可以统一视频的数据格式、提高数据质量、实现数据标准化、减少数据量以及处理标注信息，从而使模型能更高效地学习视频中的特征和知识，提升训练效果和效率。
抖音集团视频架构负责人王悦表示，对大模型厂商而言，上述过程中面临着诸多挑战：首先，超大规模视频训练数据集导致计算和处理成本激增；其次，视频样本数据参差不齐；然后，处理链路环节多、工程复杂；最后，面临着对 GPU、CPU、ARM 等多种异构算力资源的调度部署难题。
借助 Intel 的 CPU 等资源，火山引擎发布了大模型训练视频预处理方案依托于自研的多媒体处理框架 BMF，以有效应对模型训练的算力成本挑战。此外，该方案还在算法和工程方面进行了调优，可以对海量视频数据高质量预处理，短时间内实现处理链路的高效协同，提高模型训练效率。值得一提的是，火山引擎本次还发布并开源了移动端后处理解决

原文链接：火山引擎发布大模型训练视频预处理方案，已应用于豆包视频生成模型