原标题:谷歌 AlphaChip 论文再被质疑,DeepMind 驳斥都没做与训练,顺带还揪出了“内鬼”?
文章来源:人工智能学家
内容字数:23033字
AlphaChip项目的历程与质疑
2020年,DeepMind推出了AlphaChip,一个能够生成超越人类能力的深度强化学习芯片布局设计方法,并在《自然》杂志上发表了相关论文。该项目引发了芯片设计领域的广泛关注和后续研究,然而也面临了不少质疑。2024年11月,Synopsys的架构师Igor Markov对AlphaChip及其相关研究进行了元分析,提出了多项质疑,尤其集中在Cheng等人对AlphaChip方法的重新实现上。
时间线
1. **2020年4月**:AlphaChip论文的arXiv预印本发布。
2. **2020年8月**:在TPU v5e中流片了由AlphaChip生成的布局。
3. **2021年6月**:论文在《自然》杂志上正式发表。
4. **2021年9月**:在TPU v5p中流片了15种由AlphaChip生成的布局。
5. **2022年1月至7月**:DeepMind开源了AlphaChip,期间另一团队复现了相关结果。
6. **2022年10月**:在Trillium中流片了25种布局。
7. **2023年6月**:Markov发布了他的“元分析”预印本。
8. **2024年4月**:《自然》杂志完成了对DeepMind成果的调查,并支持其研究结论。
对AlphaChip的质疑
Markov及其团队的“元分析”提出了多项指控,包括可重复性差、数据污染等。然而DeepMind对此进行了反驳。他们指出,Cheng等人的研究在复现过程中存在多项错误,例如未进行预训练、计算资源不足和未达到模型收敛等。具体问题包括:
1. **未进行预训练**:Cheng等人未对强化学习方法进行预训练,导致方法性能大幅下降。
2. **计算资源不足**:使用的计算资源远低于原始论文要求,影响了结果的有效性。
3. **未训练至收敛**:模型未达到收敛标准,影响了最终指标的可靠性。
4. **测试用例旧且不具代表性**:所用测试用例基于较旧的制程节点,与DeepMind的现代设计不符。
DeepMind的回应
DeepMind强调其研究方法的开源性和可重复性,提供了完整的开源代码和数据集供外部验证。他们指出,Markov的质疑缺乏实证支持,并且在分析中未能遵循标准的机器学习实践。此外,DeepMind还对Cheng等人的方法与商业布局工具的比较提出了质疑,认为这种比较不具合理性。
总结
AlphaChip项目的推出与发展引发了芯片设计领域的重大关注,同时也面临了诸多质疑。DeepMind通过开源和透明的方式回应了这些质疑,强调其方法的有效性和可重复性。尽管存在不同的观点和研究结果,AlphaChip的持续发展和应用表明其在芯片设计中的潜力。
联系作者
文章来源:人工智能学家
作者微信:
作者简介:致力成为权威的人工智能科技媒体和前沿科技研究机构