终于看大概了解:0狗有2个版本,20block和40block。
(block 应该指 resitual blocks,卷积的残差块。 似乎与卷积层有关,训练时间越长,块越多,即之前DeepMind提到的40层神经网络。@amiok9)
详细说说几个sgf文件夹的说明(非常重要)
【Extended Data Figure 1 - AlphaGo Zero 20 block vs AlphaGo Lee
这是20 block训练3天对李世石版本的对弈
【Extended Data Figure 4 - AlphaGo Zero 20 block self-play games】
这是20 block在3天内的自学历程
【Extended Data Figure 5 - AlphaGo Zero 40 block self-play games】
这是40 block在40天内的自学历程
【Extended Data Figure 6 - AlphaGo Zero 40 block vs AlphaGo Master】
这是40 block训练40天对master版本的对弈
【Figure 5 - AlphaGo Zero Timeline】
阶段示例(但是不清楚是20 block还是40 block的 望补充)
以上来自弈客以及贴吧整理。。如有错误,大家补充
(block 应该指 resitual blocks,卷积的残差块。 似乎与卷积层有关,训练时间越长,块越多,即之前DeepMind提到的40层神经网络。@amiok9)
详细说说几个sgf文件夹的说明(非常重要)
【Extended Data Figure 1 - AlphaGo Zero 20 block vs AlphaGo Lee
这是20 block训练3天对李世石版本的对弈
【Extended Data Figure 4 - AlphaGo Zero 20 block self-play games】
这是20 block在3天内的自学历程
【Extended Data Figure 5 - AlphaGo Zero 40 block self-play games】
这是40 block在40天内的自学历程
【Extended Data Figure 6 - AlphaGo Zero 40 block vs AlphaGo Master】
这是40 block训练40天对master版本的对弈
【Figure 5 - AlphaGo Zero Timeline】
阶段示例(但是不清楚是20 block还是40 block的 望补充)
以上来自弈客以及贴吧整理。。如有错误,大家补充