谷歌的围棋应用的神经网络,深度学习等等技术,说起来都是业界已经有的技术,谷歌这一次也是真正的一次测试,商业目的一定会有,但是主要是测试。
因为不是专家,只能说说我的理解。
1、什么是神经网络。
所谓神经网络,就是把输入的数据分成小的元素,然后租车相互关联的网络结构。
比如围棋棋盘是19*19,
第一层先分割成4个10*10的小格子,(其中一个行列可以交叉),形成连接的网络
第二层再把每个10*10的小格子,分成4个5*5的小格子,形成单元更细的连接网络。
………………
一共有多少层,只有工程师呢自己知道了。
每个点的应该有4个状态,黑,白,空,空(因为劫不能落子)的情况。
每个小格子的状态,就是由这四个状态决定的。
最终他们会给每个小格子状态最终胜率的随机权重。
网络中每种状态下,下一步落点与胜率的关系,胜率改变来改权重,并进行训练。
进行大量的训练后,最终追求接近完美的权重。
这样寻找到的点就是我们说的电脑的棋感。
再说说比赛,这些弱点大家都总结出来了,我只是加上我的理解:
1.电脑怕打劫。可以想想,落点的4种状态中,空(因为劫不能落子)的情况是最少出现的。
因为很可能存在训练不足的情况,因此电脑的棋感在这里还没有很好的训练出来,更容易出臭棋。
这样自学习的时候,就会出现电脑双方都不去打劫,造成训练更加不够,更加怕打劫。因此自我对局固然会强化优势,也会强化弱点。
因此打败电脑还是要利用打劫。
2.局部战斗。我们认为电脑的计算力很强,但是如果局部战斗牵扯盘面信息太多,目前电脑的计算力还是不够的。只能用蒙特卡洛搜索的方法,选择一些可能点的,进行计算。因此漏点的机会就大,而且计算不清的情况下,局势也会判断错误。
因此李世石将战斗导入复杂是非常正确的,而且在中腹战斗也是非常正确的。
3.因为电脑学习方式特殊,它没有我们的启蒙阶段,我们不会犯的低级错误,它是有可能存在训练不足的情况的。
征子,比赛棋谱估计不会有人下太多的,因为人可以判断出不利,电脑可能也是训练不足的。
同时征子因为步数很多,也可能超出了走子网络的计算范围。
不过这个比赛用风险太大。
因为不是专家,只能说说我的理解。
1、什么是神经网络。
所谓神经网络,就是把输入的数据分成小的元素,然后租车相互关联的网络结构。
比如围棋棋盘是19*19,
第一层先分割成4个10*10的小格子,(其中一个行列可以交叉),形成连接的网络
第二层再把每个10*10的小格子,分成4个5*5的小格子,形成单元更细的连接网络。
………………
一共有多少层,只有工程师呢自己知道了。
每个点的应该有4个状态,黑,白,空,空(因为劫不能落子)的情况。
每个小格子的状态,就是由这四个状态决定的。
最终他们会给每个小格子状态最终胜率的随机权重。
网络中每种状态下,下一步落点与胜率的关系,胜率改变来改权重,并进行训练。
进行大量的训练后,最终追求接近完美的权重。
这样寻找到的点就是我们说的电脑的棋感。
再说说比赛,这些弱点大家都总结出来了,我只是加上我的理解:
1.电脑怕打劫。可以想想,落点的4种状态中,空(因为劫不能落子)的情况是最少出现的。
因为很可能存在训练不足的情况,因此电脑的棋感在这里还没有很好的训练出来,更容易出臭棋。
这样自学习的时候,就会出现电脑双方都不去打劫,造成训练更加不够,更加怕打劫。因此自我对局固然会强化优势,也会强化弱点。
因此打败电脑还是要利用打劫。
2.局部战斗。我们认为电脑的计算力很强,但是如果局部战斗牵扯盘面信息太多,目前电脑的计算力还是不够的。只能用蒙特卡洛搜索的方法,选择一些可能点的,进行计算。因此漏点的机会就大,而且计算不清的情况下,局势也会判断错误。
因此李世石将战斗导入复杂是非常正确的,而且在中腹战斗也是非常正确的。
3.因为电脑学习方式特殊,它没有我们的启蒙阶段,我们不会犯的低级错误,它是有可能存在训练不足的情况的。
征子,比赛棋谱估计不会有人下太多的,因为人可以判断出不利,电脑可能也是训练不足的。
同时征子因为步数很多,也可能超出了走子网络的计算范围。
不过这个比赛用风险太大。