棋牌电子网站登录

详析阿尔法围棋“三头六臂”

更新:2020-09-14 编辑:棋牌电子网站登录 来源:棋牌电子网站登录 热度:3023℃

  3月10日,阿尔法围棋再次战胜李世石。无论执黑执白,李世石均无还手之力。有人欣喜,有人哀叹,有人惊掉下巴。机器杀伐决断,只凭三种武器:神经网络、蒙特卡洛算法和评估局面。

  首先,阿尔法围棋是一团神经网络,不是一本大全棋谱。它下棋不是翻谱。跟人一样靠计算和直觉,但它少年老成,直觉更准。

  职业棋手有种棋感,那是下了上万盘棋后,大脑见多识广,感觉到某一手的优劣,尽管说不出道理。画画,骑车,拿榔头敲钉子,都是凭感觉,唯技熟耳。有个极端的例子,中国有种专业,可以辨认刚孵蛋出来的小鸡雄雌,他们说不出怎么辨认,凭感觉去选,基本没错。

  临帖一万次,有了书法感觉;打谱一万遍就有了棋感。为什么?大脑=神经细胞+神经突触,突触是大脑的电线,经常过电的突触会更强壮。小孩子的大脑正是如此学习:伴随成功的快乐,刚用过的神经突触就会加强,习惯就养成了。

  早在冯诺依曼时代,科学家就想到用电脑模拟大脑:计算单元+通路,通路的强度可调节。虚拟大脑一次次接受任务,每次调用不同的神经通路去做,如果任务成功,刚用过的通路强度会被提高,反之强度降低。

  阿尔法围棋复制了小孩子的学习过程,成功了就调高相关通路强度,失败了就调低,使神经网络在自我对弈百万盘后调整到最优。

  阿尔法围棋的肉身是神经网络;在此基础上,它有两套心法:蒙特卡洛算法和评估局面。

  蒙特卡洛算法很好理解,很多棋类软件都这么干。你吩咐狗熊去玉米田里掰一个最大的棒子,但玉米田太大,累死了也走不完。狗熊想了个主意:根据经验选十来个常出大棒子的地方,仔细找一遍。最后掰的大棒子,就算不是整块田里最大的,也差不离。这就是蒙特卡洛式的狗熊。

  围棋盘是19乘19个位棋牌电子网站登录置,以前大家认为天文数字的可能性,电脑算不过来的。但蒙特卡洛算法只选取一小部分有希望的点来考虑。阿尔法围棋跟之前的ZEN等围棋软件都是如此,倒不出奇。

  但加上了价值网络,阿尔法围棋一步登顶珠穆朗玛。它不需要推演到终局,只考虑落子之后二十步的局面优劣。价值网络负责给局势打分。只要保证落子二十步后局面不落下风,它就大胆地下。

  跟李世石对弈两局,阿尔法围棋下出一些貌似的弱智棋,该占的便宜不占,还有一些大俗招,旁观者说不清为什么。或许是阿尔法围棋在几百万盘对弈的经验基础上,选择了一条最没风险的去路,而人类所谓正招却排除不了局势转劣的可能?

  人类下围棋,除了计算,更重要的是评估或者说审美,职业棋手们用均衡厚实去描述理想的棋形,并非算准了要赢,只是感觉棋局更美,阿尔法围棋再现了人类的天赋。

(责任编辑:棋牌电子网站登录)

本文地址:http://www.baileywickbooks.com/yelv/2020/0914/1106.html

上一篇:国办印发《意见》 促进开发区改革和创新发展

下一篇:开县科协“四强化”严抓干部队伍作风建设

相关文章