西游科技_逗逗是豆豆_第二百零六章玄清杯

　　第二百零六章玄清杯 (第2/3页)

但实际上不太现实，因为还有急所的限制。也就是你譬如走个星，但现在涉及死活了，就不能放弃去占那些效率最大的点。

    就是如何在全局和局部之间找到那个最大的平衡点。

    唐玄生也有些好奇真正最后糖糖拿给自己的棋谱会不会是像古代传说中那些仙人的棋谱。

    古代有些棋谱明显的看的出来和当时的下法天差地别，这说明还是有厉害的脑洞大开的世外高人的。

    很快辣椒萝卜和圆晶厂的官网上面就登出了圆晶厂拿出一亿彩头挑战阿尔法狗的新闻。这甚至还导致股价波动了一下，当然还有后续的辣椒萝卜圆晶厂，也就是唐家举办的玄清杯世界围棋大赛。

    超高的奖金往往才能出现精彩对局，也就是重赏之下必有勇夫。

    其实早在2017年5月，在柯洁与阿尔法围棋的人机大战之后，阿尔法围棋团队宣布阿尔法围棋将不再参加围棋比赛。2017年10月18日，DeepMind团队公布了最强版阿尔法围棋，代号AlphaGoZero。

    也就是说人家算是功成身退了，糖糖真正要挑战的应该是最强版的阿尔法狗。

    阿尔法围棋（AlphaGo）是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能机器人，由谷歌（Google）旗下DeepMind公司戴密斯?哈萨比斯领衔的团队开发。其主要工作原理是“深度学习”。

    2016年3月，阿尔法围棋与围棋世界冠军、职业九段棋手李世石进行围棋人机大战，以4比1的总比分获胜。

    2016年末2017年初，该程序在中国棋类网站上以“大师”（Master）为注册帐号与中日韩数十位围棋高手进行快棋对决，连续60局无一败绩。

    2017年5月，在中国乌镇围棋峰会上，它与排名世界第一的世界围棋冠军柯洁对战，以3比0的总比分获胜。

    围棋界公认阿尔法围棋的棋力已经超过人类职业围棋顶尖水平，在GoRatings网站公布的世界职业围棋排名中，其等级分曾超过排名人类第一的棋手柯洁。

    阿尔法围棋系统主要由几个部分组成：

    一、策略网络（PolicyNetwork），给定当前局面，预测并采样下一步的走棋。

    二、快速走子（Fastrollout），目标和策略网络一样，但在适当牺牲走棋质量的条件下，速度要比策略网络快1000倍。

    三、价值网络（ValueNetwork），给定当前局面，估计是白胜概率大还是黑胜概率大。

    四、蒙特卡洛树搜索（MonteCarloTreeSearch），把以上这三个部分连起来，形成一个完整的系统。

    阿尔法围棋（AlphaGo）此前的版本，结合了数百万人类围棋专家的棋谱，以及强化学习的监督学习进行了自我训练。

    AlphaGoZero的能力则在这个基础上有了质的提升。最大的区别是，它不再需要人类数据。

    也就是说，它一开始就没有接触过人类棋谱。研发团队只是让它自由随意地在棋盘上下棋，然后进行自我博弈。

    AlphaGoZero使用新的强化学习方法，让自己变成了老师。系统一开始甚至并不知道什么是围棋，只是从单一神经网络开始，通过神经网络强大的搜索算法，进行了自我对弈。

    随着自我博弈的增加，神经网络逐渐调整，提升预测下一步的能力，最终赢得比赛。更为厉害的是，随着训练的深入，阿尔法围棋团队发现，AlphaGoZero还独立发现了游戏规则，并走出了新策略，为围棋这项古老游戏带来了新的见解。

    也就是说糖糖要挑战的是最终最强的阿尔法狗。但有个优势就是，最强版本的阿尔法狗其实也是一种自我学习状态。但作为真正的人工智能，糖糖是站在一个全新的高度来俯视的。

    唐玄生想了想，毕竟也是一亿的赌局，索性让糖糖去香江和孙小圣一起进行封闭训练。也让孙小圣学习一下围棋，同时也是个最好的对手，看看两人究竟谁更