围棋吧 关注:349,330贴子:10,550,410
  • 23回复贴,共1

你们都说狗官子损目是为了提高胜率

只看楼主收藏回复

胜率100%赢半目和胜率90%赢10目它会选前者。但是看下实际棋局就知道这个选择往往不是100%和90%的区别,而是99.99%赢半目和99.98%赢10目的区别,甚至可能是99.98%赢半目和99.99%赢10目。Monte Carlo随机抽样会带有样本误差,所以两种下法的实际胜率是没有区别的,相当于狗随机挑了一招。
这个问题其实很好解决,胜率离100%之间的距离小于抽样误差之后把目标函数从胜率改成monte carlo走到终盘的平均目数就行了。deepmind不改只能说他们志不在围棋,能赢就行。


1楼2017-05-27 09:58回复
    只要官子阶段阿法狗还领先,就算围棋之神也别想翻盘了。阿法狗创始人不是回答了这个问题吗!几个重要的落子点都是胜,阿法狗只是随机选一个点,至于目数它不在乎。说白了,到了官子阶段阿法狗已经能算尽变化。


    来自手机贴吧3楼2017-05-27 10:15
    回复
      如果连围棋收官都不能做到最大效率判断的话,以后应用到医学,是不是只要治不死人就行?想想就很可怕,崴个脚去医院治,AI给出的最佳方案是截肢


      IP属地:上海4楼2017-05-27 10:22
      收起回复
        其实是多线程,先算到的先走而已,反正胜率都一样。下一把相同局面可能走会总不同的招数。每次看到说狗狗是走稳健的招数的都很想笑,这明显是用人类的思维去看狗


        5楼2017-05-27 10:24
        回复
          我能说几个点都是100%,先算到哪个点就走哪个点。不是吗?


          IP属地:广东6楼2017-05-27 10:46
          收起回复
            其实很可能收官的时候由于变化少, 可能穷举了, 几步都是100%, 所以随便下了一步


            IP属地:美国7楼2017-05-27 11:01
            回复
              go对弈最多的就是go,四分之一目有模糊值,计算难度最大 肯定是首先,百亿局必然定型


              来自Android客户端8楼2017-05-27 13:17
              回复
                所以机器学习的下一个发展目标,应该是多层学习。


                IP属地:江苏来自Android客户端9楼2017-05-27 13:35
                回复
                  又没有赢,还这么多废话。小学一年级说大学生微积分学得不好。


                  12楼2017-05-27 14:31
                  回复
                    狗走的退讓棋,可能是選棋時勝率差別小於樣本誤差,所以隨機挑(或是谷歌有放入其它層的因素也未必不可能)。另一種可能,則是像部分棋手認為的,看似虧目的棋其實勝率更高。
                    除非你是後台工作人員知道勝率數據,要不這兩種可能性都存在


                    13楼2017-05-27 14:40
                    回复