蒙地卡罗树状搜索的应用是不是AlphaGo成功的关键之处?

已邀请:

ufo5260987423 - 朕回来了,不争论,只说观点,主要是吸收意见

推荐来自: 切丝 離娮 Joey 彷徨少年时 advAdder

首先,是蒙特卡洛树搜索(Mont Carlo Tree Search),而不是题目中那个奇怪的翻译。
其次,什么是关键之处?太监去势,他那个东西是不是他的关键之处?是啊,但是没有了以后他不是照样活吗?

事实上,卷积神经网络和蒙特卡洛树搜索的权重是一半一半——你要说是关键之处,可以,毕竟军功章有蒙特卡洛树搜索的一半。
但是看了paper的人应当意识到,alpha go的成功主要在于神经网络模型用的好——浑话叫做“调的一手好参数”。历史会记住神经网络的开创性使用,而不会记住蒙特卡洛树搜索。
==
提问者:Alpha go啊,蒙特卡洛树搜索很重要是不是呢?
Alpha go:是啊。
提问者:是关键之处是不是啊?
Alpha go: 你们啊,毕竟too young。你问我蒙特卡洛树重不重要,人家权重占一半,怎么能说不重要?但是你们这个问题……我以为你们整天的……你们有一个好,论道上什么问题都敢问,问的比谁都多,但是too simple ,some time naive。那个神经网络,比蒙特卡洛树搜索不知道高到哪里去了。 你们还是要学习一个。

Eidosper - 一粒尘埃/码农/作曲,公众号一埃居(ID:eidosperhome)正在筹建中,欢迎关注。华科论道群342531142

推荐来自:

按照第四局看,是的。

李世石再厉害,1分钟能处理100个盘面就算厉害了,但是alphago相当于拿MCTS当胶水,粘接起来了两个水平大概是专业三段(数据来源未知,大体如此?)的网络,一个价值网络一个策略网络。然后通过很多很多的搜索来验证这两个网络的正确性。

假设限定其MCTS的范围,那我想alphago还是难以战胜李世石的。

当然,毕竟是个人都能想到MCTS这样的算法可以用,所以就像空气是人存活的关键,但是真正让alphago棋力这么高的,应当是合适的神经网络的设计。

正在看吴恩达的课,水平有限,有问题欢迎指出。

要回答问题请先登录注册