燃文小说网

手机浏览器扫描二维码访问

第597章 老板你做个人吧(第3页)

……

曹阳不是混围棋圈的人,所以他看过去,也不认识里面的人。

刘光然说,这些都是受邀来参加的职业5段棋手,棋手在围棋领域当中职业5段就已经相当厉害了。

“我们这一次稍微调整了一下策略算法。”

刘光然解释说:博米围棋大师现在主要工作原理是“深度学习”。

“深度学习”是指多层的人工神经网络和训练它的方法。

一层神经网络会把大量矩阵数字作为输入,通过非线性激活方法取权重,再产生另一个数据集合作为输出。

这就像生物神经大脑的工作机理一样,通过合适的矩阵数量,多层组织链接一起,形成神经网络“大脑”进行精准复杂的处理,就像人们识别物体标注图片一样。

博米围棋大师用到了很多新技术,如神经网络、深度学习、蒙特卡洛树搜索法等,使其实力有了实质性飞跃。

这些其实都已经是现在世界上研究的软件领域当中最难的课题了。

好在博米公司起步的早,而且还有着大量的人才和积累,加上曹阳的优秀的眼光和指导,现在的进展非常的顺利。

……

刘光然解释说:“博米围棋大师系统主要由几个部分组成:

一、策略网络,给定当前局面,预测并采样下一步的走棋;

二、快速走子,目标和策略网络一样,但在适当牺牲走棋质量的条件下,速度要比策略网络快1000倍;

三、价值网络,给定当前局面,估计是白胜概率大还是黑胜概率大;

四、蒙特卡洛树搜索,把以上这四个部分连起来,形成一个完整的系统。”

……

现在,刘光然对博米围棋大师的AI版本进行了多次的更迭,到现在已经比较成熟了。

博米围棋大师此前的版本,结合了数百万人类围棋专家的棋谱,以及强化学习进行了自我训练。

博米围棋AI的能力则在这个基础上有了质的提升。

最大的区别是,它不再需要人类数据。也就是说,它一开始就没有接触过人类棋谱。研发团队只是让它自由随意地在棋盘上下棋,然后进行自我博弈。

刘光然给曹阳介绍,博米围棋AI使用新的强化学习方法,让自己变成了老师。

系统一开始甚至并不知道什么是围棋,只是从单一神经网络开始,通过神经网络强大的搜索算法,进行了自我对弈。

随着自我博弈的增加,神经网络逐渐调整,提升预测下一步的能力,最终赢得比赛。更为厉害的是,随着训练的深入,博米围棋大师团队发现,博米围棋AI还独立发现了游戏规则,并走出了新策略,为围棋这项古老游戏带来了新的见解。

从某种程度来说,也要归功于之前AI换脸技术带来的灵感。

AI换脸也是两个【大脑】,一个负责做假,另外一个负责识别,然后看是做假的更厉害,还是能够识别的更厉害,最后一直推演到识别技术也无法区分真假为止,就算是成功了。

博米围棋大师也是这样,自己的两个大脑互相下围棋,然后把棋谱存下来,作为数据库当中的一部分,之后再不断地从数据库当中进行深度学习,然后又自己跟自己下,不断地重复这个过程,直到最终能快速地产生出最优解。

之前博米围棋AI仅用了单一的神经网络。


热门小说推荐
梦里繁花皆是你

梦里繁花皆是你

梦里繁花皆是你字数642751传言有钱有权有势又有颜的易少娶了一个离婚的二手女人,碎了全城少女心一个采访中某记者问其原因传言是因为您有特殊爱好,对吗?易少一本正经我只喜欢她这一个。...

秦九州擎天战神

秦九州擎天战神

一代战神秦九州重归都市,为弥补遗憾,搅动风起云涌,以不败之资横行四方,诸天震颤。...

超级百宝囊

超级百宝囊

无敌的魔法武技?强大的武器装备?逆天的药剂道具?妖娆的美女军团?宝囊在手,天下我有!这其实就是一个目标成为勇者的少年在得到无敌的百宝囊之后,一路上勾搭妹子一起推倒魔王的故事。...

文娱救世主

文娱救世主

没有弱智光环,没有未来推送科技掀掉跟风猪和套路狗横行的娱乐圈,用崭新的法则之力为人类缔造一个清爽的传媒新世界。...

刀剑神皇

刀剑神皇

一口冰剑,一柄炎刀,一个屹立绝巅的不朽神皇传说!乱世狂刀,热血新作御天神帝,2015年4月2日八点十八分,正式起航,欢迎大家关注!...

最强系统

最强系统

穿越前,他是世界游戏第一人。千人阵,万人屠杀,一人傲视群雄。穿越后,超级系统融入灵魂,成为世间无人能敌的至尊。御剑斩杀群魔,仗剑疯魔群神,道法灭妖,怒吼震万鬼。修灵成神,世间无敌。风流成圣,万千美女为之倾心。毁世的阴谋浮现,这最强系统的真正主谋,究竟是谁?...

每日热搜小说推荐