AlphaGo之父:人工智能必须在伦理和道德框架内被恰当运用
Deepmind公司于2010年在伦敦创立,2014年加入谷歌,目前有500名员工,其中包括250位研究科学家。其目标为通过打造实施人工智能的“阿波罗计划”来研发科学的新方式,从而“攻克智能,再用智能解决所有问题”。Deepmind为广大中国人所熟知是在去年,其研发的AlphaGo人工智能程序在五番棋较量中战胜前世界第一、韩国棋手李世石,震惊全世界。“我们最新的AlphaGo系统已经研发了三年的时间了,为什么最终会选择围棋作为突破口呢?因为计算机下围棋是非常困难的,其复杂程度让穷举搜索都难以解决问题,”哈萨比斯认为围棋不可能通过写出评估程序来决定输赢,同时搜索空间又太过庞大,这让它成为人工智能技术最好的试金石,“围棋不像象棋等游戏是靠计算来竞技的,它是靠直觉。另外围棋是筑防游戏,本来棋盘是空的,要往上面摆子,而不像国际象棋那样本来棋盘就已经固定了棋子的初始位置,因此需要盘算未来。
另外在围棋中没有等级概念,所有棋子都是一样的。”哈萨比斯强调小小一子就有撼动全局的力量,“妙手如同受到天启,玄妙深奥!”哈萨比斯充满神秘感地说到。事实上,在前天与柯洁的首回合较量中,AlphaGo就曾经弈出过这样的妙手。当执白的Al-phaGo第54手“断”时,柯洁瞬间震惊了,“这种棋不可能在人类棋局中出现,AlphaGo就是围棋上帝!”
在此前同李世石的对局中,AphaGo也屡屡展现“妙手”的威力,并让对手得到了启迪,“我认为这给围棋引入了新思路,我感觉找到了自己下棋的理由,”李世石赛后说。值得一提的是,Al-phaGo与李世石的五番棋较量吸引了2.8亿观众,媒体相关报道达到3.5万篇,也带动棋盘销售量增幅10倍。
哈萨比斯认为目前AlphaGo已经能够模仿人的直觉,而在创造力方面尽管所触及的领域有限,但它也已经显示出了具有这样的能力。“信息过载和系统冗杂是巨大挑战,开发人工智能技术可能是这些问题的解决方案,同时通过人工智能技术将帮助我们更好理解人脑的奥秘,”哈萨比斯在其演讲行将结束时表示,同时他强调,“人工智能必须在伦理和道德框架内被恰当运用才能够造福人类。”
AlphaGo首席科学家:围棋世界人工智能面临着巨大挑战
此后登场的AlphaGo首席科学家大卫·席尔瓦详细介绍了Al-phaGo运作的基本原理。“它采用的是卷积神经网络,一种包括了策略网络与价值网络的神经网络,”大卫表示,策略网络是为了确保AlphaGo选择最好的一步,而价值网络可以预测每一步之后谁要赢,“这是为未来的输赢做一个预测,不是静态的去看这一步棋下在哪里,”大卫强调以策略网络减少问题的宽度,而价值网络则减少了其深度。“首先我们要有人类专家的大量的数据库,这样通过策略网络调整,让机器可以走出和人类大师一样的棋,达到监督式学习的目的,同时为强化学习做好准备,”在谈到AlphaGo学习过程时大卫说,“我们用最好最可用的数据来训练它,而最好的数据不是来自人类,是来自它自己。自己做自己的老师,也就是说,这一代AlphaGo会成为下一代的老师。”通过自我对弈进行强化学习,正是AlphaGo最强大的地方之一。也正是这种令人类匪夷所思的“双手互搏”式学习方法让柯洁彻底打消了之后继续与人工智能作战的想法,“它进步和提升得太快了,我们人类仅靠自身是不能弥补这种差距的,”前天首回合落败后,柯洁对记者如是说。
值得一提的是,与一般人所设想的不同。新一代的AlphaGo运算量在不断减少,目前与柯洁的对弈的版本只是之前对战李世石时运算量的1/10。“深蓝每秒可以进行1亿次运算,而AlphaGo则要少得多。可以说,AlphaGo比深蓝更聪明,而不是更快,”大卫深入浅出地说。“围棋是人类历史上最古老、研究最深入的游戏,也是构建和理解运算的最佳实验台,”在谈到人机大战这个话题时大卫说,“柯洁已经站在了人类知识金字塔的最顶峰,而在围棋世界人工智能面临着巨大挑战。”郭健
新闻推荐
长沙市住房和城乡建设委员会5月20日发布新的楼市调控政策,限购对象扩大至本市户籍家庭,限购范围也从新房扩大至二手房,其中本市户籍家庭限购两套房。根据长沙市住建委的新规,暂停对在限购区...