清远市
魔方信息技术有限公司

NEWS新闻

最近正在折腾...
Recently is to do ...

2017年,AI在人类 设计的所有游戏中都打败了人类

UPTATED:2017/12/28 16:12:08 | 分类:公司新闻

aa2.jpeg

【网易智能讯 12月28日消息】在20世纪的大部分时间里,国际象 棋是人工智能研究人员的一个基准。早在上世纪50年代初,约翰?麦卡锡提出了“人工智能”一词,他曾把国际象棋称为“人工智能领域的果蝇”,这一说 法来源于早期对果蝇的研究对遗传学领域的影响。

上世纪90年代末,IBM的“深蓝”与世界冠军加里?卡斯帕 罗夫进行了一系列国际象棋比赛。

在1997年,深蓝最 终击败了卡斯帕罗夫,这是机 器第一次在比赛中击败世界冠军。到本世纪早中期,这项技 术已经进步到了一定程度,在几乎 所有不同玩法的游戏中,机器都 在不断地打败国际象棋大师。

自然而然地,人工智 能开发者开始转向其他更复杂的游戏,以测试 他们日益复杂的算法。在过去的12个月里,人工智 能跨越了一系列的新门槛,最终在 各种不同的游戏中击败了人类玩家,从古老 的围棋游戏到动态互动的纸牌游戏,德州扑克。

从国际象棋到围棋

上世纪90年代末,机器终 于彻底打败了国际象棋大师后,一位来 自普林斯顿的天体物理学家评论说,“可能要等上一百年,电脑才 能在围棋中打败人类——甚至可能更长。”

于是计 算机科学家们又把研究的注意力转向围棋,这是一 个来自中国的古老的策略游戏,非常容易学会,但是很难做到精通。

在过去的十年中,机器学 习的发展创造了真正有竞争力的人工智能围棋选手。2014年,谷歌开 始开发一个名为AlphaGo的深度学习神经网络。在经历 了几年的接近成功之后,开发团 队尝试了一些不同的东西。

在2016年末,一个名为“Master”的神秘 网络围棋选手出现在了亚洲热门游戏服务器Tygem上。在接下来的几天里,这个神 秘的玩家在于许多世界冠军的比赛中占据了主导位置。到2017年1月4日,官方确认“Master”实际上是DeepMind的AI AlphaGo的最新版本。

2017年5月,AlphaGo “Master”打败了柯洁——世界上 排名第一的围棋选手。在AlphaGo和柯洁 对战的三场比赛中,这台机 器一直处于优势地位,但最令人吃惊的是,在10月份的时候,谷歌已 经研究出了一个比“Master”更先进的AlphaGo版本。

aa1.jpeg

根据《自然》杂志的一篇文章中,AlphaGo Zero是一种革命性的算法,它能够 迅速地自学围棋。这个系 统一遍又一遍地与自己对战,掌握了 不同情况下的游戏方法。经过21天的学习,AlphaGo Zero已经达到了“Master”的水平。40天后,它就已 经超过了之前所有版本的技能水平。

到2017年12月,DeepMind推出了 一个更先进的系统版本。这款名为AlphaZero的新人 工智能可以在几小时内掌握多种游戏。经过8个小时的自我训练,该系统 不仅可以击败之前的AlphaGo Zero,还可以 完全掌握国际象棋和日本将棋。

掌握扑克牌中的“欺诈”术

尽管围 棋游戏的复杂度已经非常之高,但对于人工智能来说,围棋和 扑克采用是两种完全不同的模式。要想在 扑克游戏中取胜,你需要 掌握一定的欺诈技能。欺诈以 及识别他人的欺诈是在纸牌游戏中取胜需要掌握的关键技能。

经过十多年的尝试,在2017年,两项独立研究显示,人工智 能终于打败了一流的扑克牌专业人士。来自加 拿大阿尔伯塔大学的研究人员推出了一个人工智能系统,DeepStack,它可以 用一种人工智能形式的“直觉”来全面 控制人类扑克玩家。

卡内基 梅隆大学的一个研究小组在2017年1月举办 了一场更加公开的活动,当时它的Libratus AI系统花了20天时间,与四名 专业的扑克玩家一起玩了12万局无限注“德州扑克”。尽管专 业人士每天晚上都在讨论他们可以利用人工智能的哪些弱点,但这台 机器每天都在改进自身,修补游 戏玩法中的漏洞,改进策略。

人类的 大脑无法与机器匹敌,在经过 近一个月的不间断游戏之后,这台机器总共赢了170万美元,而这4位专业 人士中的每一位都损失了数千美元的虚拟货币。其中一名专业玩家对《连线》杂志说:“在这次激烈的比赛中,我感觉 自己在和一个作弊的人比赛,就好像 我的牌可以被他看到一样。我不是在指责它作弊。这其实是一件好事。”

埃隆·马斯克的AI研究

2015年,埃隆?马斯克 和一小群投资者成立了一个名为OpenAI的项目。该项目 旨在探索人工智能系统的发展,尤其是 在强化学习方面。在这种系统中,机器可 以教会自己如何在特定的任务中提高自己的能力。

2017年8月,OpenAI团队将 目光投向了征服Dota 2,这是一场名为“The International”的大型 电子竞技锦标赛中的核心比赛。Dota 2是一款 非常受欢迎且非诚复杂的多人在线对战游戏,在竞技 游戏领域是一项严肃的比赛。

aa3.jpeg

在仅仅 两周的学习之后,OpenAI机器人 就加入到了这场锦标赛中,随后击 败了世界上的几名顶尖选手。目前人 工智能系统只被训练过较为简单的一对一版本的游戏,但OpenAI团队正在研究如何让AI掌握五对五的“团队”游戏。

AI通过分工玩转“吃豆人”游戏

几年前,谷歌DeepMind对其人工智能在49款雅达利2600的游戏中进行了训练。只要有 和人类玩家相同的输入,AI就会知 道如何玩这些游戏并在游戏中获胜。事实证明,有些游 戏确实比其他游戏更难以驾驭,在这些经典的、众所周 知非常困难的游戏中,20世纪80年代的一款电子游戏“吃豆人”尤其具有挑战性。

2017年,谷歌收购了一家名为Maluuba的深度学习创业公司,并将其并入DeepMind。Maluuba的新型 机器学习方法被称为“混合式奖赏架构”(HRA)。将这种 方法应用到吃豆人系统中,该系统创建了150多个个体代理,每一个 都有特定的目标——比如找 到一个特定的豆子,或者避免幽灵。

aa4.jpeg

HRA方法生 成一个高级代理,类似于高级经理。在做出 每一步的最终决定之前,这个高 级代理会评估所有来自下级代理的建议。这种方 法被委婉地称为“分而治之”,即把复 杂的任务分解成更小的部分。

在将这 个方法应用到吃豆人之后,AI很快就 掌握了如何获得999990分的高分,这是之 前没有人或人工智能能做到的。

AI将开始设计游戏

如果人 工智能能在几乎每一场比赛中击败我们,那我们 下一步该干什么?

法尔茅 斯大学的一名研究人员最近公布了一种机器学习算法,他声称 这一算法可以为我们创造出自己的游戏,我们从零开始玩游戏。这个人 工智能系统名为Angelina,它每天 都在不断改进自己,但目前 它已经可以利用从维基百科共享到在线报纸以及社交媒体等各种来源的数据集制作游戏。

那么这 一切意味着什么呢?

也许2017年最重大、最可怕 的发展是强化学习系统的巨大进步。这些程 序可以有效地教会它们自己如何掌握新技能。例如,最近的AlphaZero迭代可 以在几天的自主学习之后,在一些 游戏中获得超能力。

一项对350多名人 工智能研究人员进行的大规模调查显示,人工智 能还不足以打败我们。这项调查预测,在10年内,人工智 能将会比我们更优秀,到2049年它将 能够写出一部畅销小说,到2053年,它将会 比人类在外科手术中表现的更好。事实上,该调查得出的结论是,到2060年,人工智能将有50%的几率 能够完成我们所能做的所有事情,并且效果会更好。

2017年无疑 是人工智能在日益复杂的游戏中打败人类的里程碑式的一年,尽管这 看起来是一项微不足道的成就,但它的影响是巨大的。许多这 些人工智能开发公司正迅速将目光投向现实世界的挑战。

谷歌DeepMind已经将AlphaGo Zero的系统 应用到了其他领域,并进行 了一项有关蛋白质折叠的全面研究,以期揭 示治疗阿兹海默和帕金森等疾病的治疗方法。


“最终,我们希 望利用像这样的算法突破来帮助解决各种现实世界问题中亟待解决的问题,”DeepMind的共同 创始人兼首席执行官杰米斯?哈扎比斯(Demis Hassabis)说,“如果类 似的技术可以应用于其他结构性问题,比如蛋白质折叠、减少能 源消耗或寻找革命性新材料,那么取 得的突破将有可能加强人类对这个世界的理解,并对我 们所有人的生活产生积极影响。”


友情链接:    彩票网投开户   918彩票   GPK棋牌最新版本   918彩票   金龙棋牌游戏