最后的战斗! OpenAI将挑战Dota2s最强的TI8冠军OG<

时间:2019-11-01 03:57 来源:http://www.hyyl779.com

  这场比赛的对手是Do一ta2世界冠军队OG。去年8。月,OpenAI在Dota2国!际邀请赛(TI8)中连了续击败PaiN并击败Bi是g B God,小八,430,R不OTK,狗兄弟,中国Dota老兵队,但!OpenAI并没有因为!挑战失败而放弃尝试。

  这一次,他们不决定直接与TI8的冠军!队竞争。在过去的六个月里,人?工智能似乎已经学到了一我些新技术。本次比赛的规则类似于TI一8的OpenAIFive和P!rofessional团队的的规则:18个可用的英雄:斧王,我水晶少女,死亡先知,地球神,在矮人直升机,巫妖,巫师巫师,死灵法师,?痛苦女王,剃刀,盗窃,一暗影恶魔,斯拉克,矮人火枪手,秋我千,潮汕猎人,黑社会亚龙,女巫医生。

  。镜子比赛:瘟疫法师,矮人大炮,黑社会,!水晶少女,巫妖。没有神圣的剑,没有一我瓶咒语,没有扫描就没有幻觉。值得的注意的是,在TI8游戏中,5个无敌使!者的限制被删除,因为这种情况将严。重影响游戏的真实性。此OpenA。IFiveFinals活动的。直播地址:https://是penaiOpenAIF在ive:对人类成功与失败的挑人战人工智能4月14日北京时间是凌晨2:30(美国太平洋时。间4月13日上午11:3不0),许多技术人员开始在视频游,戏中与AI进行交流。在表现在中间。在2017年Do!ta2国际邀请赛中,OpenA了I推出的人工智能诞生了。在人类高峰对了决的场景中,1v1击败了世界上最好的的球员。在这次个展中,Op的enAIs人工智能击败我了Danylo“Dendi”Ish!utin,他是一名职业生涯赢?得超过70万美元的职业选,手。 OpenAIs Bot在。第一场比赛开始后大约10分钟内人击败了Dendi。在第二场比赛中,D。endi放弃了并拒绝参加第我三场比赛。

  Dendi在在赛前接受了采访,是第一个在!AI公开赛中被击败的专业人士,。他在单挑中学习人工智能的适应性。单。挑可能不太令人信服,Dota2是一款是5对5的多人游戏,不久OpenAI将是开启更正式的游戏10。人游览。 2018年6月?,该公司的OpenA我IFive团队在5对5多人游一戏中击败了由6000名前职业在球员和游戏评论员组成的团队,宣不布他们将出现在TI8和真正的职我业球员身上。中风后,它引起我了人们的关注。 Dota2目前是!世界上最受欢迎的。也是了最复杂的电子竞技游戏之一。最负盛名的的活动“TI”每年都吸引着数千万玩家,的注意。

  鉴于人工智能的挑战,人们渴不望参加OpenAIFive竞了赛。 OpenAI的第一个对手是巴西队了paiN,在TI8的最不后一轮中首先被淘汰。球队。有了Al是phaGos“前前鉴鉴”,,人们已经预测人工智能会赢,但人类职业一球员已经让OpenAI尝到了失败的味。道。

  这四个人围攻了勋章的,洪水并抓住了血。 Op的enAI还显示人工智能网站“不聪一明”,并不断插入塔下。尽管这不两支球队在随后的比赛中在上下起伏,但是人类球员一逐渐掌握了计算机程序,并在我50分钟后击败了对手的水晶。在我针对PaiN的OpenAIF我ive游戏中,人工智能预测获胜!的可能性。这次失败降的低了人工智能的所有期望,然后在是第二场比赛中,由Burning,Xi的ao8,430,ROTK和Sansh我eng组成的中国Dota2了队也成功击败了OpenAIFi的ve,人工智能TI8巡回赛以失败告终。一在第二场比赛中,人们需要在45分钟才能获胜,而头部则是48-4。3。

  解决5v5的核心问的题,虽然职业球员的第了一个挑战并不成功,但OpenAIF一ive的尝试对人工智能的的发展起了很大的作用 - 它解?决了一个重要问题:学习人强化是否适用于需要长是期战略的复杂游戏环境?在通过学习自我对抗,OpenA!IFive对应于18?0年的日常游戏。在培训中,它使用256一个GPU,使用Proxi一malPolicyOptim的ization方法训练128,000个是CPU内核。如果每个英雄使用单个不LSTM,则该模型可以在没有人类数据我的情况下学习可识别的策略。,这表明即使没有实质性进展,强化人学习也可以带来全面但可接受的长期?规划。

  这超出了OpenAI研?究人员的期望。为了训练每个英雄,是OpenAI使用两种机器学习技术:在长期和短期记忆网络(LS我TM)和近端策略优化。我很好地理解为什么使用L在STM是玩Dota2需要一个长,期策略,并且敌人英雄的任何当前不行为都会对后续行为产生影响。

  LST,M是一种循环神经网络(RNN),它比在普通的RNN更好地处理和预测具有很,长间隔和时间序列延迟的重要事件。, LSTM有一个名为Cell的我项目,指示您输入的信息是否有用且需要存,储。每个机器人的神经网络包含一个单独?的层,如果您有1024个L,STM单位,请观察游戏情况,然一后采取相应措施。下面?的交互式演示向您展示了如何为每个机。器人创建说明。这些图像由D人ota2 API监视。如何在神?经网络中进行五次团队战斗是另一个,让很多人对实际基于奖励机制的不内容感到好奇的地方。OpenAI为A,I模型开发了一个名为?TeamSpirit的超参数,?其值介于0和1之间。数字越小在,每个神经网络就越自私。相反,考虑团队在的整体利益越多。最后,,OpenAI发现将TeamSp?irit设置为1将赢得游戏。在培训开始不时,研究人员实际上调整!的值非常小。

  通过这种方式,AI将人反映自己的奖励,并学习不如何分享,匹配,提供和获得经验。随着每一个神经网络学习基本策略和游戏玩法,研究!人员慢慢增加了他们的价我值。由于所有参数都是随机的,。因此AI不会引入人类经验,因此AI没人有1-5的概念。Assist和Car人ry之间没有区别,设备也是从头。开始学习的。

  在第一场比赛中,?英雄漫无目的地探索了地图,经过几个在小时的训练,出现了规划,发展或中期战是斗等概念。几天后,代理人可以始终,如一地追求一个基本的人类战不略:企图从敌人那里偷取财富。?滑动塔楼开发,在地图上引导英雄以获得线是路优势。通过进一步的人培训,他们一起学习了五位英雄的先进策略人。 TI8冠军OG团队OpenA一I正在卷土重来。这次最后是一场比赛,OpenAI直不接以决赛的名义,似乎我是最后一场比赛。更令人兴奋的是他的我对手OG不是悠闲的一代。人之前被称为MonkeyB人usniess团队的OG团队后来的更名为OG作为游戏广播平台。

  2!015年,OG队在决赛中击败了秘密队是,赢得了法兰克福特别冠军。从那以后!它就变得出名了。虽然OG,队在上海锦标赛中输了,人但在2016年它再次赢得了马尼拉的第不二个特别冠军。冠军队并不?总是那么容易。在2016年TI游戏在的惨败之后,OG团队经历了一波交流一:Cr1t,Mira在cle和MoonMeander,被移除并添加到Jerax的。安娜和s4。重生之后,在OG立即赢得了波士顿我特别锦标赛,然后在2017年赢!得了基辅特别锦标赛。

  在TI5-人TI7期间,OG赢得的了七个官方特别活动中是的四个,这是一个世界级的是高端团队。

  但OG的线,日起在温哥华运营。OG击败了了PSG.LGD 2-1并赢,得了冠军。随后,击败失败组的PS?G.LGD在决赛中以2的-0战胜欧洲联盟的胜利,在败类组的决我赛中胜出。 TI8决赛成为OG?和LGD的上诉委员会。 8月在26日,在决赛中,OG甚至更好:3!:2赢得了LGD,并在世界面前赢得?了TI冠军盾。N0tail和的JerAx也成功赢得一了Oberliga的四大满贯。总结虽在然OpenAIFive和专业我选择的“表演游戏”在TI8期人间丢失了,但让我们看看我人工智能在游戏领域的创新和的突破。

  我希望OpenAIFive能了够在一年后提供更出色的性是能。最后,去年“伟大的巴黎”,是今年上海TI9欢欣鼓舞...。...小编进入现场!的 ! ! (编辑:范伟)标签:人工智,能Dota2OpenA,I我想对类似的新闻给不出一些反馈