普朗克
普朗克最新资讯,36氪聚合所有普朗克相关的文章报道,并为你提供最新的相关资讯。
本次共找到 190 条【
普朗克
】相关信息

Google DeepMind团队在《自然》杂志发表论文,公布玩游戏比人厉害的AI是如何做出来的

电脑会玩游戏已经不算稀奇,比方说,一般人玩棋类游戏已经玩不过计算机了。但如果事先不告诉计算机应该怎么玩,而只是给它提供这三样东西:控制器、显示器、游戏得分,让它看着显示器的显示控制控制器,然后要求它尽可能得高分,那基本上大部分的AI就一筹莫展了。 所以,当2013年12月DeepMind的团队首次展现他们靠不断试错学习最后成为击败人类专业玩家的游戏高手AI时,许多在场的AI专家都感到有些震惊。这些AI靠着对游戏视频的观察来寻找出模式,然后操作控制器,并获得得分的反馈结果(高分奖励)。在反馈中不断调整自己的控制,最后AI完全靠自学而不是编码学会了玩49种Atari视频游戏,其中43种游戏玩得比之前的AI都要好;并在23种游戏中击败了人类的职业玩家。这些游戏当中,简单的弹球和拳击游戏AI玩得最好,但是像经典的消砖块Breakout游戏也能玩得很好,甚至还学会了打开一条通道让球跑到后面去消掉砖块(参见下面视频,注意观察AI如何在游戏中改进自己的策略),这种技巧往往只有老练的玩家才会。许多研究人员1年后对他们如何做到仍感到困惑不已。不过现在他们不用困惑了,因为DeepMind团队现在已经在《自然》杂志上公布了自己的研究成果:Human-level control through deep reinforcement learning—通过深度强化学习实现人类水平的控制。 总的说来,DeepMind的AI的设计核心是如何让计算机自行发现数据中存在的模式。其解决方案是深度神经网络与强化学习等方法的的结合。AI并并不知道游戏规则,而是用深度神经网络来了解游戏的状态,找出哪一种行为
boxi2015-02-26
36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业