首页 > 科幻 > 从信息学霸到神级科学家 > 第48章 这策划也是恶鬼么(求追读)
下载

请安装我们的客户端

终生免费,永无广告!

第48章 这策划也是恶鬼么(求追读)(1/2)

目录
好书推荐:

看朱宇还在打,江铭便搬了个椅子凑到他身后坐下。

既然接了这个活,他也想先提前了解一下游戏的内容。

朱宇此时还不知道江铭已经和游戏的狗策划达成了什么邪恶的协议,准备设计出一些超越全世界狗策划的邪恶算法。

他对于突然对游戏产生兴趣的江铭报以最大的善意,一边打boss一边贴心为江铭解释。

“你看,这个boss的名字叫嗜血领主。他的走位看似随机,实际上是有规律的。”,朱宇操控角色向左一个翻滚,险之又险地躲过boss的斩击。

江铭盯着boss的走位看了半天,还是没看出来到底有什么规律。

“你看,如果我现在的角色是远位置,且躲过了他的远程攻击,那么boss会向侧面猛跑,再突然俯冲到近身位置,配合一个突刺。”,朱宇不愧是死过上百次的老玩家,讲的头头是道。

“因此,一旦我躲过了远程攻击,我可以立刻趁着boss跑向侧面的空档,原地喝血瓶或者喝蓝瓶补充数值,然后就是现在!”

他的角色趁着boss俯冲突刺的时候,正好嗑完一个蓝瓶,又是一个翻滚躲过攻击,然后起身,趁着boss的攻击后摇没结束的时候,抬手挥砍,刮掉boss一小格血。

江铭大惊,真被他说中了!

“boss被近战攻击的时候,有两种可能。”,朱宇继续边玩边讲:“拉远走位准备远程攻击,或者原地放范围技能。”

他又操作角色灵活地一个小跳跃,正好躲过boss的捶地技能。

“然后就是boss的两段式蓄力挥砍,这个时候只能后退,如果想要上前贪刀很容易就会被一波带走。”

朱宇的玩法又怂又贱,但是有着长时间熟练度的加持,就像是能预知未来一般,一下都没被boss碰到。

“原来这就是所谓的固定的作战模式么...”,江铭若有所思。

其实从他的角度来看,这个boss并不是像朱宇所说的那么傻。

根据玩家距离角色的距离不同,大致可以分成近身、中场、远场三种模式。

而每种模式,又分别有两到三种可选的后续走位和攻击方式。

这么一组合,boss的攻击就显得变幻莫测了起来,只有像朱宇一样死上几百次,才能把boss的行动盘的清清楚楚。

“哈哈,终于被我打过啦!小小嗜血领主不过如此啊!”,没想到朱宇一边解说一边打,反而思路更为清晰,一举通过了这个关卡。

江铭还在旁边思考着,默不作声。

他好像搞明白boss行为策略的问题在哪里了!

问题的关键就在于,无论怎么设计,机器的策略是固定的。

虽然可以根据不同的情况,组合出不同的行为,但归根结底,还是固定的策略。

而玩家是可以不断学习总结的!

就像朱宇,他不断试错,总能摸清一些boss的规律,甚至还能提炼出一些诸如躲过远程攻击后喝药,闪避后普攻的笼统策略来。

打得越多就会越了解,了解越多就会找到一些反制策略。

而如果boss也和玩家一样能学习呢?

江铭再一次用略带愧疚的眼神看了一眼朱宇。

他想了一下,假如朱宇能学会躲过boss一发穿云箭之后原地嗑血瓶,那boss能不能学会射出一发穿云箭之后再接一发呢?

这样的话,就彻底把游戏打进未知领域了吧,人和神在战场上互相比拼谁最先破解对方的策略,想想就令人激动。

江铭马上回到自己桌前研究了起来。

如果要让boss都能不断学习进步,其实还是策略梯度算法那一套,不过有一些要修改的部分。

首先不能像汽车巡航的时候那样,从零开始学习。

需要先得有一个基础的策略,然后再在和玩家的对战中学习。

其次是boss的动作是从多个攻击方式和走位选择中选择一个来做,这意味着动作选择是离散的,而不像自适应控制算法那样输出一个连续值。

江铭仔细想了想,略微修改了一下智能体的神经网络。

在自适应控制中,为了探索不同的动作,真实的动作是从一个以神经网络的输出为均值的正态分布中采样得到的。

因此只需要神经网络输出一个值即可。

而现在,需要boss从众多可选的攻击走位决策中选择一个。

江铭在神经网络的最后加了一层softmax函数,用来生成决策的分布,这样就让boss能探索不同的决策的好坏了...

...

“呼,游戏打的好累啊!”,朱宇伸了个懒腰,顺手把游戏存了个档。

“咦,你在写什么啊?怎么还用上了我刚才游戏的截图?”,他发现江铭正坐在电脑前写写画画,屏幕里赫然是《恶鬼之魂》的游戏画

本章未完,点击下一页继续阅读。

不想错过《从信息学霸到神级科学家》更新?安装看书屋专用APP,作者更新立即推送!终生免费,永无广告!可换源阅读!

放弃 立即下载
书页 目录
阅读推荐: 宿命之环 帝国之刃 今天开始当城主 诸天窃贼 长生修仙:我能用族人的气血加点 大奥术师她今天赚钱了吗 这本小说很健康 我在星际炼丹封神 人道大圣 斗破:家祖玄帝萧玄
返回顶部