珍珑“最优解”认定规则的进一步细化解释...
 
Notifications
Clear all

珍珑“最优解”认定规则的进一步细化解释(意见征求中)


OTZzzz
Posts: 86
管理员
Topic starter
(@otzzzz)
Member
Joined: 3 years ago

之前的专栏里,我们已经讨论了衡量珍珑里高精度操作的相关标准,也涉及到了一般珍珑的最优解认定规则,重述如下:

对于常规珍珑里的高精度操作,从三方面衡量,一是合规性(10-20-30标准),二是完备性(最高过率≥99%),三是稳定性(浮动过率≥95%)。

对于一般珍珑的“最优解”,也有三条标准,一是期望最优,二是成功率≥90%,三是与任何其他解法保持至少15阳光的期望优势。可简述为“期望最优、九成过率、15期望优势”。为交流方便,现称此三条为“基础最优解标准”。

对于大部分珍珑而言,使用基础最优解标准便足以涵盖最优解认定的方方面面。但我们也需要考虑若干例外情况。

首先,解法的异同取决于指导性思路的异同,不取决于微小细节的异同。以前仆后继的5路为例,【单发 小向 火树 地刺 土豆】的单破中,期望最优解为7列小鬼,观察单发相位后补杆,次优解为小鬼引雷后不观察相位直接补杆。尽管此两种解法存在期望差异,但我们认为这样的差异在思路层面是微小的,且与此图的关键性思路无关。因此,无论采取哪种操作,都仍属于同一套解法。换句话说,这样的期望差异是不包含在“15期望优势”的限制中的,不构成“多解失题”。

我们有足够的理由支持这一点。几乎任何珍珑的预设最优解都存在略微错开僵尸放置时机后的“次优解”。例如,原本delay910-919的1列精确矿操作,我偏偏错开5cs,改为delay915-924,略微降低过率,但期望差仍保持在15以内。难道这种“次优解”的存在违反了15期望优势的规则吗?显然不会。准确来说,这两种操作仍都属于同一套解法,因为其关键性思路是相通的。

对于执行同一解法时存在多个操作选择的,15阳光期望优势规则不适用。“操作选择”包括僵尸放置列数,操作时机,僵尸种类选择(路障vs撑杆)等。通常而言,不同操作选择之间仅替换至多一个僵尸,且花费阳光总数是相同的。

不仅如此,在可测定范围内,我们通常只取所有操作选择中的期望显著最优者。【小向 单发 小向 小向 小喷】是最常见的操作选择之一。如果出现在珍珑里,应取路障为唯一最优解;大概率通过的撑杆尽管期望花费接近,但不适用于15阳光期望优势规则,不影响最优解认定。当然,在实际实践中,如果细节过于微小,也存在不予讨论的情况,例如第4届智商杯认为前仆后继5路无论是否卡相位都是正解,第5届智商杯认为舍本逐末2路舞王无论是否卡三线相位都是正解等。

除了“解法相同,操作选择不同”(多选择)之外,我们还要考虑“同一操作选择对应不同分支情况”(多分支)的问题。“多选择”与“多分支”的区别在于,前者的决策是先决性的,在放置第一个僵尸前就已决定要采取不同的操作方法;而后者的决策是即时性的,即:初始操作策略相同,但在之后根据场上植物僵尸的可观察情况,判断并执行不同的后续操作分支。【小向 单发 小向 小向 小喷】属于“多选择”(前文已述);【单发 小向 小向 小向 小向】则是很典型的“多分支”,路障啃食完毕2列植物后根据路障速度、路障剩余血量等可见信息,判断接下来执行的操作分支(什么都不补/补小鬼/补75/继续观察)。

珍珑里的“多分支”可分为两类,一是平凡多分支,二是非平凡多分支。前者主要用于指代“无需重点提及的补刀操作”,上文中路障对底线单发的例子就属于此类。第五届智商杯的规则解释中,对此的具体定义为“非系统性的,非时机性的,或经典朴素的补刀操作”。

其一,非系统性的补刀操作,比如某舞王极小概率死亡,而如果死亡,此时场上剩余伴舞和植物有很多种不同情况,若要逐一说明过于琐碎,所以不必提及;其二,不具有时机性的补刀操作,即若需要补刀,不必即时做出决策,可以等到场上僵尸全部死亡后在慢慢思考作出相应补刀操作,通常来说,这种情形下相应补刀操作的决策较为简单、顺理成章,所以不必提及;其三,经典、朴素的补刀操作,比如路障过底线单发,若路障速度较慢应适时补小鬼,此乃玩家间的常识,所以不必特地提及。

平凡多分支的最大特点是某一分支占领绝对主导地位,其余所有分支皆基于主分支执行后的补刀需求,且即使不一一点明这些分支,仅阐明主分支,也基本不影响解法的完整性。实践中,为精简描述,通常使用“看情况补刀”以涵盖平凡多分支里除主分支外的派生情况。

对于珍珑里的平凡多分支,我们认为基础最优解标准仍旧适用。特别地,主分支的成功率应≥90%。若不满足此条件,则会不可避免地损害解法稳定性,从而对珍珑整体质量产生负面影响,因为根据上述定义,主分支以外的补刀分支并不具备等同的思维质量与操作技巧性,这样的补刀分支若出现概率超过10%,一定程度上反映了预设解在稳定性上的缺陷。

非平凡多分支,或常说的“非定态”,则需要另行讨论。最早含有非平凡多分支的珍珑之一是连环计的前身,即使用三小鬼单破【大嘴 小向 土豆 小向 冰豆】。其具体操作策略为:先快速连放2小鬼,即将啃完冰豆时对小鬼状态进行观察,若双鬼均被减速,迅速补第三鬼并引雷;若仅一鬼被减速,则等未被减速的鬼引雷后再上第三鬼。第一鬼栈位低于第二鬼时,第一种情况出现概率约98%;若第一鬼栈位高于第二鬼,第一种情况出现概率约72%。在僵尸栈位大小关系随机的假设下,采取分支一(迅速补鬼)的综合概率约为85%;采取分支二(引雷后补鬼)的综合概率约为15%。

像这种多分支情况,迅速补鬼的操作策略具备系统性,时机性,且不属于经典朴素补刀,故应认定为非平凡多分支。此时,由于两种分支情况具备同样的思维质量与操作技巧性,我们需要对“9成过率”的要求进行适当调整,即:认为此两种分支均为预设解法的一部分,要求此两种分支的综合成功率之和超过90%。

至此,我们已经讨论完毕了“多选择”、“多分支”的绝大部分概念性问题。在实际操作中,有时存在分支判定过于困难的。比如“若某僵尸速度较快,执行分支A;否则执行分支B”这样的解法,可能在界定“快”与“慢”时会产生一定争议。特此,我们做出规定如下:原则上分支执行只能基于离散信息,而非连续信息。连环计中仅单鬼被减速还是双鬼均被减速属于离散信息,且两鬼开始啃食冰豆后就已唯一确定,不存在分支判断上的困难。但类似金蝉脱壳这样需判断僵尸速度快慢,并执行不同分支的,我们要求预设解法中给出可用于作为稳定参考的最优或较优离散标准,例如“某僵尸开始啃食4列植物时,若剩余血量大于x,则执行分支A;否则执行分支B”等,否则视为预设解法不完整,搁置最优解认定,直至解法完整时。

14 Replies
OTZzzz
Posts: 86
管理员
Topic starter
(@otzzzz)
Member
Joined: 3 years ago

关于珍珑里的栈位:

现行共识是除开局外,默认植物与僵尸各自内部的栈位大小关系均视为随机,具体数值不特定;开局则遵循游戏原本的生成规律,即:僵尸栈位自栈顶起为7654321089X或8765432109X(X代表从10开始等差为1的递增数列),植物栈位按种类存在唯一确定的大小关系。

此共识已实践多年。之所以认为栈位具体数值不特定,是因为暂未发现栈位的具体数值(而非栈位之间的大小关系)存在任何对游戏机制的影响。不排除未来发现影响并修改此一部分的可能性。

 

关于栈位信息的获得与利用:

只允许通过可观察的游戏内现象判断植物或僵尸的栈位大小关系。特别地,允许基于已观察到的僵尸栈位大小严格控制后续放置的僵尸栈位大小(即“控栈”)。

注:允许通过图层上下关系判断植物或僵尸之间的栈位大小。这包括植物之间贴图出现重叠的情况,例如【大喷 裂荚】,但暂未发现此现象有任何实际效益。

 

关于小喷坐标偏移:

前置知识:小喷坐标(x,y)的偏移范围为(-5~+4, -3~+2),单位为像素。游戏使用整数型存储植物坐标,故不存在小数点问题,小喷的坐标偏移是以1像素为基础单位均匀离散分布的。根据游戏渲染机制,能从画面中获得的贴图信息最小单位也是1像素,因此一张清晰完整的800*600游戏截图便足以涵盖所有关于小喷位置的信息。

珍珑相关规定:默认小喷x坐标偏移按游戏原本生成规律进行随机,不允许将小喷x坐标偏移锁定为任何值。y坐标偏移暂未发现有任何实质影响,故不作限制。

注:不允许将x偏移锁定为任何值既包括了将小喷锁定于原位,也包括指定非零偏移值(例如“极左小喷”、“极右小喷”等)。

以上共识也已实践多年。

Reply
OTZzzz
Posts: 86
管理员
Topic starter
(@otzzzz)
Member
Joined: 3 years ago

关于特殊珍珑里开局珍珑的最优解认定:

※开局珍珑属于特殊珍珑,是因为指定了当前关数为1,并隐性地指定了起始阳光为150,导致解阵前提由“起手阳光充足”变为“起手阳光极其有限”。不仅如此,开局珍珑里的僵尸、植物栈位均在一定程度上可以推定,与常规珍珑默认的栈位信息量有显著差异。

 

和常规珍珑类似,开局珍珑的最优解认定方法大体类似,完全继承基础最优解标准,即:“期望最优”、“九成过率”、“15期望优势”。

在此基础上,开局珍珑的最优解还应满足:过关率≥99%。

此处,过关率的定义为“通过当前关卡的概率”。

 

之所以增加此一标准,是因为与常规珍珑里起手阳光充足的情况不同,开局的起手阳光有限,因此一小部分解法存在某僵尸因小概率事件未能达到预期目标,从而导致没有更多阳光继续进行后续操作,过不去当前关卡的情况。由于这种情况严重性较高,我们要求最优解应尽可能压低此类情况出现的概率,即:过关率不应低于99%。

 

关于开局珍珑里的拼运气操作:开局珍珑与常规珍珑相同,均属于游戏前中期,正确过关后的剩余阳光都是充裕的。因此,衡量“求省不求稳”的方式很简单,就是看期望。如果预设解为125稳过,关键思路不同的另一人品解可以拼75,不成功再补75,那么只需衡量拼75的成功率。例如,若拼75成功率为50%,则拼75的期望花费为112.5 < 125,预设解不成立,因为不满足“期望最优解”的标准。若拼75成功率为15%,则期望花费为138.75 < 125+15,预设解同样不成立,因为不满足“15期望优势”的标准。

 

这里有一个附加问题:还是同一个例子,如果拼75的成功率为15%,但一旦失败就会导致无法通过当前关卡,是否能够予以排除,确定预设解为唯一最优解?答案是否定的。“过关率≥99%”是对预设解的要求,不适用于其它解。考虑到开局的特性,由于重开的成本极小,采用在一定程度上合理拼运气的解法,若失败则进行重开,完全是符合人类直觉的操作方式。因此,珍珑制作者不应以“拼75可能过不去本关”作为“125求稳是唯一最优解”的论证手段。当然,如果拼75的期望花费显著过高,例如高于预设期望花费15以上,那么可以从基础最优解标准出发排除此人品解。

Reply
OTZzzz
Posts: 86
管理员
Topic starter
(@otzzzz)
Member
Joined: 3 years ago

关于特殊珍珑里残局珍珑的最优解认定:

 

残局珍珑是开局珍珑的进一步升级版。为什么这么说?开局珍珑和常规珍珑相比,区别在于【起手阳光不充足】,有可能无法通过本关,因此引入了“过关率”。而残局在此基础之上,还有【过关后阳光极其有限】的特点。在这个角度上,残局和开局也有显著的区别。

 

举例来说,对于开局珍珑,剩余1075过关,和剩余1050过关,多出的25阳光我们只认为是普通的25阳光价值,因为来日方长,用普通的阳光标准衡量即可。可是在残局,由于过关后的阳光通常也极其有限,我们发现25阳光的价值会在一定程度上被放大——25阳光过关与50过关,50过关与75过关,各自之间都有着显著区别,远超过普通25阳光的价值。

 

因此,当我们试图继续用期望标准来衡量残局解法时,就会出现失灵的情况。

假设我有两个关键思路不同的解:

解A以省为先,用125拼,10%成功,剩150;90%补50,剩100

解B以稳为先,用150求必过,剩125

 

稍微计算可知,解A的期望花费是170,解B是150,解A在期望上占明显劣势。

但是:与100%剩125相比,10%剩150+90%剩100似乎也不是很糟糕。

 

如果再极端一点:

解法A:10%剩50,90%剩0

解法B:必定剩25

 

由于剩0和剩25在过关的效益上是完全一样的,于是似乎解法A才是正解,当然这可能会影响到算分。

 

一个中庸的情况:

解法A:10%剩75,90%剩25

解法B:必定剩50

 

仁者见仁,智者见智。你可以说从统计学的角度,抱着50阳光能通过下一关的概率非常渺茫,跟0无甚区别,而75阳光则比50阳光通过率高了不少数量级,因此解法A更优。这完全是合理的,而且最头疼的是,另一种说法也是合理的,即:50阳光和75阳光能通过的关卡都基本只有胆小,而选择解法B避免了遇到胆小过不去的尴尬问题。

 

如果真的要彻底分析这个问题,就要涉及到布阵规律以及主题分布,探讨不同阳光的过关率差距。然而,珍珑的规则始终以“简化问题,避免争议”为核心思想。这也是基本最优解标准里规定了90%成功率以及15期望优势的原因——之所以要求和其余解法相差15期望以上,就是为了使得最优解的“最优性”更加明显,以免可能的争议。说到底,珍珑是人摆的,预设解是人想的,根据解摆阵、调阵是家常便饭,所以对最优解的要求当然应该更高,毕竟整个阵型都是为它量身定制的,如果最后拿一个5期望优势出来也未免惹人笑话。

 

在衡量残局最优解时,我们也可以遵循类似的“简化问题,避免争议”的原则,再加入一条标准:

所有可能比最优解剩余更多阳光过关的解法,成功率应低于1%。

 

这从根源上排除了求省与求稳的矛盾,要求从设计珍珑之处就防住省更多阳光的RP解,即便非100%,也要99%。

Reply
OTZzzz
Posts: 86
管理员
Topic starter
(@otzzzz)
Member
Joined: 3 years ago

简单总结(不保证完全准确,以上文详细内容为准):

同一解法的多个操作选择(多选择),取期望最优者,不参与期望优势比较;

同一操作选择的多个分支(多分支),若为平凡分支,要求主分支成功率≥90%;若为非平凡分支,要求所有预设非平凡分支综合成功率之和≥90%。

开局珍珑在常规珍珑最优解标准之上,加入第四条:过关率≥99%。

残局珍珑在开局珍珑最优解标准之上,加入第五条:所有可能比最优解剩余更多阳光的解法成功率<1%。

 

其它:

植物僵尸栈位随机,小喷x坐标偏移随机。

Reply
Author
Posts: 2
 Author
Guest
(@Author)
Joined: 3 years ago

感觉高精度操作的完备性(+稳定性?)和珍珑的成功率重复了……

Reply
1 Reply
Author
 Author
Guest
(@Author)
Joined: 3 years ago

Posts: 2

好吧差别还是挺大的……

Reply
sqrt_7
Posts: 3
(@sqrt_7)
梯子南瓜
Joined: 3 years ago

总体而言支持渐强的规则。

接着讨论刚才的问题:

关于各个标准设定到多少合适,我还是支持类似“节操指数”的东西,尽量避免人为设置硬性的及格线

以15阳光期望举例,15这个数字完全是人为的,没有任何道理可讲。一方面,如果某个珍珑期望差恰好是14.5,那么能不能算合格?另一方面,15本身也是比较低的标准,实际操作起来,即使表面上及格线是15,其实每个玩家心里都要一杆秤,如果你的图期望只差15,质量显然不如差25、50的,实际上玩家还是在用一个连续变化的数值来衡量节操。

15线还好,毕竟“期望差”是看得到的东西。但是换到残局来说,设定为1%未免过于严格,文章似乎也没有作任何解释,不知道制定“所有可能比最优解剩余更多阳光的解法成功率<1%”是什么原因…而实际上,细化残局标准的难度确实很高,不管定到多少都有很多问题(因为没法算期望)。这种情况下不应该定高标准。

试举几例:①拼解90%剩50(或失败),稳解剩25;②拼解30%剩50(或失败),稳解剩25;③拼解5%剩125(或剩75),稳解剩100。这里边麻烦可大了,现在一刀切将这三个残局都判为不合格,恐怕不合适。

如果降低标准,实际上标准的影响力就会下降(因为过标准的图不一定都是好图, 也可能非常牵强),仍然是IZE圈“不成文的规矩”在发挥作用。

Reply
7 Replies
sqrt_7
(@sqrt_7)
Joined: 3 years ago

梯子南瓜
Posts: 3

而且还有一个技术上的问题:目前很难将概率精确到1%的程度,除非你每个图都测上几万次。这里边的规则有的太精确,是无法落实的。

Reply
tlgQAQ
(@tlgqaq)
Joined: 3 years ago

冰消珊瑚
Posts: 13

@sqrt_7 节操指数操作性很差吧, 如何找一个好的衡量方式非常困难(

Reply
sqrt_7
(@sqrt_7)
Joined: 3 years ago

梯子南瓜
Posts: 3

@tlgqaq 至少目前“正解与次优解阳光差”是现成的

Reply
tlgQAQ
(@tlgqaq)
Joined: 3 years ago

冰消珊瑚
Posts: 13

@sqrt_7 (有道理, 你说得对

Reply
tlgQAQ
(@tlgqaq)
Joined: 3 years ago

冰消珊瑚
Posts: 13

@sqrt_7 不过确实, 不要硬性及格线是好的

Reply
OTZzzz
管理员
(@otzzzz)
Joined: 3 years ago

Member
Posts: 86

@sqrt_7 硬及格线的唯一作用是筛掉一部分实在不太够看的,它讨论的是要不要推翻重做,而不是图本身质量具体有多高。事实上评价图的质量的因素太多了,单凭期望阳光数乃至扩展后的“节操指数”都无法进行评价,因为有节操并不等于好图,更不等于高质量图,一个“有极高节操”的珍珑完全可以是以次充好滥竽充数的咸鱼市场批发货(

1%来源于完爆的定义,实际上残局相关争议是很多的,一个很严格的规则只是试图规避争议的其中一种办法(并不一定具有最优的自洽性,但可以达到较高的完备性,即符合严标准则必定或接近必定无争议)。

Reply
OTZzzz
管理员
(@otzzzz)
Joined: 3 years ago

Member
Posts: 86

这种严规则(不一定是目前版本的逐字逐句)我觉得可能比较适用于智商杯里的残局,因为相对而言避免争议算是一种刚需

Reply
Scroll to Top
en_USEnglish
Powered by TranslatePress »