三、概率密度函数(划重点,要考的)
以上提出的不均匀随机方案,都是基于Excel公式直接得到的随机分布规则。相对于函数映射来说,显然if方法要更容易操作一些。其实做到这步已经可以了,毕竟抽签器也没多高要求。但对于强迫症来说,仍然会觉得这种方法不好看,它仍然有着可以精益求精的空间。
这种方法有什么问题?
首先,作为一个学渣和Excel公式小白,楼主看到那么多嵌套和数学公式一直觉得晕乎乎,对于掌握它果然还是比较抵触的——它对于新手不够友好。即使对于老手来说,设置公式、调节参数也是比较枯燥乏味的过程,并且这个过程不够直观可控,如果把做抽签器的热情都消耗在这里,就显得有点得不偿失了。
其次,也是更重要的一点,用这种方法设置的公式,真的合理吗?分区段设置随机概率固然可以,不过这些区间、这些概率是不是也是脑子一热想出来的?函数映射的规则又有多少兼容性?如果存在一种“最佳”方案来设定随机规则,干嘛还要用这么复杂的嵌套复合呢?这种“最佳”随机方案,真的存在吗?
答案是存在的。我们知道,对于一个人群的某个特征的分布,最常见也最合理的便是【正态分布】规则。如果把这种规则应用到武将数据随机中,那么数据随机的合理性一下子就有了,抽签器也一下子就高大上了起来。不过,在介绍正态分布之前呢,我们先来复习一下什么叫做【概率密度函数】。
这个百度百科的定义很专业,但它复杂而冗长,我们做抽签器完全不需要知道这些,也不用管它是离散型还是连续型,也不要管如何归一化,我们这些小白只需要看下面这个图就可以了。(鼠绘轻喷)
这条黑色曲线就是概率密度函数了。我们不用管它的函数值是什么,这个图里唯一有用的就是黄色部分,即区间与曲线围成的面积——这个黄色面积占这条曲线与横轴(数据范围)围成的总面积的比重就是概率。如果这个比重是0.3,就相当于往总面积里随机扔一粒芝麻,这粒芝麻分布到黄色面积里的概率就是30%,也就是说随机到50-75范围的概率是30%。至于随机到的具体值,就是芝麻位置所对应的横坐标,随机到小数的话取个整就行了。当然上面这个图并不是正态分布的概率密度函数图,正态分布是两端不封口的。