在数理统计中初看这个观点,有点模糊。

本日来探究一下置信这个统计学观点是啥意思。

术语百科

首先给出百科中关于置信的阐明:

在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。
置信区间展现的是这个参数的真实值有一定概率落在丈量结果的周围的程度。
置信区间给出的是被丈量参数丈量值的可信程度范围,即前面所哀求的“一定概率”。
这个概率被称为置信水平。

5分钟秒懂AI2置信如斯难以置信

举例解释

举一个同样是百科中的例子:

如果在一次大选中某人的支持率为55%,而置信水平0.95上的置信区间是(50%,60%),那么他的真实支持率有百分之九十五的概率落在百分之五十和百分之六十之间,因此他的真实支持率不敷一半的可能性小于百分之2.5(假设分布是对称的)。

如何理解呢?

首先,磋商一下支持率这个观点,可以理解为这个国家中所有人口中有多少人支持他。
比如总人口是1亿,有5000w人支持,那么支持率便是50%。
这只是个空想值,调研这一亿人的每一个人是不可能的,但理论上他一定是存在且精准的值。

其次,如何得到支持率呢? 大家立时想到一个办法,便是找一部分代表去投票,然后“以偏概全”,用这些代表投票的支持率去估计全体国家的支持率。
思考一下,假设这些代表的投票结果是55%,那么按照上面支持率的观点,这个国家一定有55%的人支持吗? 当然不一定啦,由于这只是个估计,那个精确且存在的支持率到底是多少,谁也不知道!

末了,那有没有一个更精准的表达呢? 有的,就像其它数学观点一样,数学家们发明了置信区间和置信度两个词来描述这件事。
精准支持率落在50%到60%之间的概率在95%以上!
这句话在数学上多么严谨啊(现实中没有啥卵用,总统不可能根据概率产生,这里不谈论)。
再加上一句话:精准支持率不到50%的概率小于2.5%,当然还有另一部分,精准支持率高于60%的概率也小于2.5%。

上面的50%到60%便是置信区间,概率95%便是置信度了。

另:对上面的分布是不是很熟习,这不正是旁边对称的正态分布么......

总结

大略说,置信便是对估计的可信度的评估,或者数学化。
估计这东西在非此即彼、非对即错的数学天下,显得太“难以置信”了。
有了置信的加持,统统都更“数学”了。

注:

大道至简,坚信繁芜的理论背后,都有一个大略的道理。
5分钟原则,知识碎片化,一篇小文能讲清一个事儿就知足了。