參數統計
外觀
沒有或很少條目連入本條目。 (2019年10月11日) |
母數統計(Parametric statistics)是統計學的一個分支,它假設樣本數據來自總體,而總體可以透過具有固定參數集的概率分布進行充分建模。 [1]相反,非參數模型的確切區別在於其參數集(或機器學習中的特徵集 )不是固定的,如果收集到新的相關信息,則該參數集可能會增加甚至減少。 [2]
大多數著名的統計方法都是參數化的。 [3]關於非參數(和半參數)模型, 戴維·考克斯爵士說:「這些模型通常較少涉及結構和分布形式的假設,但通常都包含有關獨立性的強有力假設」。 [4]
示例
[編輯]正態分布族都具有相同的一般形態,並可以通過均值和標準差進行參數化 。這意味着,如果均值和標準差已知,並且分布是正態的,則任何將來觀察到的給定範圍內的概率都是已知的。
假設有一個存在99個測試分數的樣本,平均值為100,標準差為1。如果假設所有99個測試分數都是從正態分布中隨機觀察到的,那麼我們預測第100個測試分數有1%的概率將高於102.33(即平均值加2.33標準偏差)。給定99個來自相同正態分布的獨立觀測值,可使用參數統計方法計算上述標準偏差值。
對同一事物的非參數估計是前99個分數中的最大值。不需要假設考試分數的分布情況就可以推斷出,在我們進行考試之前,最高分數會出現在前100個分數中。因此,第100個分數有1%的可能性高於之前的99個分數。
歷史
[編輯]RA Fisher在1925年的《 Statistical Methods for Research Workers 》中提到了參數統計,這為現代統計奠定了基礎。