首頁技術(shù)文章正文

常用的抽樣方法介紹

更新時間:2020-08-07 來源:黑馬程序員 瀏覽量:

學(xué)習(xí)目標

·知道總體、樣本、樣本大小、樣本數(shù)量

·知道樣本統(tǒng)計量和總體統(tǒng)計量

·知道總體分布、樣本分布和抽樣分布

·知道常用的抽樣方法



某糖果公司研發(fā)了一種超長效口香糖,為了得到口味持續(xù)時間的數(shù)據(jù),公司聘請了試吃者幫忙完成檢驗,結(jié)果卻讓人大跌眼鏡!

抽樣和抽樣方法


沒文化,真可怕!我該怎么辦?

有時候數(shù)據(jù)很容易收集,例如參加健身俱樂部的人的年齡,后這一家游戲公司的銷售數(shù)據(jù)。但有時候不太容易,該怎么辦呢?

是時候拿出終極武器了——抽樣

1.抽樣相關(guān)概念

總體:是指研究對象的整個群體。

·公司生產(chǎn)的一批糖果

抽樣

樣本:是從總體中選取的一部分,用于代表總體的整體情況。

·在這批糖果中隨機抽取50顆糖果

抽樣和方法

樣本數(shù)量:又叫樣本空間,是表示有多少個樣本。

·在這批糖果中隨機抽取50顆糖果,抽5次:樣本數(shù)量=5

樣本方法


樣本大?。阂步?strong>樣本容量,表示每個樣本里有多少個數(shù)據(jù)。

·每個樣本50顆糖果:樣本大小=50

統(tǒng)計量:

統(tǒng)計量是對數(shù)據(jù)進行統(tǒng)計得到的量,例如:均值、方差、標準差、比例等。

總體統(tǒng)計量:總體XX

對總體進行統(tǒng)計得到的統(tǒng)計量

·總體均值$$\mu$$:整批所有糖果數(shù)據(jù)的均值

·總體方差$$\sigma^2$$:整批所有糖果數(shù)據(jù)的方差

樣本統(tǒng)計量:樣本XX

對樣本進行統(tǒng)計得到的統(tǒng)計量

·樣本均值$$\bar{X}$$:抽取的某個樣本糖果數(shù)據(jù)的均值

·樣本方差$$S^2$$:抽取的某個樣本糖果數(shù)據(jù)的方差

分布:

·總體分布

總體數(shù)據(jù)的概率分布:整批所有糖果數(shù)據(jù)的概率分布

·往往未知,很多時候無法獲得總體所有元素的觀測值

·可以通過理論計算進行假定

樣本分布

抽取的樣本中數(shù)據(jù)的概率分布:抽取的某個樣本糖果數(shù)據(jù)的概率分布

假設(shè)總體大小為m,樣本大小為n,n趨近于m時,樣本分布趨近于總體分布

·樣本分布又稱經(jīng)驗分布

·注意:樣本分布與總體分布近似(抽樣正確的前提下)

抽樣分布

對樣本統(tǒng)計量概率分布的一種描述:所有樣本均值的概率分布

抽樣分布


2.抽樣方法

抽樣的目的是為了通過樣本獲得總體的信息,所以關(guān)鍵點是怎么抽樣才能保證獲得的樣本具有代表性,下面,我們簡單介紹幾種常用的抽樣方法。

·簡單隨機抽樣(simple random sampling)。原理和我們抽撲克牌、抽獎一樣,就是從一個固定的總體中(比如有N個對象),利用抽簽或其他隨機方法(如隨機數(shù)表)抽取n個對象。所謂隨機,是指總體中每一個對象被抽中的概率相等。假設(shè)兩個人抽撲克牌比大小,兩個人抽中大王的概率其實一樣,都是1/54。

·系統(tǒng)抽樣(systematic sampling)。這種抽樣方法的核心在于確定一個所謂的“抽樣間隔”。比如將總體對象隨機編號,從1至100,我們只抽取編號個位數(shù)是7的對象,即編號為7,17,27,…的樣本,本質(zhì)上他們相鄰的編號有一個固定的間隔——10。

·分層抽樣(stratified sampling),是指先將總體按照某種特征分為若干層,比如按照性別分為男女兩層,然后再從每一層內(nèi)進行簡單隨機抽樣。分層的目的就在于提升樣本對總體的代表性,提高估計的精確度,比如一般的理工院校男生多女生少,采用分層抽樣可以保證男性和女性樣本都能被抽中。

·整群抽樣(cluster sampling),是將總體分成幾個群,比如我國開展的大型調(diào)查一般會以省或地區(qū)為群,先采用簡單隨機抽樣的方法抽取群,然后從抽中的群中再抽取相關(guān)的個體進行研究?,F(xiàn)實過程中可以將抽中的群中的所有對象作為研究樣本,也可以在群內(nèi)部再次進行抽樣獲得部分調(diào)查對象作為樣本。

3.小結(jié)

抽樣相關(guān)概念 【知道】

·總體:是指研究對象的整個群體。

·樣本:從總體中選取的一部分

·樣本大?。好總€樣本里有多少個數(shù)據(jù)

·樣本數(shù)量:表示有多少個樣本。

統(tǒng)計量

總體XX

·總體均值$$\mu$$

·總體方差$$\sigma^2$$

樣本XX

·樣本均值$$\bar{X}$$

·樣本方差$$S^2$$

分布:

·總體分布

·樣本分布

·抽樣分布

抽樣方法 【知道】

·簡單隨機抽樣:隨機抽

·系統(tǒng)抽樣:等間隔抽

·分層抽樣:每種分別抽

·整群抽樣:直接抽一撥


猜你喜歡:

Python編程加入日志的方法

“棧”是什么?如何實現(xiàn)一個“?!?

Python培訓(xùn)課程

分享到:
在線咨詢 我要報名
和我們在線交談!