更新時(shí)間:2020-08-07 來源:黑馬程序員 瀏覽量:
學(xué)習(xí)目標(biāo)
·知道總體、樣本、樣本大小、樣本數(shù)量
·知道樣本統(tǒng)計(jì)量和總體統(tǒng)計(jì)量
·知道總體分布、樣本分布和抽樣分布
·知道常用的抽樣方法
某糖果公司研發(fā)了一種超長(zhǎng)效口香糖,為了得到口味持續(xù)時(shí)間的數(shù)據(jù),公司聘請(qǐng)了試吃者幫忙完成檢驗(yàn),結(jié)果卻讓人大跌眼鏡!
沒文化,真可怕!我該怎么辦?
有時(shí)候數(shù)據(jù)很容易收集,例如參加健身俱樂部的人的年齡,后這一家游戲公司的銷售數(shù)據(jù)。但有時(shí)候不太容易,該怎么辦呢?
是時(shí)候拿出終極武器了——抽樣
1.抽樣相關(guān)概念
總體:是指研究對(duì)象的整個(gè)群體。
·公司生產(chǎn)的一批糖果
樣本:是從總體中選取的一部分,用于代表總體的整體情況。
·在這批糖果中隨機(jī)抽取50顆糖果
樣本數(shù)量:又叫樣本空間,是表示有多少個(gè)樣本。
·在這批糖果中隨機(jī)抽取50顆糖果,抽5次:樣本數(shù)量=5
樣本大小:也叫樣本容量,表示每個(gè)樣本里有多少個(gè)數(shù)據(jù)。
·每個(gè)樣本50顆糖果:樣本大小=50
統(tǒng)計(jì)量:
統(tǒng)計(jì)量是對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)得到的量,例如:均值、方差、標(biāo)準(zhǔn)差、比例等。
總體統(tǒng)計(jì)量:總體XX
對(duì)總體進(jìn)行統(tǒng)計(jì)得到的統(tǒng)計(jì)量
·總體均值$$\mu$$:整批所有糖果數(shù)據(jù)的均值
·總體方差$$\sigma^2$$:整批所有糖果數(shù)據(jù)的方差
樣本統(tǒng)計(jì)量:樣本XX
對(duì)樣本進(jìn)行統(tǒng)計(jì)得到的統(tǒng)計(jì)量
·樣本均值$$\bar{X}$$:抽取的某個(gè)樣本糖果數(shù)據(jù)的均值
·樣本方差$$S^2$$:抽取的某個(gè)樣本糖果數(shù)據(jù)的方差
分布:
·總體分布
總體數(shù)據(jù)的概率分布:整批所有糖果數(shù)據(jù)的概率分布
·往往未知,很多時(shí)候無法獲得總體所有元素的觀測(cè)值
·可以通過理論計(jì)算進(jìn)行假定
樣本分布
抽取的樣本中數(shù)據(jù)的概率分布:抽取的某個(gè)樣本糖果數(shù)據(jù)的概率分布
假設(shè)總體大小為m,樣本大小為n,n趨近于m時(shí),樣本分布趨近于總體分布
·樣本分布又稱經(jīng)驗(yàn)分布
·注意:樣本分布與總體分布近似(抽樣正確的前提下)
抽樣分布
對(duì)樣本統(tǒng)計(jì)量概率分布的一種描述:所有樣本均值的概率分布
2.抽樣方法
抽樣的目的是為了通過樣本獲得總體的信息,所以關(guān)鍵點(diǎn)是怎么抽樣才能保證獲得的樣本具有代表性,下面,我們簡(jiǎn)單介紹幾種常用的抽樣方法。
·簡(jiǎn)單隨機(jī)抽樣(simple random sampling)。原理和我們抽撲克牌、抽獎(jiǎng)一樣,就是從一個(gè)固定的總體中(比如有N個(gè)對(duì)象),利用抽簽或其他隨機(jī)方法(如隨機(jī)數(shù)表)抽取n個(gè)對(duì)象。所謂隨機(jī),是指總體中每一個(gè)對(duì)象被抽中的概率相等。假設(shè)兩個(gè)人抽撲克牌比大小,兩個(gè)人抽中大王的概率其實(shí)一樣,都是1/54。
·系統(tǒng)抽樣(systematic sampling)。這種抽樣方法的核心在于確定一個(gè)所謂的“抽樣間隔”。比如將總體對(duì)象隨機(jī)編號(hào),從1至100,我們只抽取編號(hào)個(gè)位數(shù)是7的對(duì)象,即編號(hào)為7,17,27,…的樣本,本質(zhì)上他們相鄰的編號(hào)有一個(gè)固定的間隔——10。
·分層抽樣(stratified sampling),是指先將總體按照某種特征分為若干層,比如按照性別分為男女兩層,然后再?gòu)拿恳粚觾?nèi)進(jìn)行簡(jiǎn)單隨機(jī)抽樣。分層的目的就在于提升樣本對(duì)總體的代表性,提高估計(jì)的精確度,比如一般的理工院校男生多女生少,采用分層抽樣可以保證男性和女性樣本都能被抽中。
·整群抽樣(cluster sampling),是將總體分成幾個(gè)群,比如我國(guó)開展的大型調(diào)查一般會(huì)以省或地區(qū)為群,先采用簡(jiǎn)單隨機(jī)抽樣的方法抽取群,然后從抽中的群中再抽取相關(guān)的個(gè)體進(jìn)行研究。現(xiàn)實(shí)過程中可以將抽中的群中的所有對(duì)象作為研究樣本,也可以在群內(nèi)部再次進(jìn)行抽樣獲得部分調(diào)查對(duì)象作為樣本。
3.小結(jié)
抽樣相關(guān)概念 【知道】
·總體:是指研究對(duì)象的整個(gè)群體。
·樣本:從總體中選取的一部分
·樣本大?。好總€(gè)樣本里有多少個(gè)數(shù)據(jù)
·樣本數(shù)量:表示有多少個(gè)樣本。
統(tǒng)計(jì)量
總體XX
·總體均值$$\mu$$
·總體方差$$\sigma^2$$
樣本XX
·樣本均值$$\bar{X}$$
·樣本方差$$S^2$$
分布:
·總體分布
·樣本分布
·抽樣分布
抽樣方法 【知道】
·簡(jiǎn)單隨機(jī)抽樣:隨機(jī)抽
·系統(tǒng)抽樣:等間隔抽
·分層抽樣:每種分別抽
·整群抽樣:直接抽一撥
猜你喜歡: