有或沒有更換的取樣

統(tǒng)計(jì)抽樣可以通過多種不同的方式完成。除了我們使用的抽樣方法的類型之外,還有另一個(gè)問題涉及我們隨機(jī)選擇的個(gè)人具體發(fā)生了什么。抽樣時(shí)出現(xiàn)的問題是"在我們選擇個(gè)人并記錄測(cè)量值之后我們'重新學(xué)習(xí),我們對(duì)個(gè)人做什么?"

有兩種選擇:

  • 我們可以將個(gè)人替換回我們正在采樣的池中。
  • 我們可以選擇不替換個(gè)人。

我們可以很容易地看到這些導(dǎo)致兩種不同的情況。在第一種選擇中,替換留下了第二次隨機(jī)選擇個(gè)體的可能性。對(duì)于第二種選擇,如果我們?cè)跊]有替換的情況下工作,則不可能選擇同一個(gè)人兩次。我們將看到這種差異將影響與這些樣本相關(guān)的概率的計(jì)算。生理健康知識(shí)

對(duì)概率的影響

要了解我們?nèi)绾翁幚硖鎿Q會(huì)影響概率的計(jì)算,請(qǐng)考慮以下示例問題。從標(biāo)準(zhǔn)甲板上抽取兩個(gè)ACE的概率是多少?

這個(gè)問題是模棱兩可的。一旦我們畫了第一張卡會(huì)發(fā)生什么?我們是把它放回甲板上,還是把它放出來?

我們從計(jì)算替換概率開始。共有四張ace和52張卡片,因此繪制一張ace的概率為4/52。如果我們更換此卡并再次繪制,則概率再次為4/52。這些事件是獨(dú)立的,因此我們將概率(4/52)x(4/52)=1/169或大約0.592%乘以。

現(xiàn)在我們將把它與同樣的情況進(jìn)行比較,除了我們不更換卡片。第一次抽獎(jiǎng)時(shí)繪制ace的概率仍然是4/52。對(duì)于第二張卡,我們我們現(xiàn)在必須計(jì)算一個(gè)條件概率。換句話說,我們需要知道繪制第二個(gè)ace的概率,因?yàn)榈谝粡埧ㄒ彩莂ce。

現(xiàn)在共有51張牌中剩余3張牌。因此,繪制ace后第二個(gè)ace的條件概率為3/51。繪制兩個(gè)ace而不進(jìn)行替換的概率為(4/52)x(3/51)=1/221,或約0.425%。

我們直接從上面的問題中看到,我們選擇替換的內(nèi)容會(huì)影響概率值。它可以顯著改變這些值。

人口規(guī)模

在某些情況下,有或沒有替換的抽樣并沒有實(shí)質(zhì)性地改變?nèi)魏胃怕省<僭O(shè)我們是從一個(gè)人口為50000的城市中隨機(jī)選擇兩個(gè)人,其中30000人是女性。

如果我們用替換樣本,那么第一次選擇女性的概率為30000/50000=60%。第二次選擇女性的概率仍然為60%。兩個(gè)人都是女性的概率為0.6 x 0.6=0.36。

如果我們?cè)跊]有替換的情況下進(jìn)行采樣,那么第一個(gè)概率不受影響。第二個(gè)概率現(xiàn)在是29999/49999=0.5999919998…,這非常接近60%。兩者都是女性的概率是0.6 x 0.5999919998=0.359995。

概率在技術(shù)上是不同的,然而,它們足夠接近幾乎無法區(qū)分。因此,很多時(shí)候,即使我們?cè)跊]有替換的情況下進(jìn)行抽樣,我們也會(huì)將每個(gè)人的選擇視為獨(dú)立于樣本中的其他人。

其他應(yīng)用程序

在其他情況下,我們需要考慮是否在有或沒有更換的情況下進(jìn)行采樣。例如,這是自舉. 該統(tǒng)計(jì)技術(shù)屬于重采樣技術(shù)的標(biāo)題。

在引導(dǎo)中,我們從人口的統(tǒng)計(jì)樣本開始。然后,我們使用計(jì)算機(jī)軟件來計(jì)算引導(dǎo)程序樣本。換句話說,計(jì)算機(jī)重新采樣并更換初始樣本。

教育資源網(wǎng)_1