對(duì)隨機(jī)序列進(jìn)行運(yùn)行測(cè)試
給定一系列數(shù)據(jù),我們可能想知道的一個(gè)問題是序列是否偶然發(fā)生現(xiàn)象,或者數(shù)據(jù)是否不是隨機(jī)的。隨機(jī)性很難識(shí)別,因?yàn)楹茈y簡(jiǎn)單地查看數(shù)據(jù)并確定它是否是偶然產(chǎn)生的。一種可用于幫助確定序列是否真正偶然發(fā)生的方法稱為運(yùn)行測(cè)試。
運(yùn)行測(cè)試是顯著性檢驗(yàn)或假設(shè)檢驗(yàn)。此測(cè)試的過程基于具有特定特征的數(shù)據(jù)的運(yùn)行或序列。要了解運(yùn)行測(cè)試的工作原理,我們必須首先檢查運(yùn)行的概念。
數(shù)據(jù)序列11 12
我們將首先看一個(gè)運(yùn)行示例??紤]以下隨機(jī)數(shù)字序列:
6 2 7 0 0 1 7 3 0 5 0 8 4 6 8 7 0 6 5
對(duì)這些數(shù)字進(jìn)行分類的一種方法是將它們分成兩類,偶數(shù)(包括數(shù)字0,2,4,6和8)或奇數(shù)(包括數(shù)字1,3,5,7和9)。我們將查看隨機(jī)數(shù)字的序列,并將偶數(shù)表示為E,將奇數(shù)表示為O:
E E O E O E O E E E E E O E O O
如果我們重寫它以便所有操作系統(tǒng)都在一起并且所有Es都在一起,運(yùn)行更容易看到:
E E O EE OO E O EEEEE O EE OO
我們計(jì)算偶數(shù)或奇數(shù)的塊數(shù),并查看數(shù)據(jù)總共有十次運(yùn)行。四次跑有一個(gè)長度,五次跑有兩個(gè)長度,一次跑有五個(gè)長度
Conditions
對(duì)于任何重要的測(cè)試,重要的是要知道進(jìn)行測(cè)試需要什么條件。對(duì)于運(yùn)行測(cè)試,我們將能夠?qū)颖局械拿總€(gè)數(shù)據(jù)值分為兩類之一。我們將計(jì)算相對(duì)于屬于每個(gè)類別的數(shù)據(jù)值數(shù)量的運(yùn)行總數(shù)。
T他的測(cè)試將是雙面測(cè)試。其原因是運(yùn)行次數(shù)太少意味著可能沒有足夠的變化以及隨機(jī)過程中發(fā)生的運(yùn)行次數(shù)。當(dāng)一個(gè)過程在類別之間交替出現(xiàn)的頻率太高而無法偶然描述時(shí),會(huì)導(dǎo)致太多運(yùn)行。
假設(shè)和P值55,56每個(gè)顯著性檢驗(yàn)都有一個(gè)零假設(shè)和另一個(gè)假設(shè)。對(duì)于運(yùn)行測(cè)試,零假設(shè)是序列是隨機(jī)序列。另一種假設(shè)是樣本數(shù)據(jù)的序列不是隨機(jī)的。
統(tǒng)計(jì)軟件可以計(jì)算與特定測(cè)試統(tǒng)計(jì)信息相對(duì)應(yīng)的p值。還有一些表格給出了運(yùn)行總數(shù)的一定重要程度的臨界值。
運(yùn)行測(cè)試示例
我們將通過以下示例來了解運(yùn)行測(cè)試的工作原理。假設(shè)對(duì)于任務(wù),要求學(xué)生翻轉(zhuǎn)硬幣16次并注意出現(xiàn)的頭部和尾部的順序。如果我們最終得到這個(gè)數(shù)據(jù)集:
H T H H T H T H T H T H T H T H H
我們可能會(huì)問學(xué)生是否真的做了作業(yè),或者他**并寫下了一系列看起來隨機(jī)的H和T?運(yùn)行測(cè)試可以幫助我們。運(yùn)行測(cè)試符合假設(shè),因?yàn)閿?shù)據(jù)可以分為兩組,無論是頭部還是尾部。我們繼續(xù)計(jì)算運(yùn)行次數(shù)。重新組合,我們看到以下內(nèi)容:
H T HHH TT H TT H T H T HH
我們的數(shù)據(jù)有十次運(yùn)行,七個(gè)尾部是九個(gè)頭。
零假設(shè)是數(shù)據(jù)是隨機(jī)的。另一種方法是它不是隨機(jī)的。對(duì)于alpha等于0.05的顯著性水平,我們通過查閱適當(dāng)?shù)谋砜梢钥吹剑?dāng)運(yùn)行次數(shù)小于4或大于16時(shí),我們拒絕零假設(shè)。由于我們的數(shù)據(jù)有十次運(yùn)行,我們不能拒絕零假設(shè)H。
Normal Approximation
運(yùn)行測(cè)試是確定序列是否可能是隨機(jī)的有用工具。對(duì)于大型數(shù)據(jù)集,有時(shí)可以使用正態(tài)近似。這種正態(tài)近似要求我們使用每個(gè)類別中的元素?cái)?shù)量,然后計(jì)算適當(dāng)正態(tài)分布的均值和標(biāo)準(zhǔn)差。
健康知識(shí)演講稿