正態(tài)分布相除是什么分布 正態(tài)分布三個常用數(shù)據(jù)計算概率
正態(tài)分布的每個點的離差是什么分布?統(tǒng)計學中z分布、t分布、F分布及χ^2分布的聯(lián)系,兩個正態(tài)分布 相乘或者相除,期望和方差怎么計算啊? 不求詳細過程,只求思路,方法,或結(jié)果?正態(tài)分布的計算公式是什么?
本文導航
標準差決定了正態(tài)分布的寬窄程度
目錄 1正態(tài)分布 目錄 1正態(tài)分布 收起 編輯本段正態(tài)分布 normal distribution
一種概率分布。正態(tài)分布是具有兩個參數(shù)μ和σ2的連續(xù)型隨機變量的分布,第一參數(shù)μ是服從正態(tài)分布的隨機變量的均值,第二個參數(shù)σ2是此隨機變量的方差,所以正態(tài)分布記作N(μ,σ2 )。 服從正態(tài)分布的隨機變量的概率規(guī)律為取與μ鄰近的值的概率大 ,而取離μ越遠的值的概率越小;σ越小,分布越集中在μ附近,σ越大,分布越分散。正態(tài)分布的密度函數(shù)的特點是:關于μ對稱,在μ處達到最大值,在正(負)無窮遠處取值為0,在μ±σ處有拐點。它的形狀是中間高兩邊低 ,圖像是一條位于x軸上方的鐘形曲線。當μ=0,σ2 =1時,稱為標準正態(tài)分布,記為N(0,1)。μ維隨機向量具有類似的概率規(guī)律時,稱此隨機向量遵從多維正態(tài)分布。多元正態(tài)分布有很好的性質(zhì),例如,多元正態(tài)分布的邊緣分布仍為正態(tài)分布,它經(jīng)任何線性變換得到的隨機向量仍為多維正態(tài)分布,特別它的線性組合為一元正態(tài)分布。
正態(tài)分布最早由A.棣莫弗在求二項分布的漸近公式中得到。C.F.高斯在研究測量誤差時從另一個角度導出了它。P.S.拉普拉斯和高斯研究了它的性質(zhì)。
生產(chǎn)與科學實驗中很多隨機變量的概率分布都可以近似地用正態(tài)分布來描述。例如,在生產(chǎn)條件不變的情況下,產(chǎn)品的強力、抗壓強度、口徑、長度等指標;同一種生物體的身長、體重等指標;同一種種子的重量;測量同一物體的誤差;彈著點沿某一方向的偏差;某個地區(qū)的年降水量;以及理想氣體分子的速度分量,等等。一般來說,如果一個量是由許多微小的獨立隨機因素影響的結(jié)果,那么就可以認為這個量具有正態(tài)分布(見中心極限定理)。從理論上看,正態(tài)分布具有很多良好的性質(zhì) ,許多概率分布可以用它來近似;還有一些常用的概率分布是由它直接導出的,例如對數(shù)正態(tài)分布、t分布、F分布等。
正態(tài)分布應用最廣泛的連續(xù)概率分布,其特征是“鐘”形曲線。
正態(tài)分布
1.正態(tài)分布
若已知的密度函數(shù)(頻率曲線)為正態(tài)函數(shù)(曲線)則稱已知曲線服從正態(tài)分布,記號 ~ 。其中μ、σ2 是兩個不確定常數(shù),是正態(tài)分布的參數(shù),不同的 、不同的 對應不同的正態(tài)分布。
正態(tài)曲線呈鐘型,兩頭低,中間高,左右對稱,曲線與橫軸間的面積總等于1。
2.正態(tài)分布的特征
服從正態(tài)分布的變量的頻數(shù)分布由 、 完全決定。
(1) 是正態(tài)分布的位置參數(shù),描述正態(tài)分布的集中趨勢位置。正態(tài)分布以 為對稱軸,左右完全對稱。正態(tài)分布的均數(shù)、中位數(shù)、眾數(shù)相同,均等于 。
(2) 描述正態(tài)分布資料數(shù)據(jù)分布的離散程度, 越大,數(shù)據(jù)分布越分散, 越小,數(shù)據(jù)分布越集中。 也稱為是正態(tài)分布的形狀參數(shù), 越大,曲線越扁平,反之, 越小,曲線越瘦高。
標準正態(tài)分布standard normal distribution
1.標準正態(tài)分布是一種特殊的正態(tài)分布,標準正態(tài)分布的μ和σ2為0和1,通常用 (或Z)表示服從標準正態(tài)分布的變量,記為 Z~N(0,1)。
2.標準化變換:此變換有特性:若原分布服從正態(tài)分布 ,則Z=(x-μ)/σ ~ N(0,1) 就服從標準正態(tài)分布,通過查標準正態(tài)分布表就可以直接計算出原正態(tài)分布的概率值。故該變換被稱為標準化變換。
3. 標準正態(tài)分布表
標準正態(tài)分布表中列出了標準正態(tài)曲線下從-∞到X(當前值)范圍內(nèi)的面積比例 。
正態(tài)曲線下面積分布
1.實際工作中,正態(tài)曲線下橫軸上一定區(qū)間的面積反映該區(qū)間的例數(shù)占總例數(shù)的百分比,或變量值落在該區(qū)間的概率(概率分布)。不同 范圍內(nèi)正態(tài)曲線下的面積可用公式計算。
2.幾個重要的面積比例
軸與正態(tài)曲線之間的面積恒等于1。正態(tài)曲線下,橫軸區(qū)間(μ-σ,μ+σ)內(nèi)的面積為68.27%,橫軸區(qū)間(μ-1.96σ,μ+1.96σ)內(nèi)的面積為95.00%,橫軸區(qū)間(μ-2.58σ,μ+2.58σ)內(nèi)的面積為99.00%。
正態(tài)分布的應用
某些醫(yī)學現(xiàn)象,如同質(zhì)群體的身高、紅細胞數(shù)、血紅蛋白量,以及實驗中的隨機誤差,呈現(xiàn)為正態(tài)或近似正態(tài)分布;有些指標(變量)雖服從偏態(tài)分布,但經(jīng)數(shù)據(jù)轉(zhuǎn)換后的新變量可服從正態(tài)或近似正態(tài)分布,可按正態(tài)分布規(guī)律處理。其中經(jīng)對數(shù)轉(zhuǎn)換后服從正態(tài)分布的指標,被稱為服從對數(shù)正態(tài)分布。
1. 估計頻數(shù)分布 一個服從正態(tài)分布的變量只要知道其均數(shù)與標準差就可根據(jù)公式即可估計任意取值范圍內(nèi)頻數(shù)比例。
2. 制定參考值范圍
?。?)正態(tài)分布法 適用于服從正態(tài)(或近似正態(tài))分布指標以及可以通過轉(zhuǎn)換后服從正態(tài)分布的指標。
?。?)百分位數(shù)法 常用于偏態(tài)分布的指標。表3-1中兩種方法的單雙側(cè)界值都應熟練掌握。
3. 質(zhì)量控制:為了控制實驗中的測量(或?qū)嶒灒┱`差,常以 作為上、下警戒值,以 作為上、下控制值。這樣做的依據(jù)是:正常情況下測量(或?qū)嶒灒┱`差服從正態(tài)分布。
4. 正態(tài)分布是許多統(tǒng)計方法的理論基礎。 檢驗、方差分析、相關和回歸分析等多種統(tǒng)計方法均要求分析的指標服從正態(tài)分布。許多統(tǒng)計方法雖然不要求分析指標服從正態(tài)分布,但相應的統(tǒng)計量在大樣本時近似正態(tài)分布,因而大樣本時這些統(tǒng)計推斷方法也是以正態(tài)分布為理論基礎的。
研究過程
正態(tài)分布的概念和特征一、正態(tài)分布的概念
由一般分布的頻數(shù)表資料所繪制的直方圖,圖(1)可以看出,高峰位于中部,左右兩側(cè)大致對稱。我們設想,如果觀察例數(shù)逐漸增多,組段不斷分細,直方圖頂端的連線就會逐漸形成一條高峰位于中央(均數(shù)所在處),兩側(cè)逐漸降低且左右對稱,不與橫軸相交的光滑曲線圖(3)。這條曲線稱為頻數(shù)曲線或頻率曲線,近似于數(shù)學上的正態(tài)分布(normal distribution)。由于頻率的總和為100%或1,故該曲線下橫軸上的面積為100%或1。
為了應用方便,常對正態(tài)分布變量X作變量變換。
該變換使原來的正態(tài)分布轉(zhuǎn)化為標準正態(tài)分布 (standard normal distribution),亦稱u分布。u被稱為標準正態(tài)變量或標準正態(tài)離差(standard normal deviate)。
二、正態(tài)分布的特征:
1.正態(tài)曲線(normal curve)在橫軸上方均數(shù)處最高。
2.正態(tài)分布以均數(shù)為中心,左右對稱。
3.正態(tài)分布有兩個參數(shù),即均數(shù)μ和標準差σ。μ是位置參數(shù),當σ固定不變時,μ越大,曲線沿橫軸越向右移動;反之,μ越小,則曲線沿橫軸越向左移動。σ是形狀參數(shù),當μ固定不變時,σ越大,曲線越平闊;σ越小,曲線越尖峭。通常用N~(μ,σ2)表示均數(shù)為μ,方差為σ2的正態(tài)分布。用N(0,1)表示標準正態(tài)分布。
4.正態(tài)曲線下面積的分布有一定規(guī)律。
實際工作中,常需要了解正態(tài)曲線下橫軸上某一區(qū)間的面積占總面積的百分數(shù),以便估計該區(qū)間的例數(shù)占總例數(shù)的百分數(shù)(頻數(shù)分布)或觀察值落在該區(qū)間的概率。正態(tài)曲線下一定區(qū)間的面積可以通過附表1求得。對于正態(tài)或近似正態(tài)分布的資料,已知均數(shù)和標準差,就可對其頻數(shù)分布作出概約估計。
查附表1應注意:①表中曲線下面積為-∞到u的左側(cè)累計面積;②當已知μ、σ和X時先按式u=(X-μ)/σ求得u值,再查表,當μ、σ未知且樣本含量n足夠大時,可用樣本均數(shù)X1和標準差S分別代替μ和σ,按u=(X-X1)/S式求得u值,再查表;③曲線下對稱于0的區(qū)間面積相等,如區(qū)間(-∞,-1.96)與區(qū)間(1.96,∞)的面積相等,④曲線下橫軸上的總面積為100%或1。
圖2 正態(tài)曲線與標準正態(tài)曲線的面積分布
第二節(jié) 正態(tài)分布的應用某些醫(yī)學現(xiàn)象,如同質(zhì)群體的身高、紅細胞數(shù)、血紅蛋白量、膽固醇等,以及實驗中的隨機誤差,呈現(xiàn)為正態(tài)或近似正態(tài)分布;有些資料雖為偏態(tài)分布,但經(jīng)數(shù)據(jù)變換后可成為正態(tài)或近似正態(tài)分布,故可按正態(tài)分布規(guī)律處理。
1.估計正態(tài)分布資料的頻數(shù)分布
例1.10 某地1993年抽樣調(diào)查了100名18歲男大學生身高(cm),其均數(shù)=172.70cm,標準差s=4.01cm,①估計該地18歲男大學生身高在168cm以下者占該地18歲男大學生總數(shù)的百分數(shù);②分別求X+-1s、X+-1.96s、X+-2.58s范圍內(nèi)18歲男大學生占該地18歲男大學生總數(shù)的實際百分數(shù),并與理論百分數(shù)比較。
本例,μ、σ未知但樣本含量n較大,按式(3.1)用樣本均數(shù)X和標準差S分別代替μ和σ,求得u值,u=(168-172.70)/4.01=-1.17。查附表標準正態(tài)曲線下的面積,在表的左側(cè)找到-1.1,表的上方找到0.07,兩者相交處為0.1210=12.10%。該地18歲男大學生身高在168cm以下者,約占總數(shù)12.10%。其它計算結(jié)果見表3。
表3 100名18歲男大學生身高的實際分布與理論分布
分布
x+-s
身高范圍(cm)
實際分布
人數(shù)
實際分布
百分數(shù)(%)
理論分布(%)
X+-1s
168.69~176.71
6767.0068.27
X +-1.96s164.84~180.56
9595.0095.00
X+-2.58s162.35~183.05
9999.0099.00
2.制定醫(yī)學參考值范圍:亦稱醫(yī)學正常值范圍。它是指所謂“正常人”的解剖、生理、生化等指標的波動范圍。制定正常值范圍時,首先要確定一批樣本含量足夠大的“正常人”,所謂“正常人”不是指“健康人”,而是指排除了影響所研究指標的疾病和有關因素的同質(zhì)人群;其次需根據(jù)研究目的和使用要求選定適當?shù)陌俜纸缰?,?0%,90%,95%和99%,常用95%;根據(jù)指標的實際用途確定單側(cè)或雙側(cè)界值,如白細胞計數(shù)過高過低皆屬不正常須確定雙側(cè)界值,又如肝功中轉(zhuǎn)氨酶過高屬不正常須確定單側(cè)上界,肺活量過低屬不正常須確定單側(cè)下界。另外,還要根據(jù)資料的分布特點,選用恰當?shù)挠嬎惴椒ā3S梅椒ㄓ校?
(1)正態(tài)分布法:適用于正態(tài)或近似正態(tài)分布的資料。
雙側(cè)界值:X+-u(u)^S單側(cè)上界:X+u(u)^S,或單側(cè)下界:X-u(u)^S
?。?)對數(shù)正態(tài)分布法:適用于對數(shù)正態(tài)分布資料。
雙側(cè)界值:lg-1[X(lgx)+-u(u)S(lgx)];單側(cè)上界:lg-1[X(lgx)+u(u)S(lgx)],或單側(cè)下界:lg-1[X(lgx)-u(u)S(lgx)]。
常用u值可根據(jù)要求由表4查出。
(3)百分位數(shù)法:常用于偏態(tài)分布資料以及資料中一端或兩端無確切數(shù)值的資料。
雙側(cè)界值:P2.5和P97.5;單側(cè)上界:P95,或單側(cè)下界:P5。
表4常用u值表
參考值范圍(%)單側(cè)雙側(cè)800.842
1.282
901.282
1.645951.6451.960992.3262.576
3.正態(tài)分布是許多統(tǒng)計方法的理論基礎:如t分布、F分布、x2分布都是在正態(tài)分布的基礎上推導出來的,u檢驗也是以正態(tài)分布為基礎的。此外,t分布、二項分布、Poisson分布的極限為正態(tài)分布,在一定條件下,可以按正態(tài)分布原理來處理。
聯(lián)合分布律和分布函數(shù)關系
Z就是正態(tài)分布,X^2分布是一個正態(tài)分布的平方,t分布是一個正態(tài)分布除以(一個X^2分布除以它的自由度然后開根號),F(xiàn)分布是兩個卡方分布分布除以他們各自的自由度再相除。
比如X是一個Z分布,Y(n)=X1^2+X2^2+……+Xn^2,這里每個Xn都是一個Z分布,t(n)=X/根號(Y/n),F(m,n)=(Y1/m)/(Y2/N)。
擴展資料:統(tǒng)計學專業(yè)能力要求:
1,具有扎實的數(shù)學基礎,受到比較嚴格的科學思維訓練;
2,掌握統(tǒng)計學的基本理論、基本知識、基本方法和計算機操作技能;具有采集數(shù)據(jù)、設計調(diào)查問卷和處理調(diào)查數(shù)據(jù)的基本能力;
3,了解與社會經(jīng)濟統(tǒng)計、醫(yī)藥衛(wèi)生統(tǒng)計、生物統(tǒng)計或工業(yè)統(tǒng)計等有關的自然科學、社會科學、工程技術(shù)的基本知識,具有應用統(tǒng)計學理論分析、解決該領域?qū)嶋H問題的初步能力;
4,了解統(tǒng)計學理論與方法的發(fā)展動態(tài)及其應用前景;
5,對于理學學士,應能熟練使用各種統(tǒng)計軟件包,有較強的統(tǒng)計計算能力;對于經(jīng)濟學學士,應具有扎實的經(jīng)濟學基礎,具有利用信息資料進行綜合分析和管理的能力;
6,掌握資料查詢、文獻檢索及運用現(xiàn)代信息技術(shù)獲取相關信息的基本方法;具有一定的科學研究和實際工作能力。
正態(tài)分布三個常用數(shù)據(jù)計算概率
由于X與e獨立,所以E(X|Y)=E(X|X+e)=E(X|X)=X,
Var(X|Y)=Var(X|X+e)=Var(X|X)=E(X^2|X)-(E(X|X))^2=(X^2)-X^2=0 ;
如果只知道Z=X+Y的分布,而沒有其他任何關于X和Y的先驗信息,是無法確定X和Y的分布的,例如:若Z~N(0,d^2),X和Y都是有無窮多可能的。
設正態(tài)分布概率密度函數(shù)是f(x)=[1/(√2π)t]*e^[-(x-u)^2/2(t^2)]
∫e^[-(x-u)^2/2(t^2)]dx=(√2π)t.(*)
求均值
對(*)式兩邊對u求導:
∫{e^[-(x-u)^2/2(t^2)]*[2(u-x)/2(t^2)]dx=0
約去常數(shù),再兩邊同乘以1/(√2π)t得:
∫[1/(√2π)t]*e^[-(x-u)^2/2(t^2)]*(u-x)dx=0
把(u-x)拆開,再移項:
∫x*[1/(√2π)t]*e^[-(x-u)^2/2(t^2)]dx=u*∫[1/(√2π)t]*e^[-(x-u)^2/2(t^2)]dx
也就是
∫x*f(x)dx=u*1=u
這樣就正好湊出了均值的定義式,證明了均值就是u。
(2)方差
過程和求均值是差不多的,我就稍微略寫一點。
對(*)式兩邊對t求導:
∫[(x-u)^2/t^3]*e^[-(x-u)^2/2(t^2)]dx=√2π
移項:
∫[(x-u)^2]*[1/(√2π)t]*e^[-(x-u)^2/2(t^2)]dx=t^2
也就是
∫(x-u)^2*f(x)dx=t^2
正好湊出了方差的定義式,從而結(jié)論得證。
擴展資料:
集中性:正態(tài)曲線的高峰位于正中央,即均數(shù)所在的位置。
對稱性:正態(tài)曲線以均數(shù)為中心,左右對稱,曲線兩端永遠不與橫軸相交。
均勻變動性:正態(tài)曲線由均數(shù)所在處開始,分別向左右兩側(cè)逐漸均勻下降。
曲線與橫軸間的面積總等于1,相當于概率密度函數(shù)的函數(shù)從正無窮到負無窮積分的概率為1。即頻率的總和為100%。
參考資料來源:百度百科-正態(tài)分布
正態(tài)分布標準轉(zhuǎn)換公式推導
Z就是正態(tài)分布。
X^2(卡方)分布是一個正態(tài)分布的平方。
t分布是一個正態(tài)分布除以(一個X^2分布除以它的自由度然后開根號)。
F分布是兩個卡方分布分布除以他們各自的自由度再相除。
比如X是一個Z分布,Y(n)=X1^2+X2^2+……+Xn^2,這里每個Xn都是一個Z分布,t(n)=X/根號(Y/n),F(m,n)=(Y1/m)/(Y2/N)。
各個分布的應用如下:
方差已知情況下求均值是Z檢驗。方差未知求均值是t檢驗(樣本標準差s代替總體標準差R,由樣本平均數(shù)推斷總體平均數(shù))兩個正態(tài)分布樣本的均值方差都未知情況下求兩個總體的方差比值是F檢驗。
掃描二維碼推送至手機訪問。
版權(quán)聲明:本文由尚恩教育網(wǎng)發(fā)布,如需轉(zhuǎn)載請注明出處。