国内精品区一区二区三_久久91精品视频_一区二区三区在线|网站_青青草精品视频

首頁 > 技術支持 > 做實驗需要掌握哪些統計學知識?

做實驗需要掌握哪些統計學知識?

點擊次數:1934     更新時間:2025-01-04

統計學是數據分析的基石。學了統計學,你會發現很多時候的分析并不靠譜。比如很多人都喜歡用平均數去分析一個事物的結果,但是這往往是粗糙的,準確的。如果學了統計學,那么我們就能以更多更科學的角度看待數據。 


大部分的數據分析,都會用到統計方面的以下知識,可以重點學習:

  • 基本的統計量:均值、中位數、眾數、方差、標準差、百分位數

  • 概率分布:幾何分布、二項分布、泊松分布、正態分布等

  • 總體和樣本:了解基本概念,抽樣的概念

  • 置信區間與假設檢驗:如何進行驗證分析

  • 相關性與回歸分析:一般數據分析的基本模型

通過基本的統計量,你可以進行更多元化的可視化,以實現更加精細化的數據分析。這個時候也需要你去了解更多的Excel函數來實現基本的計算,或者python、R里面一些對應的可視化方法。

有了總體和樣本的概念,你就知道在面對大規模數據的時候,怎樣去進行抽樣分析。

你也可以應用假設檢驗的方法,對一些感性的假設做出更加精確地檢驗。

利用回歸分析的方法,你可以對未來的一些數據、缺失的數據做基本的預測。

了解統計學的原理之后,你不一定能夠通過工具實現,那么你需要去對應的找網上找相關的實現方法,也可以看書。先推薦一本非常簡單的:吳喜之-《統計學·從數據到結論》。 

另外,如何精力允許,請掌握一些主流算法的原理,比如線性回歸、邏輯回歸、決策樹、神經網絡、關聯分析、聚類、協同過濾、隨機森林。再深入一點,還可以掌握文本分析、深度學習、圖像識別等相關的算法。關于這些算法,不僅需要了解其原理,你最好可以流暢地闡述出來,還需要你知曉其在各行業的一些應用場景。如果現階段不是工作剛需,可不作為重點。

本文算是一個知識點匯總,不做細致展開,讓大家了解統計學有哪幾大塊,每一類分別用于什么樣的分析場景。后面幾篇會以實際案例的方式,細致講講描述性統計、概率分布等。


知識點匯總:

1.集中趨勢

2.變異性

3.歸一化

4.正態分布

5.抽樣分布

6.估計

7.假設檢驗

8.T檢驗


一、集中趨勢

圖片


1.眾數

出現頻率最高的數;

2.中位數

把樣本值排序,分布在最中間的值;

樣本總數為奇數時,中位數為第(n+1)/2個值;

樣本總數為偶數時,中位數是第n/2個,第(n/2)+1個值的平均數;

3.平均數

所有數的總和除以樣本數量;

現在大家接觸最多的概念應該是平均數,但有時候,平均數會因為某些極值的出現收到很大影響。舉個小例子,你們班有20人,大家收入差不多,19人都是5000左右,但是有1個同學創業成功了,年入1個億,這時候統計你們班同學收入的“平均數"就是500萬了,這也很好的解釋了,每年各地的平均收入數據出爐,小伙伴們直呼給祖國拖后腿了,那是因為大家收入被平均了,此時,“中位數"更能合理的反映真實的情況;



二、變異性

圖片


1.四分位數

上面說到了“中位數",把樣本分成了2部分,再找個這2部分各自的“中位數",也就把樣本分為了4個部分,其中1/4處的值記為Q1,2/4處的值記為Q2,3/4處的值記為Q3

2.四分位距 IQR=Q3-Q1

圖片

3.異常值

小于Q1-1.5(IQR)或者大于Q3+1.5(IQR);

對于異常值,我們在數據處理的環節就要剔除;

4.方差

圖片

5.平方偏差

方差的算術平方根

6.貝塞爾矯正:修正樣本方差

實際在計算方差時,分母要用n-1,而不是樣本數量n。原因在于,比如在高斯分布中,我們抽取一部分的樣本,用樣本的方差表示滿足高斯分布的大樣本數據集的方差。由于樣本主要是落在x=u中心值附近,那么樣本如果用如下公式算方差,那么預測方差一定小于大數據集的方差(因為高斯分布的邊沿抽取的數據也很少)。為了能彌補這方面的缺陷,那么我們把公式的n改為n-1,以此來提高方差的數值,這種方法叫貝塞爾矯正系數。



三、歸一化

圖片


1.標準分數

一個給定分數 距離 平均數 多少個標準差?

標準分數是一種可以看出某分數在分布中相對位置的方法。

標準分數能夠真實的反映一個分數距離平均數的相對標準距離。

圖片


四、正態分布

圖片



1.定義:隨機變量X服從一個數學期望為μ,方差為σ?2;的正態分布,記為N(μ,σ?2;)

隨機取一個樣本,有68.3%的概率位于距離均值μ有1個標準差σ內;

有95.4%的概率位于距離均值μ有2個標準差σ內;

有99.7%的概率位于距離均值μ有3個標準差σ內;

圖片


五、抽樣分布

圖片


1.中心極限定理

設從均值為μ,方差為σ?2;的任意一個總體中抽取樣本量為n的樣本,當n充分大時,樣本均值的抽樣分布近似服從均值為μ、方差為σ?2;/n的正態分布

2.抽樣分布

設總體共有N個元素,從中隨機抽取一個容量為n的樣本,在重置抽樣時,共有N·n種抽法,即可以組成N·n不同的樣本,在不重復抽樣時,共有N·n個可能的樣本。每一個樣本都可以計算出一個均值,這些所有可能的抽樣均值形成的分布就是樣本均值的分布。但現實中不可能將所有的樣本都抽取出來,因此,樣本均值的概率分布實際上是一種理論分布。數理統計學的相關定理已經證明:在重置抽樣時,樣本均值的方差為總體方差的1/n。

舉個例子:

48盆MM豆,計算出每盆有幾個藍色的MM豆,48個數據構成了總體樣本。然后隨機選擇五盆,計算五盆中含有藍色MM豆的平均數,然后反復進行了50次。這就是n為5的樣本均值抽樣。

圖片


六、估計

圖片


1. 誤差界限

圖片

2. 置信度

We are some % sure the true population parameter falls within a specific range

我們有百分之多少確信總體中的值落在一個特定范圍內;

一般情況下,取95%的置信度就可以;

3. 置信區間

圖片


七、假設檢驗

圖片

1.問題:什么是顯著性水平?

顯著性水平是估計總體參數落在某一區間內,可能犯錯誤的概率,也就是Type I Error

A Type II Error is when you fail to reject the null when it is actually false.

圖片

圖片

2. 如何選擇備選檢驗和零假設?

一個研究者想證明自己的研究結論是正確的,備擇假設的方向就要與想要證明其正確性的方向一致;

同時將研究者想收集證據證明其不正確的假設作為原假設H0


八、T檢驗

圖片


1. 主要用于樣本含量較小(例如n<30),總體標準差σ未知的正態分布。

流程如下:

圖片

是用t分布理論來推論差異發生的概率,從而比較兩個平均數的差異是否顯著;

一般檢驗水準α取0.05即可;

計算檢驗統計量的方法根據樣本形式不同;

2. 獨立樣本T檢驗:

現在要分析男生和女生的身高是否相同兩者的主要區別在于數據的來源和要分析的問題。

圖片

問題:為什么T檢驗查表時候要n-1?

樣本均值替代總體均值損失了一個自由度

3. 配對樣本t檢驗

分析人的早晨和晚上的身高是否不同,于是找來一撥人測他們早上和晚上的身高,這里每個人就有兩個值,這里出現了配對

圖片

樣本誤差(Standard Error)

圖片


圖片

4. Pooled variance 合并方差

當樣本平均數不一樣,但實際上認為他們的方差是一樣的時候,需要合并方差

不要被公式嚇到,他的本質是兩個樣本方差加權平均

圖片


圖片

5. Cohen’s d

效應量(effect size):提示組間真正的差異占統計學差異的比例,值越大,組間差異越可靠。

圖片

圖片


在線咨詢 聯系方式 二維碼

服務熱線

13973264378

掃一掃,關注我們

亚洲精品xxxx| 777亚洲妇女| 午夜剧场免费在线观看| 国产精品精品国产一区二区| 天堂资源在线亚洲资源| 成人高清免费在线| 久久亚洲成人精品| 色在线视频播放| 在线视频你懂得一区二区三区| av资源免费观看| 国产一区美女在线| 日本人妻一区二区三区| 精品大片一区二区| 亚洲精品人成| 亚洲精品福利电影| 国产精品久久久久久中文字| 色播视频在线观看| 亚洲欧美国产va在线影院| 亚洲精品手机在线| 午夜精品久久久久久久久久| 国产1区2区3区4区| 亚洲精品专区| 男女av免费观看| 亚洲一区网址| 欧美色欧美亚洲另类七区| 三级资源在线| 国产ts一区二区| 91在线最新| 一区二区三区视频免费在线观看| 国产精品亚洲综合久久小说| 色成年激情久久综合| 国产精品永久久久久久久久久| 久久精品一区二区三区不卡牛牛 | 无码人妻丰满熟妇区毛片蜜桃精品 | 成人app下载| 日韩毛片无码永久免费看| 一区在线免费| 久久久久久蜜桃一区二区| 伊甸园亚洲一区| 免费国产成人看片在线| 久久福利在线| 国产一区二区三区四区五区加勒比 | 国产色综合网| 8x8x成人免费视频| 成人亚洲一区二区| 人妻少妇精品久久| 亚洲精品一区二区三区中文字幕 | 三年中文在线观看免费大全中国| 精品在线99| 69精品丰满人妻无码视频a片| 色综合视频一区二区三区44| 好看的日韩精品视频在线| av免费在线观| 国产精品久久久久久久久免费看 | 亚洲怡红院在线| 久久一区二区三区电影| 日本十八禁视频无遮挡| 超碰成人在线观看| 在线观看一区欧美| 国产亚洲字幕| 亚洲精品在线视频观看| 日韩毛片网站| 视频一区二区三区在线观看| 99精品国自产在线| 欧美精品久久久| 日韩精品极品| 国产精选一区二区| av在线资源| 国产麻豆乱码精品一区二区三区| 爱啪啪综合导航| 99热99热| 这里有精品可以观看| 国产欧美精品一区二区三区| 日本在线播放一二三区| 91精品久久久久久久久不口人| 99se视频在线观看| 热久久99这里有精品| 丝袜视频国产在线播放| 91高清视频在线免费观看| 色视频在线看| 2021国产精品视频| 日本中文字幕伦在线观看| 成人av在线亚洲| 暧暧视频在线免费观看| 99久久久精品免费观看国产| 在线观看福利电影| 精品一区久久久久久| 三级成人在线| 日本精品一区二区三区高清 久久 日本精品一区二区三区不卡无字幕 | 日本在线一区二区| 水蜜桃一区二区| 视频在线亚洲| 国产日韩欧美精品在线观看| 狠狠色狠狠色综合婷婷tag| 免费高清在线观看免费| 久久国产成人午夜av影院宅| 天天视频天天爽| 亚洲国产二区| 国产精品jizz| 国产成人精品影视| 四虎永久在线精品| 国产精品国产三级国产aⅴ入口| 亚洲资源在线播放| 欧美日韩国产精品一区二区不卡中文| 婷婷在线免费视频| 91麻豆精品国产综合久久久久久 | 欧美黄色免费视频| 欧美成人精品1314www| 波多野结衣视频在线播放| 少妇高潮久久久久久潘金莲| 无线免费在线视频| 国产精品久久久久一区二区| 暧暧视频在线免费观看| 蜜桃视频日韩| 盗摄系列偷拍视频精品tp| 成年人免费在线播放| 国产综合婷婷| 久久久久无码精品国产sm果冻 | 欧美激情国产精品| 激情视频在线观看免费| 国产精品免费观看在线| 最全影音av资源中文字幕在线| 欧美激情在线观看视频| 美女av在线播放| 国产日韩欧美亚洲一区| 东京一区二区| 少妇高潮大叫好爽喷水| 成人三级视频| 国产大学生视频| 国产精品亚洲第一区在线暖暖韩国| 日本午夜小视频| 一区二区三区四区视频精品免费| juy有坂深雪中文字幕| 亚洲激情视频在线播放| 18成年在线观看| 美女福利精品视频| 欧美极品视频| 91国产在线免费观看| 草美女在线观看| 宅男av一区二区三区| 欧美xxxx在线| 国模大尺度视频| 国产一区二区美女诱惑| 无码日韩精品一区二区| 日韩欧美中文字幕在线观看| 午夜免费入口| 欧美精品一本久久男人的天堂| 国产最新在线| 日韩欧美亚洲日产国| 国产欧美一区二区精品久久久| 污色网站在线观看| 国产精品嫩草99av在线| 欧美精品xxxxx| 亚洲国产精品久久人人爱蜜臀| 亚洲精品成人a| 日韩在线视频观看| 黄色在线论坛| 亚洲国产一区二区精品视频| 日韩1区在线| 国产小视频自拍| 1000部国产精品成人观看| 国产大奶视频| 91成人国产在线观看| 久久亚洲资源中文字| 色婷婷.com| a美女胸又www黄视频久久| 男人天堂网在线视频| 国产一区二区三区欧美| 亚洲小说区图片| 99热久久这里只有精品| 喷水一区二区三区| 国产精品久久久久久免费免熟 | 另类小说第一页| 成人午夜精品在线| 天堂成人在线观看| 日韩视频免费在线| 国产v日韩v欧美v| 精品国产成人av在线免| 国产美女久久久久| 亚洲欧美另类日韩| 中文字幕av一区二区三区谷原希美| 亚洲七七久久综合桃花剧情介绍| 精品国产av无码一区二区三区| 美洲天堂一区二卡三卡四卡视频| 国产精品久久久久久久一区二区| 亚洲美女视频网站| 青草视频在线免费直播| 激情综合网婷婷| 成人avav在线| 天堂精品高清1区2区3区| 午夜精品一区二区三区在线 | 91麻豆123| 国内国产区免费视频| 欧美制服第一页| julia中文字幕一区二区99在线| 97超碰在线免费观看| 黄色成人av网| 在线国产三级| 椎名由奈jux491在线播放| 日韩av一级电影|