quartz/content/math/statistic/significance_test/whats_the_significance_test.md
2024-10-10 10:39:11 +08:00

7.7 KiB
Raw Blame History

title tags date
What's the significance test
advanced
statistics
math
2024-04-15

The significance test tells us whether or not what we observe in the sample is expected to be true in the population, and can be conducted through a hypothesis test.

Goal

• The sample correlation coefficient (r) between x and y is known (can be computed using samples) • The population correlation coefficient (\rho) between x and y is unknown (because we only have sample data) • Goal: We want to make an inference about the value of $\rho$ based on r

Hypothesis Test

The hypothesis test will let us infer whether the value of the population correlation coefficient \rho is close to 0 or significantly different from 0. We decide this based on the sample correlation coefficient $r$ and the sample size n

Situation:

\rho close to 0: means there is not a significant linear correlation between x and y in the population. • \rho significantly different from 0: means there is a significant correlation between x and y in the population.

For hypothesis test, we have two types - the null and alternative hypotheses.

• The alternative hypothesis is always what we are trying to prove. • The null hypothesis is the hypothesis that we are trying to provide evidence against.

Detailed Explaination

  1. 零假设Null Hypothesis - 通常表示为$H_0$​。 零假设是一个默认的假设,它通常表示没有效应、没有差异或变量之间没有关系。换句话说,零假设通常提出了一个“无效果”的声明,比如两组数据的均值没有差异、两个变量之间没有相关性等。在假设检验中,研究者试图通过收集和分析数据来寻找拒绝零假设的证据。

    例如,如果研究者想要检验两种药物对血压的影响是否有差异,零假设可能是“两种药物对降低血压的效果没有差异”。

  2. 备择假设Alternative Hypothesis - 通常表示为$H_1$或$H_a$​。 备择假设与零假设相对立,它提出了一个“有效果”的声明,即存在效应、差异或关系。备择假设通常是研究者真正感兴趣的假设,它反映了研究者希望证明的效应或关系。

    在上述药物对血压影响的例子中,备择假设可能是“两种药物对降低血压的效果存在差异”。

Classic Test Method

Here's some classic test method:

  • T-Test (Student's T-Test)
  • ANOVA (Analysis of Variance)
  • Mann-Whitney U Test - MWU (Mann-Whitney U Test)
  • Kruskal-Wallis H Test - KW (Kruskal-Wallis H Test)
  • Friedman Test - FT (Friedman Test)
  • ANCOVA - ANCOVA (Analysis of Covariance)
  • Pearson Correlation Coefficient - PCC (Pearson Correlation Coefficient)
  • Factor Analysis - FA (Factor Analysis)
  • Cluster Analysis - CA (Cluster Analysis)
  • Time Series Analysis - TSA (Time Series Analysis)
  • ... ...

T-test

Here we introduce a very classic test method, called T-test, also called Students T-test, which is an inferential statistic that allows to test an assumption applicable to a population, or simply, it allows to use sample data to generalize an assumption to an entire population.

[!info] T检验是由威廉·戈塞特William Sealy Gosset在20世纪初提出的他使用笔名“Student”发表了相关论文因此这种检验有时也被称为“Student's t-test”。它通常用于样本量较小的情况

T-value

Equation:


t=\frac{r\times\sqrt{n-2}}{1-r^2}

\text{n is the sample size, r is the correlation coefficient}

T值t-value是从T检验中得到的统计量它是样本均值差异与样本内变异性的比率。T值越大意味着样本均值之间的差异相对于样本内的变异性越大这通常会导致更低的p值从而增加了拒绝零假设即两组均值没有差异的证据。换句话说T值越大我们越有理由相信两组之间的均值差异是真实存在的而不是由随机变异引起的。

T值的大小并不直接影响相关性的可重复性。然而如果我们在讨论的是重复测量的均值差异那么在某种程度上较大的T值可能会使得研究者更有信心认为这种差异是可靠的因为较大的T值意味着较小的p值这可能会使得研究结果在统计上更显著。但是,这并不意味着相关性的可重复性得到了提高,因为相关性的可重复性涉及到的是变量之间关系的一致性,而不是均值差异的显著性。

P-value

P值P-value全称为概率值Probability value是统计假设检验中的一个重要概念。它用于帮助我们决定是否拒绝零假设null hypothesisP值衡量的是在零假设为真的情况下观察到的统计量如T值、Z值等或更极端情况出现的概率

在进行假设检验时我们通常设定一个显著性水平alpha level常用的值有0.05、0.01等。这个显著性水平是我们事先决定的拒绝零假设的阈值。如果计算出的P值小于这个显著性水平我们就有理由拒绝零假设认为观察到的效应或差异是统计上显著的即不太可能是由随机变异引起的。

例如假设我们进行一个T检验零假设是两组数据的均值没有差异。如果我们得到的P值为0.03而我们设定的显著性水平为0.05那么P值小于0.05,我们就拒绝零假设,认为两组数据的均值存在显著差异。

需要注意的是,P值并不直接告诉我们零假设是真还是假也不提供效应大小的信息。它只是表示在零假设成立的前提下,得到当前统计结果或更极端结果的概率。此外P值也不是与发现效应的大小相关联的概率。一个很小的P值并不意味着效应很大,它只意味着结果不太可能是偶然发生的

在使用P值时应该避免一些常见的误解和滥用如将P值解释为支持备择假设的概率或者将P值与研究的结论重要性等同起来。正确理解和解释P值对于统计分析的有效性和科学性的结论至关重要。

Conclusion

1、小概率原理小概率事件在一次试验中是几乎不可能发生的假若在一次试验中小概率事件事实上发生了。那只能认为该事件不是来自我们假设的总体也就是认为我们对总体所做的假设不正确。

2、观察到的显著水平由样本资料计算出来的检验统计量观察值所截取的尾部面积。这个概率越小反对原假设认为观察到的差异表明真实的差异存在的证据便越强观察到的差异便越加理由充分地表明真实差异存在。

3、检验所用的显著水平针对具体问题的具体特点事先规定这个检验标准。

4、在检验的操作中把观察到的显著性水平与作为检验标准的显著水平标准比较小于这个标准时得到了拒绝原假设的证据认为样本数据表明了真实差异存在。大于这个标准时拒绝原假设的证据不足认为样本数据不足以表明真实差异存在。

5、检验的操作可以用稍许简便一点的作法根据所提出的显著水平查表得到相应的值称作临界值直接用检验统计量的观察值与临界值作比较观察值落在临界值所划定的尾部内便拒绝原假设观察值落在临界值所划定的尾部之外则认为拒绝原假设的证据不足。

Reference