[原创]计量经济学学习笔记--样本和总体

这里只有作者精心编写的研究经历!
回复
zhuowens father
帖子: 2
注册时间: 2019年11月14日, 22:23

#1 [原创]计量经济学学习笔记--样本和总体

未读文章 zhuowens father » 2020年7月20日, 16:39

       我所认识的计量经济学,是用现有的数据为基础,通过数学模型和计算机技术,去模拟,预测总体的情况和趋势。作为计量经济学的初学者,我们经常会听到一些术语,而“样本”和“总体”,在我来看,是首先要进行区分的两个概念。 以身高的均值为例子,我们知道全国有13亿人,我们想知道全国13亿人的平均身高是多少。有一种一定能得到确切答案的方法,就是给全国13亿人逐个测量身高,再求平均数。但这个方法现实吗?也许可以做到,但耗时耗力。有没有更简单的方法呢? 有一种看似可信的方法,那就是抽查,我们可以从全国各地随机抽50万人测量他们的身高,50万人的平均身高在一定程度上可以反映13亿人的平均身高。




      联想一下民主制度的发展,如果我们把民主比作是平均身高,那么想要知道全民意愿的最好方法当然是实行全民公投,然而即使能够反映真实的情况,人手一票在决议上耗时耗力。古希腊因而发展出代议民主制度,即由各个地方或领域选出民众代表,代表民众。民意代表尽管无法完全反映真实的状况,但在很大程度上也反映了全民的意愿。 这就是“样本”和“总体”的区别。在实证研究中,总体的情况往往是未知的,想得知总体的真实情况耗时耗力,几乎不可能。我们手里的往往只有总体中一部分样本的信息。计量经济学所做的,其实就是运用数学理论让手中的数据尽可能真实地反映出总体的状况。在这里,我们需要重点记住的是:总体是未知的(等待预测的),样本是已知的。 




1.png
1.png (86.17 KiB) 查看 771 次
1.png
1.png (86.17 KiB) 查看 771 次
 
       上图中u是总体均值,而`x 则是样本均值。总体均值是未知的,我们要用样本均值去估算总体均值。这里提出一个问题,我们怎么确定用这个样本估算的均值就能够代表,或者预测总体均值呢?联想一下上面民主制的例子,我们怎么确定选择的民意代表就能够代表民众的意见呢?关键在于选择民意代表的方法,在计量经济学中也类似,关键就在于样本的抽样选择方法。





 Independent and identically distributed (i.i.d独立同分布“在概率统计理论中,指随机过程中,任何时刻的取值都为随机变量,如果这些随机变量服从同一分布,并且互相独立,那么这些随机变量是独立同分布





独立(Independent):在这里,能够确保50万人的身高能代表13亿人的身高,就是抽样必须保证独立,A的身高不会影响B的身高(民意代表A 的意见不会影响民意代表B的意见)。或者说,不会因为选择了A就影响对B的选择。





同分布(identically distributed):2同分布的概念比较抽象,举个例子,抛2次硬币,2次硬币正面朝上的概率都是1/2,“第1次抛硬币”正面朝上“和”第2次抛硬币正面朝上“这两件事本身都服从伯努利分布,则他们都是同分布的。 这是独立同分布是最理想化的样本概念。然而这在实证分析中的基本是很难实现的。然而这给我们通往用样本估算总体的理论之门提供了一把钥匙。





 Central Limit Theorem (中心极限定理当随机变量Xi服从独立同分布,且拥有有限的期望和方差,那么当样本容量很大时,随机变量
 
1595234253(1).png
1595234253(1).png (1.14 KiB) 查看 771 次
1595234253(1).png
1595234253(1).png (1.14 KiB) 查看 771 次
近似地服从标准正态分布N(01)也就是说,如果抽样样本服从独立同分布,当样本容量足够大时,我们可以用样本来代表总体。有了这个工具,我们就可以放心地说,只要抽样方式正确,我们就可以用50万人的身高来代表13亿人的身高了。   

Link:
Hide post links
Show post links


回复