2014年4月3日星期四

什么是基尼系数?

当您查找有关不平等的经济统计数据时,通常会看到它以基尼系数测量。但基尼系数来自哪里,它如何计算,直观地意味着什么?这是一些想法。

思考基尼系数的最直接的方式是从不同但相关工具开始测量不等式,这是一个称为Lorenz曲线的图。当他是威斯康星大学的研究生时,洛伦茨曲线是由一个名叫Max Lorenz的美国统计学家和经济学家开发的。他关于这个话题的文章“测量财富浓度的方法,”出现了美国统计协会的出版物,卷。9,70(1905年6月),第70页,第209-219页。国会预算办公室提出了一个很好的紧张2011年报告中的Lorenz曲线描述
“可以绘制收入的累积百分比,以违反群体的累积百分比,产生所谓的Lorenz曲线(见图)。甚至收入分配越多,洛伦茨曲线的越近45度线。在一个极端,如果每个收入组有相同的收入,那么累计收入份额将等于累积人口份额,洛伦兹曲线将遵循45度线,称为平等线。在另一个极端,如果最高收入组获得所有收入,洛伦兹曲线将在绝大多数收入范围内平坦,在图的底部边缘之后,然后在非常右边的边缘跳到图的顶部。
“实际收入分配的Lorenz曲线落在这两个假设极端之间。通常,它们仅在第一个和最后一点相交。在那些点之间,曲线在45度线以下弓形。洛伦兹曲线市场收入落到税后收入的右侧和低于税率曲线,反映其更大的不平等。这两条曲线都落到了平等行为的右侧,反映了市场收入和税后收入的不平等。“


基尼系数计算为从Lorenz曲线取出的区域。基尼系数由意大利统计名(并注意到法西斯思想家)Corrado Gini在意大利语写的1912年(以及我的知识没有自由地提供网络上)。直觉是简单的(尽管数学公式看起来有点混乱)。在Lorenz曲线上,更大的平等意味着基于实际数据的线更接近显示出完美平等的分布的45度线。更大的不等式意味着基于实际数据的线将从45度线远离45度。基尼系数基于45度线和实际数据线之间的区域。随着CBO在2011年的报告中写道:

“Gini指数等于45度线和Lorenz曲线之间的面积的两倍。再一次,完全平等的极端情况和完全不等式绑定了该措施。在一个极端,如果收入均匀分布,洛伦兹曲线跟随45度线,曲线和线之间不会有区域,所以基尼指数将是零。在另一个极端,如果所有收入在最高的收入组中,那么线和曲线之间的区域would be equal to the entire area under the line, and the Gini index would equal one. The Gini index for [U.S.] after-tax income in 2007 was 0.489—about halfway between those two extremes."
要另一种方式,Lorenz曲线绘制了收入分配的全部数据。GINI系数使得全范围的数据归结为单个数字,这就是为什么它有用的比较。但由于GINI将收入的总体分布归结为单个号码,因此它也会丢失一些细节。例如,如果基尼系数已经上升,这是因为这是前20%的分享上升,或前10%,前1%,或前0.1%?如果您知道您正在寻找什么,您可以在Lorenz曲线上看到这些类型的差异,但是单独的基尼没有告诉你这是真的。

所以这是基尼系数的图形含义。但是什么意思是什么?我张贴有趣的弱势“经济不平等的图表“ 由Tony Atkinson和Salvatore Morelli撰写。他们概述了他们使用他们使用的统计数据,他们写:

“[收入]分发总结在单一的概要统计中,通常是基尼系数,这不是我们的首选统计信息,而不是统计机构最常发表的。大多数机构给出的系数的解释采取几何形状,但是我们更愿意在平均差异方面描述它。G百分民的基尼系数意味着,如果我们随意从人口中服用任何2个家庭,预期的差异是平均值的2G%。因此从30%到40%的基尼系数意味着预期差异从平均值的60%到80%。“
Atkinson和Morelli添加了另一种方式来解释基尼系数:
Amartya Sen建议的另一种有用的思维方式是“分布调整后的”国家收入,其中基尼系数是国民收入的百分比。因此,从30%到40%的基尼系数上升相当于将国民收入减少14%(1/7)。“
注意:这篇文章部分回收了基尼的一些解释以前出现在这个博客中几年前,似乎在一个地方讨论似乎很有用。