您的位置:首页 > 国际新闻

列联表:看似简单,做起来真没那么容易!

时间:2019-09-08

i1.go2yd.comimage.php?url=0MesXHW1SH

从小图表中了解社会研究的逻辑或社会现象的规律。同时,我们也注重制作图表,使我们的工作技能不断提高。这两点是这件事的乐趣。 ◆◆列联表◆◆

我想通过它分享一个事实:

虽然列联表很简单,但它有明确的规则。支持它的是我们应该始终关注的因果逻辑。简而言之,列联表似乎很简单,但很难做到。有时它比回归分析更困难。

让我告诉你一个历史事实。在20世纪早期和中期,列联表可以说是“最先进”的数据分析工具。那个时代及以后的时代支持我们进入今天的大数据时代(DT)。

下图是一个相对复杂的列联表。我在表格中做了一些笔记,主要是为了概述表格的“设计逻辑”。

i1.go2yd.comimage.php?url=0MesXHpb6h

首先,表的标题。 1964年“美国黑人宗教信仰在教育程度方面的百分比分布”的逻辑如下:

1)1964年(数据收集时间,这非常重要,因为一切都是历史发展的);

2)美国城市黑人(这是整体调查,定义三组:国家是美国,区域是城市,族群是黑人);

3)教育水平(自变量);

4)宗教信仰(因变量);

5)百分比分布(表的类别,一个是频率分布表;相对来说,百分比分布表有更大的含义,我们一般不做一个简单的频率分布表,而且表达的信息是有限的)。

这里让我们知道一个表应该总是包含足够的信息,以便读者可以在不查看文本的情况下阅读它。因此,标题和变量名称应清晰完整;如果标题没有足够的空间,则应在脚注中描述该表。

i1.go2yd.comimage.php?url=0MesXH3bNR

二,百分比表的方向。我不会在这里解释太多,只是告诉大家百分比表的方向通常是自变量类别的数字顺序。所谓的方向是沿这个方向的总和是100%。如图所示,自变量是教育水平,小学是其中一个类别。此类别的百分比值分别为31%,57%,12%和1%。小学类别中的百分比值为100%,依此类推。高中和大学类别的总和是100%。但是,我们必须考虑一下。怎么改变桌子的方向?我们理解方便吗?

第三,每个人看总栏目,价值不是100%。这是一种常见的现象,但非专业人士很难注意。原因很简单,这是四舍五入造成的错误。一般来说,一个百分比的偏差是可以接受的(99%-101%)。偏差较大可能是计算误差,应仔细检查。更专业的方法也应该在脚注中解决这个问题。 “由于四舍五入,数据的总和可能不等于总数(或100%)。”

最后,告诉大家阅读两个百分比表的基本规则:

1.通常只比较两个极端类别,但忽略中间类别(有统计处理的理由,要理解,请阅读一本书或给我们留言);

2.比较不同类别的自变量之间的相对大小(因为顺序变量的类别之间没有绝对边界)。

有些照片被授权在照片网络上使用,请勿在未经授权的情况下发布

?

零点是大数据智能服务组织的典范,专注于行业的深度应用。零点依赖于多源数据资源的长期积累和不断扩展,数据分析模型和应用平台的不断研发和优化,通过数据轴从大数据,中等数据到精细数据,直接用于公共事务,业务领域优质的客户群提供数据驱动的从楼层到天花板的解决方案,涵盖行动策略,决策支持和价值管理。

欲了解更多信息,请联系:

如需商业合作,请点击左下角[阅读原文]

?

——

  • 友情链接:
  • 楚汉新闻门户网 版权所有© www.edu-china.net 技术支持:楚汉新闻门户网| 网站地图