《数据可视化基础》第十章:多组分类变量数据可视化(二)

以下部分是基于《Fundamentals of Data Visualization》学习笔记,要是有兴趣的话,可以直接看原版书籍:https://serialmentor.com/dataviz/

巢式扇形图

在本章刚开始的时候,我们使用桥梁数据集来说明对于嵌套的分类变量可视化,使用马赛克图和树图式更合适的。但是同样的其实也是可以使用巢式扇形图来进行可视化的。

对于巢式扇形图的可视化有两个方法,第一种是画由一个内圈和一个外圈组成的扇形图。内圈现实一个变量的数据,外圈现实一个变量的数据。

另外一个可视化方式,则是把两个分类变量拟合成一个变量。进而进行一个扇形图的可视化。

并行流程图

如果我们想要对两个以上的分类变量的变化进行描述的话,那么马赛克图和树图以及饼状图就很难进行处理了。这个时候我们就可以使用并行流程图了(parallel sets plot)。

这次我们把桥梁的数据进行扩展。现在关于桥梁数据的描述有了四个分类变量。分别是:建筑材料(铁、钢、木材)、每座桥的长度(长、中、短)、每座桥建造的年代(工艺、新兴、成熟、现代)以及每座桥跨越的河流(阿勒格尼、莫农加赫拉、俄亥俄州)。在下面的并行流程图当中,我们使用见建筑材料这个分类变量来连接其他不同的分类变量。由下图可以看出:大多数的木头桥梁主要是中等长度的,其主要是在工艺时期建造的,并且这些桥梁主要建造于阿勒格尼河上。

对于并行流程图而言,我们想要观察什么变量的变化,就可以把这个变量设置成颜色的变化即可。同时需要进行可视化的两个原则是:

  • 由于我们查看图的顺序是从左到右的,所以对于颜色变化的变量建议放到最左边。
  • 对于数据的走向,建议从变化少到变化多的来排列。

基于以上两个原理,我们发现?图中,?比?要好很多。

 

杂谈

我们应该如何入门R语言

2020-8-14 23:25:09

杂谈

科研干货:硕博士生如何利用SCI进行选题和开题

2020-8-14 23:35:20

加入Q群
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索