散点图中有大量数据点时如何避免它们相互重叠
针对大数据集绘制散点图时图中各个数据点会被彼此遮盖从而妨碍我们准确地评估数据的分布信息这就是所谓的图形重叠如果图形重叠程度较低我们可以通过使用较小的数据点或者使用不会遮盖其他数据点的点形来避免数据重叠
如果图形的重叠程度较高下面是一系列可行的方法
对于这两种方法在手动设置分箱范围时因为数据点太多或太少会出现一个在分箱范围外的箱子且这个箱子的颜色会显示为灰色而不是最大或最小值对应的颜色
当散点图的其中一个数据轴或者两个数据轴都对应于离散型数据时也会出现图形重叠的情况
这时候可以调用position_jitter()函数给数据点增加随机扰动。默认情况下该函数在每个方向上添加的扰动值为数据点最小精度的40%不过也可以通过width和height参数对该值进行调整。
当数据集对应于一个离散型数据轴和一个连续型数据轴时箱线图可能是一种较好的展示方式如下图。箱线图所表现的信息与散点图略有不同因为他很难反应出离散坐标轴上每个位置的数据点数量的信息箱线图的绘制方式有时是缺点但有时候却是恰如其分的可视化方法。
运行stat_smooth()函数并设定method_1m即可向散点图中添加线性回归拟合线;函数对数据拟合线性模型。首先我们将在基本绘图对象存储在对象sp中然后再添加更多的图形部件
BCKbet体育