海运HISPLOT和DISPLOT输出不匹配
问题描述
seaborn.histplot和seaborn.displot生成的直方图不匹配。sns.displot的默认绘图为kind='hist'
- 使用
python3.8.11、seaborn 0.11.2和matplotlib 3.4.2测试
- 为什么输出不匹配,如何解决此问题?
- 期望是,给定
bins,相应曲线图的density应该匹配。bins传递给numpy.histogram_bin_edges
- Visualizing distributions of data中包含的信息不能解决问题。
import seaborn as sns
import matplotlib.pyplot as plt
# sample data: wide
dfw = sns.load_dataset("penguins", cache=False)[['bill_length_mm', 'bill_depth_mm']].dropna()
# sample data: long
dfl = dfw.melt(var_name='bill_size', value_name='vals')
seaborn.displot
- 忽略
'sharex': False,但'sharey'工作 - 忽略
bins
fg = sns.displot(data=dfl, x='vals', col='bill_size', kde=True, stat='density', bins=12, height=4, facet_kws={'sharey': False, 'sharex': False})
plt.show()
- 设置
xlim没有影响
fg = sns.displot(data=dfl, x='vals', col='bill_size', kde=True, stat='density', bins=12, height=4, facet_kws={'sharey': False, 'sharex': False})
axes = fg.axes.ravel()
axes[0].set_xlim(25, 65)
axes[1].set_xlim(13, 26)
plt.show()
seaborn.histplot
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(8, 4))
sns.histplot(data=dfw.bill_length_mm, kde=True, stat='density', bins=12, ax=ax1)
sns.histplot(data=dfw.bill_depth_mm, kde=True, stat='density', bins=12, ax=ax2)
fig.tight_layout()
plt.show()
更新
- 按照mwaskom的建议,
common_bins=False使直方图形状一致,解决了忽略bins和sharex的问题。但是,density似乎受到displot中绘图数量的影响。- 如果
displot中有3个地块,则密度为histplot中的1/3;2个地块,密度为1/2。
- 如果
解决方案
- 按照mwaskom在评论中的建议,
common_bins=False将直方图调整为相同的形状,解决了忽略bins和sharex的问题,并且分面图中的density是根据每个分面中的数据点的数量而不是分面的数量进行缩放的。 density按displot中的绘图数量拆分的问题通过使用common_norm=False解决
打印代码
# displot
fg = sns.displot(data=dfl, x='vals', col='bill_size', kde=True, stat='density', bins=12, height=4,
facet_kws={'sharey': False, 'sharex': False}, common_bins=False, common_norm=False)
fg.fig.subplots_adjust(top=0.85)
fg.fig.suptitle('Displot with common_bins & common_norm as False')
plt.show()
# histplot
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(8, 4))
sns.histplot(data=dfw.bill_length_mm, kde=True, stat='density', bins=12, ax=ax1)
sns.histplot(data=dfw.bill_depth_mm, kde=True, stat='density', bins=12, ax=ax2)
fig.subplots_adjust(top=0.85)
fig.suptitle('Histplot')
fig.tight_layout()
plt.show()
相关文章