箱形图允许您通过其四分位数来涌现和比拟数值的散布与汇聚趋势AV小次郎。 四分位数是基于五个要津值(最小值、第一四分位数、中值、第三四分位数和最大值)将数值分为四个特殊组的智商。
下图的方框部分涌现数据值中间 50% 的数据,也称为四分位距 (IQR)。 描写数据值中值的线,将方框一分为二。 IQR 可标明一组值的互异。 IQR 较大,流露值散布的规模较大;而 IQR 较小,则流露大渊博值齐落在中心隔邻。 箱形图还可涌现介于须线或线内但蔓延到方框外的最小和最大数据值以及特殊值,即超出须线的点(视情况而定)。
变量箱形图由 (x) 轴和 (y) 轴构成。 x 轴为每个类别或数值字段变量分派一个方框。 y 轴用于测量一组数字中的最小值、第一四分位数、中值、第三四分位数和最大值。
不错使用箱形图可视化一个或多个散布。 要涌现单个散布,添加一个数值字段变量。 这将生成包含一个箱形图的图表,用于涌现所选数值属性的散布。
不错添加其他数值字段变量以比拟来自表中不同属性字段的多个散布。 举例,在县数据汇聚,可将 Population2010 和 Population2015 当作数值字段变量添加。 生成的图表将涌现两个箱形图,分别用于涌现数据汇聚总共县的 Population2010 和 Population2015 的散布。
当仅添加单个数值字段变量时,可遴荐添加类别变量当作比拟不同类别的散布的智商。 举例,关于县数据集,Population2010 诞生为数值字段变量,StateName 诞生为类别变量。 所生成的图表将涌现每个州的箱形图,用于可视化每个州所辖各县的 Population2010 的散布情况。
多个系列可使用多系列箱形图比拟不同类型的散布或按不同类别进行比拟。
要创建多系列箱形图,可通过指定一个类别字段和多个数值字段,或通过指定分割依据类别字段。
当使器具有多个数值字段的类别变量时,添加到系列表中的每个数值字段将创建一个系列。 举例,在县数据汇聚,StateName 诞生为类别变量,Population2010、Population2015 和 Population2020 诞生为数值字段变量。 所生成图表的 x 轴使用州当作类别,每个州具有三个系列(Population2010、Population2015 和 Population2020)。
大略,可添加分割依据变量,用于进一步区别数据并创建多个系列。 举例,关于县数据集,Population2010 诞生为数值字段变量,StateName 诞生为类别变量,ElectionWinner 诞生为分割依据字段。 系列表将使用每个惟一 ElectionWinner 值(民主党或共和党)进行填充。 生成的图表将针对每个州并列涌现两个箱形图(共 100 个箱形图),分别涌现民主党为 ElectionWinner 值的每个州总共县以及共和党为 ElectionWinner 值的每个州总共县的 Population2010 散布情况。
当使用多个数值字段变量而不是类别变量时,还不错使用分割依据字段。 举例,关于县数据集,Population2010、Population2015 和 Population2020 诞生为数值字段变量,ElectionWinner 诞生为分割依据字段。 所生成的图表沿 x 轴涌现三个数值字段变量(Population2010、Population2015 和 Population2020),每个字段包含两个并列的箱形图,分别涌现民主党为 ElectionWinner 值的总共县以及共和党为 ElectionWinner 值的总共县的散布情况。
涌现多个系列使用分割依据字段创建多个系列时,可使用以下两个选项涌现效果:
并列 - 创建并列箱形图,一个图表对应一个系列。 当作平均线 - 将针对每个类别值或数值字段变量创建一个箱形图,并使用线来涌现分割依据字段中每个惟一值的平均值。举例,关于县数据集,Population2010 诞生为数值字段变量,StateName 诞生为类别变量,ElectionWinner 诞生为分割依据字段。 系列表将使用各个惟一 ElectionWinner 值(民主党和共和党)进行填充,但所生成的图表不会针对每个州的每个 ElectionWinner 值分割成一个箱形图,而是针对每个州涌现一个箱形图,用于涌现该州内各县的 Population2010 散布,每个分割依据系列(民主党和共和党)的平均值将在箱形图上疏导,以涌现每个系列平均值联系于总散布的位置。
措施化要是阐述多个数值字段创建箱型图,则默许情况下将诓骗 z 得分措施化。 措施化可使不同单元的数值变量具有可比性。
举例,要是莫得措施化,则用于比拟收入散布(值以万为单元)和闲隙率(值规模介于 0 和 1.0 之间)的箱形图将难以统一,因为闲隙率值比收入值小好多。
属性值的措施化波及 Z 变换,即从每个值中减去总共值的平均值然后除以总共值的措施差。 z 得分措施化可将总共属性置于归拢比例中,允许在归拢图表中涌现多个散布。 要涌现原始值,只需取消选中图表属性窗格中的措施化值(z 得分)复选框即可。
轴多个选项不错适度轴和干系诞生。
X 轴标注字符甩手默许情况下,类别标注将被截断为 11 个字符。 要是标注被截断,不错将光标悬停在标注上涌现齐全文本。 要在图表中涌现通盘标注文本,请加多标注字符甩手。
Y 轴规模默许的 y 轴规模是基于 y 轴上流露的数据值规模诞生的。 输入新的轴规模值,对这些值进行自界说。 不错诞生轴规模来保捏图表比例一致以进行比拟。 单击“重置”按钮 ,以将轴规模归附为默许值。
数字形态不错通过指定数字形态类别或界说自界说形态字符串来形态化轴涌现数值的形态。 举例,使用 $#,### 当作自界说形态字符串来涌现货币值。
外不雅多个选项不错适度图表外不雅和干系诞生。
标题和描摹图表和轴的默许标题将基于变量名和图标类型给定。 可在图表属性窗格的老例选项卡上对此进行剪辑。 还可提供图表描摹,这是涌现在图表窗口底部的文本块。
视觉形态化不错通过形态化文本和秀雅元素大略诓骗图表主题来竖立图表的外不雅。 形态属性不错在图表属性窗格的形态选项卡上进行竖立。 不错在图表选项卡上遴荐图表主题。 图表形态化选项包括以下推行:
轴标题、轴标注、描摹文本、图例标题、图例文本和携带标注所使用的字体的大小、面容和样式 格网和轴线的面容、宽度和线型 图表的布景面容了解关联变嫌图表外不雅的详备信息
面容箱形图需尽可能与图层秀雅系统中界说的笼统和填充面容相匹配。 要是系列的分割形态与图层秀雅系统不合应,则会诓骗措施调色板。 要变嫌系列面容,不错在图表属性窗格的系列选项卡上,单击系列表中的秀雅面容图面,然后遴荐一个新面容。
排序箱形图按类别的字母数字规则自动排序(x 轴升序)。 可使用图表属性窗格中的排序选项对此进行变嫌。 下列排序选项适用于箱形图:
X 轴升序 - 类别按字母数字规则从左到右成列。 X 轴降序 - 类别按反向字母数字规则成列。 平均值升序 - 方框按平均值统计数据以升序进行成列。 平均值降序 - 方框按平均值统计数据以降序进行成列。 中值升序 - 方框按中值统计数据以升序进行成列。 中值降序 - 方框按中值统计数据以降序进行成列。 自界说排序 - 类别可在自界说排序表手动进行成列。 标的在图表窗口中,单击旋转图表按钮 横向绘画方框。
参考线不错向图表中添加参考线或规模当作参考或用以超越蹙迫值。 要添加新参考线,在图表属性窗格的参考线选项卡中,单击添加参考线。 要绘画一条线,请在要绘画线的位置输入值。 要创建一个规模,请输入一个至值。 您不错遴荐通过指定标注为参考线添加文本。
示例创建箱形图来按州比拟不同慢性疾病的散布和互异。
数值字段 - % Diabetes、% Asthma % Heart Failure 类别 -State 眼镜妹 探花关联此主题的反映?AV小次郎