在本文中,我们将讨论如何使用 Seaborn 库创建 countplot ,以及如何使用不同的参数从数据集的特征中推断结果。
海底图书馆
seaborn library 在数据分析师中被广泛使用,它包含的一系列图提供了我们数据的最佳表示。
可以使用以下方法将 Seaborn 库导入到我们的工作环境中
import seaborn as sns
现在让我们讨论为什么我们使用 countplot,以及它的参数有什么意义。
计数图
countplot 用于表示分类变量中观察结果的出现(计数)。
它使用条形图的概念进行视觉描绘。
参数-
创建 countplot 时指定了以下参数,让我们简单了解一下它们-
- x 和 y- 该参数指定了我们参考表示的数据,然后观察高亮显示的模式。
- 颜色- 这个参数指定了可以给我们的剧情一个好的外观的颜色。
- 调色板- 取调色板的值。它主要用于显示色调变量。
- 色相- 此参数指定列名。
- 数据- 该参数指定了我们想要用于表示的数据帧。例如,数据可以是一个数组。
- 闪避- 这个参数是可选的,它接受一个布尔值作为输入。
- 饱和度- 该参数接受浮点值。当我们指定这一点时,可以观察到颜色强度的变化。
- 色相 _ 顺序- 参数色相 _ 顺序以字符串为输入。
- kwargs- 参数 kwargs 指定键和值映射。
- ax- 参数 ax 是可选参数,用于获取创建地块的轴。
- orient- 参数 orient 是可选的,告诉我们需要的图的方向,水平的还是垂直的。
现在让我们看看有哪些不同的方式来表示我们的属性。
在第一个示例中,我们将为单个变量创建 countplot。我们采用数据集“提示”来实现同样的功能。
1.单个变量的值计数
示例-
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
#loading the dataset 'tips'
df=pd.read_csv("/content/tips.csv")
#plotting the graph
sns.countplot(x='sex',data=df)
plt.show()
输出:
在下一个示例中,我们将使用色调参数并创建 countplot。
下面的程序说明了同样的情况-
2.用色调参数表示两个分类变量
示例-
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
#loading the dataset 'tips'
df=pd.read_csv("/content/tips.csv")
#plotting the graph
sns.countplot(x='sex',hue='smoker',data=df)
plt.show()
输出:
在下一个例子中,我们将考虑 y 轴并创建一个水平 countplot。
下面的程序说明了同样的情况-
3.创建水平图
示例-
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
#loading the dataset 'tips'
df=pd.read_csv("/content/tips.csv")
#plotting the graph
sns.countplot(y='sex',hue='smoker',data=df)
plt.show()
输出:
现在让我们来看看调色板如何增强数据的呈现。
在下一个例子中,我们将使用参数“调色板”。
下面的程序说明了同样的情况-
4.使用调色板
输入-
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
#loading the dataset 'tips'
df=pd.read_csv("/content/tips.csv")
#plotting the graph
sns.countplot(x='sex', data=df, palette='Set1')
plt.show()
输出:
在下一个例子中,我们将使用参数 color,让我们看看它是如何工作的?
下面的程序说明了同样的情况-
5.使用参数“颜色”
示例-
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
#loading the dataset 'train'
df=pd.read_csv("/content/train.csv")
#plotting the graph
sns.countplot(x='Pclass',hue='Sex', data=df, color='green')
plt.show()
输出:
现在我们将使用参数“饱和度”,看看它如何影响我们的数据表示。
下面的程序说明了同样的情况-
6.使用参数“饱和度”
示例-
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
#loading the dataset 'train'
df=pd.read_csv("/content/train.csv")
#plotting the graph
sns.countplot(x='Pclass',data=df, color='green', saturation=0.1)
plt.show()
输出:
最后在最后一个例子中,我们将使用参数线宽和边缘颜色。
- 使用 matplotlib.axes.Axes.bar()
示例-
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
#loading the dataset 'train'
df=pd.read_csv("/content/train.csv")
sns.countplot(x='Sex', data=df, color="green", facecolor=(0,0,0,0), linewidth=5, edgecolor=sns.color_palette("BrBG",2))
plt.show()
输出:
原创文章,作者:简单一点,如若转载,请注明出处:https://www.506064.com/n/130390.html