R语言dplyr包使用group_by函数和summarise函数构建频率表实战
R语言dplyr包使用group_by函数和summarise函数构建频率表实战
在R语言中,dplyr包是一个功能强大的数据处理工具,它提供了一套简洁、高效的函数,方便我们对数据进行整合、筛选、排序、计算等操作。其中,group_by函数和summarise函数是dplyr包中常用的函数之一,它们可以帮助我们构建频率表。
首先,我们需要安装并加载dplyr包。可以使用以下代码进行安装:
install.packages("dplyr")
library(dplyr)
接下来,我们将使用一个示例数据集来演示如何使用group_by函数和summarise函数构建频率表。假设我们有一个数据框df,包含了一个名为”category”的分类变量。现在,我们想要统计每个类别的频数。
# 创建示例数据
df <- data.frame(category = c("A", "B", "A", "C", "B", "A", "B", "C", "C"))
# 使用group_by函数对数据框按照"category"进行分组
df_grouped <- df %>%
group_by(category)
# 使用summarise函数计算每个组的观测数量,并添加一个名为"frequency"的新列
df_summary <- df_grouped %>%
summarise(frequency = n())
# 查看频率表
print(df_summary)
上述代码中,首先我们创
还没有评论,来说两句吧...