R语言dplyr包使用group_by函数和summarise函数构建频率表实战

雨点打透心脏的1/2处 2023-10-14 22:08 163阅读 0赞

R语言dplyr包使用group_by函数和summarise函数构建频率表实战

在R语言中,dplyr包是一个功能强大的数据处理工具,它提供了一套简洁、高效的函数,方便我们对数据进行整合、筛选、排序、计算等操作。其中,group_by函数和summarise函数是dplyr包中常用的函数之一,它们可以帮助我们构建频率表。

首先,我们需要安装并加载dplyr包。可以使用以下代码进行安装:

  1. install.packages("dplyr")
  2. library(dplyr)

接下来,我们将使用一个示例数据集来演示如何使用group_by函数和summarise函数构建频率表。假设我们有一个数据框df,包含了一个名为”category”的分类变量。现在,我们想要统计每个类别的频数。

  1. # 创建示例数据
  2. df <- data.frame(category = c("A", "B", "A", "C", "B", "A", "B", "C", "C"))
  3. # 使用group_by函数对数据框按照"category"进行分组
  4. df_grouped <- df %>%
  5. group_by(category)
  6. # 使用summarise函数计算每个组的观测数量,并添加一个名为"frequency"的新列
  7. df_summary <- df_grouped %>%
  8. summarise(frequency = n())
  9. # 查看频率表
  10. print(df_summary)

上述代码中,首先我们创

发表评论

表情:
评论列表 (有 0 条评论,163人围观)

还没有评论,来说两句吧...

相关阅读