多应用+插件架构,代码干净,二开方便,首家独创一键云编译技术,文档视频完善,免费商用码云13.8K 广告
# 15 比较方法 在统计学中,我们要问的最常见的问题之一是两个不同组的平均值是否存在差异。假设我们想知道经常吸食大麻的人是否会看更多的电视。我们可以使用 nhanes 数据集来问这个问题;让我们从数据集中抽取 200 个人的样本,测试每天看电视的时间是否与正常使用大麻有关。图[15.1](#fig:PotTVViolin)显示了使用小提琴绘图的这些数据。 ```r # create sample with tv watching and marijuana use NHANES_sample <- NHANES_adult %>% drop_na(TVHrsDay, RegularMarij) %>% mutate( TVHrsNum = recode( #recode character values into numerical values TVHrsDay, "More_4_hr" = 5, "4_hr" = 4, "2_hr" = 2, "1_hr" = 1, "3_hr" = 3, "0_to_1_hr" = 0.5, "0_hrs" = 0 ) ) %>% sample_n(200) ``` ![Violin plot showing distributions of TV watching separated by regular marijuana use.](https://img.kancloud.cn/df/ef/dfef54295daffea04b73fcc740b242ef_384x384.png) 图 15.1 显示电视观看分布的小提琴图,由正常的大麻使用分开。