# 重新編碼
分析資料前常常需要再次整理資料,方便日後做分析,整理資料第一步往往是將資料的調整值經過一些調整,以下介紹幾種重新編碼的方法。
- 透過邏輯判斷式
- 利用 cut 函數
~~~
> data <- iris # 使用 R 內建的資料。
> data$Sepal.Length <- ifelse(data$Sepal.Length > 5, 1,2) # Sepal.Length 如果大於 5 會變成 1,不會就會變成 2
> data$Species <- ifelse(data$Species %in% c(setosa), "IsSetosa","Notsetosa") # %in% 代表有包含到的概念
> x <- c(1, 5, 12, 18, 19, 21, 25, 31)
> cut(x, c(0, 10, 20, 30, 40), c(5, 15, 25, 35)) # cut 函數是透過切割點,重新賦予資料新的數值,本範例的切割的範圍是 0 ~ 10、10 ~ 20、20 ~ 30、30 ~ 40,0 ~ 10 範圍的賦予新的值是 5。
[1] 5 5 15 15 15 25 25 35
Levels: 5 15 25 35
~~~
- Introduction
- Chapter 1 - 環境建置
- 安裝與更新 R
- 安裝 RStudio
- Rstudio 基本介紹
- 切換 R 的版本
- Console 開啓 R console
- 安裝載入 package
- Chapter 2 - 基本運算
- 資料屬性
- 常見運算
- Chapter 3 - 變數與資料
- 變數
- 向量
- 陣列
- 矩陣
- 因子
- 列表
- 資料框架
- Chapter 4 - 資料匯入與輸出
- 匯入資料
- 輸出資料
- 讀取資料庫的資料
- Chapter 5 - 流程控制
- 邏輯判斷式
- 條件執行
- 迴圈結構
- Chapter 6 - 資料整理
- 重新編碼
- 資料變形
- 資料合併與分割
- Chapter 7 - 自訂函數
- 定義函數
- 建立 .First 與 .Last 函數