## 生存分析
### 应用场景
通常运用于比较不同组别之间生存预后的差异
> 所用数据为TCGA肺腺癌数据,数据结构如下
![data format](http://kancloud.nordata.cn/2018-12-30-074348.png)
```R
# 读取数据,构建生存分析所需数据结构
load('./cli_test.Rdata')#rt_cli
# 按照基因的表达值中位数分成高低表达组
rt_cli$gp[rt_cli[, 'EGFR'] < median(rt_cli[, 'EGFR'])] <- 'low_exp'
rt_cli$gp[rt_cli$gp != 'low_exp'] <- 'high_exp'
# 计算生存的pvalue
library(survival)
diff <- survdiff(Surv(OS_Time, OS_Status) ~ rt_cli$gp, data = rt_cli)
p_value <- 1-pchisq(diff$chisq, df=1)
fit <- survfit(Surv(OS_Time, OS_Status) ~ rt_cli$gp,, data = rt_cli)
```
> 作图
```R
par(mar = c(5, 5, 5, 3))
plot(fit, lty = 1:1, lwd = 5, cex.main = 2.5, cex.lab = 2.5, col=c("#E7B800", "#2E9FDF"), xlab= ("time (day)"),
ylab="surival rate")
legend('bottomleft', c('high exp', 'low exp'), cex = 1.5, lty = 1, lwd = 7, col=c("#E7B800", "#2E9FDF"))
legend('topright', paste('pvalue:', round(p_value, digits = 2), sep = " "), cex = 1.5)
### 也可以利用survminer这个R包
library(survminer)
ggsurvplot(fit,
conf.int = FALSE,
risk.table.col = "strata", # Change risk table color by groups
ggtheme = theme_bw(), # Change ggplot2 theme
palette = c("#E7B800", "#2E9FDF"))
# 也可以加上95%CI
# conf.int = TRUE
ggsurvplot(fit,
conf.int = TRUE,
risk.table.col = "strata", # Change risk table color by groups
ggtheme = theme_bw(), # Change ggplot2 theme
palette = c("#E7B800", "#2E9FDF"))
# 也可以加上num
ggsurvplot(fit,
conf.int = TRUE,
risk.table.col = "strata", # Change risk table color by groups
ggtheme = theme_bw(), # Change ggplot2 theme
palette = c("#E7B800", "#2E9FDF"),
risk.table = TRUE)
```
![KM1](http://kancloud.nordata.cn/2018-12-30-074349.png)![KM1](http://kancloud.nordata.cn/2018-12-30-074351.png)
![KM1](http://kancloud.nordata.cn/2018-12-30-074354.png)![KM3](http://kancloud.nordata.cn/2018-12-30-074356.png)
- 智汇医圈
- 第一章 前言
- 1.1 简介
- 1.2 制作该教程的目的
- 1.3 学习该教程需要掌握的基础知识
- 1.4 该教程适用人群
- 第二章 散点图(scatter plot)
- 2.1 基本的散点图
- 2.2 3D 散点图
- 第三章 线图(line plot)
- 3.1 基本的线图
- 第四章 箱型图(boxplot)
- 4.1 基本的箱型图
- 4.2 图形参数调整
- 4.3 多分组箱型图
- 4.4 小提琴图
- 第五章 密度图(density plot)
- 5.1 基本的密度图
- 第六章 热图(Heatmap)
- 6.1 基本的热图
- 6.2 ggplot2 heatmap
- 6.3 相关性热图
- 第七章 主成分分析(PCA)
- 7.1 2D PCA
- 7.2 3D PCA
- 第八章 ROC 曲线
- 8.1 基本的 ROC 曲线
- 第九章 生存分析(KM plot)
- 9.1 基本的生存分析
- 第十章 KEGG 和 GO 分析
- 10.1 KEGG 分析
- 10.2 GO 分析
- 第十一章 Circular plot
- 11.1 基本的 Circular plot
- 附录 下载数据