아래 내용은 outdated된 사항으로 아래 내용이 최신입니다.
Anaconda 환경 추가
- jupyter notebook 과 jupyter lab이 함께 설치된다.
- anaconda prompt 에서 실행한다. -n 뒤에는 환경 이름 (예: rconda)
conda create -n rconda r-essentials r-base
- 윈도우에서는 conda activate rconda
- 맥에서는 source activate rconda
패키지 설치에서 발생하는 차이
- 패키지 설치에서 가끔 문제를 일으킨다. 예를 들어 ‘pROC’ 패키지의 경우, 윈도우에서는 jupyter notebook에서 아래 코드를 직접 쳐서 설치하면 로딩에 문제가 없다.
install.packages('pROC', repos='http://cran.us.r-project.org')
- 맥에서는 프롬프트에서 아래와 같이 설치해줘야 주피터에서 로딩이 된다.
- 맥에서 패키지 설치에 대한 검색은 https://anaconda.org/r/r-proc 에서 검색하면 나온다.
conda install -c r r-proc
주로 쓰는 기본 패키지 로딩
- display 함수 정의는 jupyter notebook 전용 – 깔끔하게 보기 위해서 만들었다.
library(survival)
require(dplyr)
library(psych)
library(gplots)
require(repr)
require(ggplot2)
require(survminer)
library(dendextend)
library(data.table)
require(EnvStats)
library(openxlsx)
display <- function(x)
{
IRdisplay::display(x)
}
엑셀 불러오기
- library(openxlsx)
df.basic <- read.xlsx("./data_summm2.xlsx", sheet = 1, startRow = 1, colNames = TRUE)
dim(df.basic)
colnames(df.basic)
변수 기본 분석
- 연속 변수에서 shapiro.test 로 p<0.05 일 경우 정규분포를 따르지 않음
- summaryStats 에서 quartile=TRUE 는 IQR을 표시
shapiro.test(df.basic$age_at_op) summaryStats(df.basic$age_at_op, quartiles=TRUE)
BioConductor 설치 (작성중)
- 윈도우 기준
install.packages("BiocManager", repos='http://cran.us.r-project.org')
BiocManager::install("GSVA")
- 이렇게 할 경우 다음과 같은 오류가 나온다.
Error: package or namespace load failed for 'GSVA' in loadNamespace(i, c(lib.loc, .libPaths()), versionCheck = vI[[i]]): namespace 'rlang' 0.3.4 is already loaded, but >= 0.4.5 is required
- rlang을 jupyter notebook에서 설치하려고 하면 계속 permission에러가 난다.
- 이에 프롬프트에서 conda install -c conda-forge r-rlang (0.4.6설치)