본문 바로가기
프로그래밍/R

[R] 분석하기 전 필수작업 및 기본 함수들 (getwd, setwd, read.csv, head, etc)

by research_notes 2023. 1. 30.
728x90
반응형

1. 작업 디렉토리 확인 및 설정

#현재 작업 경로 위치 확인
getwd()

#새로운 작업 디렉토리로 지정  
setwd("/Users/user/Documents/R/blog")

#현재 또는 지정된 경로의 하위 폴더 및 파일의 이름
dir()

 

2. 데이터 불러오기 및 저장하기

# .csv 파일 불러오기
data <- read.csv("/Users/user/Documents/R/blog/blog_inputfile.csv") 
data <- read.csv("blog_inputfile.csv") #파일이 있는 경로로 이동한 후 파일 불러오기

# .xlsx 파일 불러오기 (xlsx파일을 불러오기 위해서는 "readxl"이라는 패키지가 필요함.)
install.packages("readxl") #패키지 설치
library(readxl) #패키지 불러오기
data <- read_excel("blog_inputfile.xlsx")
data

 

 

3. 데이터 구조 확인하기

### 데이터 확인 ###
head(data,3) #3번째 row까지 확인
dim(data) #dimension 확인
ncol(data) #column 개수
nrow(data) #row 개수
variable.names(data) # 변수 이름들 확인

data$id[1] #data의 'id' 변수의 첫번째 element 확인
data$age[2] #data의 'age' 변수의 두번째 element 확인
data$gender[3] #data의 'gender' 변수의 세번째 element 확인

 

4. 기본적인 Demographic 분석

mean(data$age) #age 변수 평균값
sd(data$age) # standard deviation

nfem = length(data$gender[data$gender == 2])# number of females
nmale = length(data$gender[data$gender == 1])# number of males
percentfem = nfem /(nfem+nmale) # 여성 %
percentmale = nmale /(nfem+nmale) # 남성 %

5. 파일 내보내기

# 작업 디렉토리 안에 파일 저장하기
write.csv(data, "blog_outputfile.csv")

전체코드

 

############################
### 작업 디렉토리 확인 및 설정 ###
############################
#현재 작업 경로 위치 확인
getwd()

#새로운 작업 디렉토리로 지정  
setwd("/Users/user/Documents/R/blog")

#현재 또는 지정된 경로의 하위 폴더 및 파일의 이름
dir()

##################
### 파일 불러오기 ###
##################
# .csv 파일 불러오기
data <- read.csv("/Users/user/Documents/R/blog/blog_inputfile.csv") 
data <- read.csv("blog_inputfile.csv") #파일이 있는 경로로 이동한 후 파일 불러오기

# .xlsx 파일 불러오기 (xlsx파일을 불러오기 위해서는 "readxl"이라는 패키지가 필요함.)
install.packages("readxl") #패키지 설치
library(readxl) #패키지 불러오기
data <- read_excel("blog_inputfile.xlsx")
data

####################
### 데이터 구조 확인 ###
####################
head(data,3) #3번째 row까지 확인
dim(data) #dimension 확인
ncol(data) #column 개수
nrow(data) #row 개수
variable.names(data) # 변수 이름들 확인

data$id[1] #data의 'id' 변수의 첫번째 element 확인
data$age[2] #data의 'age' 변수의 두번째 element 확인
data$gender[3] #data의 'gender' 변수의 세번째 element 확인

#######################
### Demographic 분석 ###
#######################
mean(data$age) #age 변수 평균값
sd(data$age) # standard deviation

nfem = length(data$gender[data$gender == 2])# number of females
nmale = length(data$gender[data$gender == 1])# number of males
percentfem = nfem /(nfem+nmale) # 여성 %
percentmale = nmale /(nfem+nmale) # 남성 %

#...
#...다른 분석들...
#...

############################
# 작업 디렉토리 안에 파일 저장하기 #
write.csv(data, "blog_outputfile.csv")

 

 

728x90
반응형