Category Archives: R Study

[R] R에서 데이터베이스 불러오기

1. CSV 파일

>[이름]<-read.csv(“/파일주소/abc.csv”)    // 간단하게 불러오기
>[이름]<-read.csv(“/파일주소/abc.csv”, header=T, sep=”,”)    // DB의 첫 로우가 헤더가 되고, 컬럼세퍼레이터가 콤마가 되게 불러오기
>[이름]<-read.csv(“/파일주소/abc.csv”, fileEncoding=”euc-kr”)    // 폰트 인코딩을 지정하여 불러오기

2. TXT 파일

>[이름]<-read.table(“/파일주소/abc.txt”)    // 간단하게 불러오기
>[이름]<-read.table(“/파일주소/abc.txt”, header=T, sep=”,”)    // DB의 첫 로우가 헤더가 되고, 컬럼세퍼레이터가 콤마가 되게 불러오기
>[이름]<-read.table(“/파일주소/abc.txt”, fileEncoding=”euc-kr”)    // 폰트 인코딩을 지정하여 불러오기

3. 엑셀파일

“readxl” 플러그인을 이용한다.

>install.packages(“readxl”)   // 패키지 설치
>library(“readxl”)                  // 패키지 로딩
>[이름]<-read_excel(path=”/파일주소/abc.xlsx”, sheet=”시트명”, col_names=TRUE)           // 첫 로우가 헤더가 되게 엑셀 시트 불러오기

4. STATA 파일

“readstata13” 플러그인을 이용한다.

기존의 “foreign”플러그인으로는 STATA version 12까지 밖에 인식 하지 않음

>install.packages(“readstata13”)   // 패키지 설치
>library(“readstata13”)                  // 패키지 로딩
>[이름]<-read.dta13(“/파일주소/abc.dta”)

 

 

 

 

 

[R] 맥OS에서 R을 사용하기 위한 몇가지 노력

1. 몇몇 패키지들은 .EXE파일로 되어 있어 윈도우에서만 작동가능하다.

이를 해결해 줄 수 있는 것이 XQuartz 이다.

예 – BEFORE)
>library(rgl)
Error: package or namespace load failed for ‘rgl’:
.onLoad failed in loadNamespace() for ‘rgl’, details:
call: dyn.load(file, DLLpath = DLLpath, …)
error: unable to load shared object ‘/Library/Frameworks/R.framework/Versions/3.4/Resources/library/rgl/libs/rgl.so’:

dlopen(/Library/Frameworks/R.framework/Versions/3.4/Resources/library/rgl/libs/rgl.so, 6): Library not loaded: /opt/X11/lib/libGLU.1.dylib
Referenced from: /Library/Frameworks/R.framework/Versions/3.4/Resources/library/rgl/libs/rgl.so
Reason: image not found

예 – AFTER)

> library(rgl)
> example(plot3d)

plot3d> open3d()
glX
1

plot3d> x <- sort(rnorm(1000))

plot3d> y <- rnorm(1000)

plot3d> z <- rnorm(1000) + atan2(x, y)

plot3d> plot3d(x, y, z, col = rainbow(1000))

 

2. .csv확장자 파일의 한글이 깨질 때

위와 같이 엑셀에서부터 깨지는 .csv 파일 대처법

빈 엑셀 파일을 불러 온 후 Data – From Text를 선택

원하는 데이터를 로딩

파일 오리진(File Origin)을 UTF-16이라던지 UTF-8이라던지 바꾸라는 말이 있지만 나의 데이터의 경우엔 “Korean (Windows, DOS)” 로 변경 시 제대로 한글이 나왔다.

이렇게~ 다음 누르고

Delimiters 에 “Comma”도 체크 후 “Finish”

“OK”

파일이 잘 인코딩 되어 나왔다.

원하는 이름으로 바꾸고 Save As

저장 형식은 UTF-16 Unicode Text (.txt)

 

이제 R스튜디오로 가보자

> excel1<-read.csv(“/저장폴더/example_studentlist.txt”, fileEncoding = “UTF-16”)
> excel1

헤더는 “.” 으로 구분되어 있고

컬럼은 “\t”로 구분되어 있다.

이를 해결하기 위해서는

> excel1<-read.csv(“/저장폴더/example_studentlist.txt”, header=T, sep=”\t”, fileEncoding = “UTF-16”)
> excel1

위와 같이 명령어를 더해준다.

(header=T –> Header True 즉 Header가 있다. 없다면 header=F)

(sep –> Separator를 설정)

R로 잘 불러와 졌다.

 

3. 보다 쉽게 한글 CSV 파일 불러오기

> list<-read.csv(“/저장폴더/example_studentlist.csv”, header=T, sep=”,”, fileEncoding = “euc-kr”)
> list

엑셀을 거치지 않고 인코딩만 바꿈으로서 로딩 완료!