Category Archives: Study

[R] R에서 데이터베이스 불러오기

1. CSV 파일

>[이름]<-read.csv(“/파일주소/abc.csv”)    // 간단하게 불러오기
>[이름]<-read.csv(“/파일주소/abc.csv”, header=T, sep=”,”)    // DB의 첫 로우가 헤더가 되고, 컬럼세퍼레이터가 콤마가 되게 불러오기
>[이름]<-read.csv(“/파일주소/abc.csv”, fileEncoding=”euc-kr”)    // 폰트 인코딩을 지정하여 불러오기

2. TXT 파일

>[이름]<-read.table(“/파일주소/abc.txt”)    // 간단하게 불러오기
>[이름]<-read.table(“/파일주소/abc.txt”, header=T, sep=”,”)    // DB의 첫 로우가 헤더가 되고, 컬럼세퍼레이터가 콤마가 되게 불러오기
>[이름]<-read.table(“/파일주소/abc.txt”, fileEncoding=”euc-kr”)    // 폰트 인코딩을 지정하여 불러오기

3. 엑셀파일

“readxl” 플러그인을 이용한다.

>install.packages(“readxl”)   // 패키지 설치
>library(“readxl”)                  // 패키지 로딩
>[이름]<-read_excel(path=”/파일주소/abc.xlsx”, sheet=”시트명”, col_names=TRUE)           // 첫 로우가 헤더가 되게 엑셀 시트 불러오기

4. STATA 파일

“readstata13” 플러그인을 이용한다.

기존의 “foreign”플러그인으로는 STATA version 12까지 밖에 인식 하지 않음

>install.packages(“readstata13”)   // 패키지 설치
>library(“readstata13”)                  // 패키지 로딩
>[이름]<-read.dta13(“/파일주소/abc.dta”)

 

 

 

 

 

[R] 맥OS에서 R을 사용하기 위한 몇가지 노력

1. 몇몇 패키지들은 .EXE파일로 되어 있어 윈도우에서만 작동가능하다.

이를 해결해 줄 수 있는 것이 XQuartz 이다.

예 – BEFORE)
>library(rgl)
Error: package or namespace load failed for ‘rgl’:
.onLoad failed in loadNamespace() for ‘rgl’, details:
call: dyn.load(file, DLLpath = DLLpath, …)
error: unable to load shared object ‘/Library/Frameworks/R.framework/Versions/3.4/Resources/library/rgl/libs/rgl.so’:

dlopen(/Library/Frameworks/R.framework/Versions/3.4/Resources/library/rgl/libs/rgl.so, 6): Library not loaded: /opt/X11/lib/libGLU.1.dylib
Referenced from: /Library/Frameworks/R.framework/Versions/3.4/Resources/library/rgl/libs/rgl.so
Reason: image not found

예 – AFTER)

> library(rgl)
> example(plot3d)

plot3d> open3d()
glX
1

plot3d> x <- sort(rnorm(1000))

plot3d> y <- rnorm(1000)

plot3d> z <- rnorm(1000) + atan2(x, y)

plot3d> plot3d(x, y, z, col = rainbow(1000))

 

2. .csv확장자 파일의 한글이 깨질 때

위와 같이 엑셀에서부터 깨지는 .csv 파일 대처법

빈 엑셀 파일을 불러 온 후 Data – From Text를 선택

원하는 데이터를 로딩

파일 오리진(File Origin)을 UTF-16이라던지 UTF-8이라던지 바꾸라는 말이 있지만 나의 데이터의 경우엔 “Korean (Windows, DOS)” 로 변경 시 제대로 한글이 나왔다.

이렇게~ 다음 누르고

Delimiters 에 “Comma”도 체크 후 “Finish”

“OK”

파일이 잘 인코딩 되어 나왔다.

원하는 이름으로 바꾸고 Save As

저장 형식은 UTF-16 Unicode Text (.txt)

 

이제 R스튜디오로 가보자

> excel1<-read.csv(“/저장폴더/example_studentlist.txt”, fileEncoding = “UTF-16”)
> excel1

헤더는 “.” 으로 구분되어 있고

컬럼은 “\t”로 구분되어 있다.

이를 해결하기 위해서는

> excel1<-read.csv(“/저장폴더/example_studentlist.txt”, header=T, sep=”\t”, fileEncoding = “UTF-16”)
> excel1

위와 같이 명령어를 더해준다.

(header=T –> Header True 즉 Header가 있다. 없다면 header=F)

(sep –> Separator를 설정)

R로 잘 불러와 졌다.

 

3. 보다 쉽게 한글 CSV 파일 불러오기

> list<-read.csv(“/저장폴더/example_studentlist.csv”, header=T, sep=”,”, fileEncoding = “euc-kr”)
> list

엑셀을 거치지 않고 인코딩만 바꿈으로서 로딩 완료!

[Excel] Table Visualisation (테이블 깔끔하게 프레젠트 하기)

1. 조건부 서식 – 데이터 막대
매출액 추이를 세로 형태의 타임시리즈로 볼 수 있음

2. 조건부 서식 – 색조
온도등을 색의 강도 혹은 색온도로 표현 가능

3. 조건부 서식 – 아이콘 집합
별의 채워지기로 성과표시

4. 조건부 서식 – 상위 10% / 하위 10%
상하위 10%값을 색으로 표시함으로서 Outlier 검출가능

5. 삽입 – 선 스파크라인 / 열 스파크라인
셀 하나에 변동추이를 넣어 보여줄 수 있음

 

 

참고 파일: Table Visualisation

[Excel] 셀에서 기본 한글 언어를 영어로 바꾸기

  1.  기본적으로 TEXT function을 사용하여 날짜셀의 정보를 요일로 변환할 수 있다.

=TEXT(CELL,”dddd”)

text function1

하지만 이렇게 변경된 셀은 엑셀 혹은 Office의 기본 언어의 따라 변경되는데 이를 영문으로 바꾸려면

“dddd”  앞에 [나라코드]를 입력해줘야 한다. 영문은 $-409 이다.

=TEXT(CELL,”[$-409]dddd”)

text function2