[R] 맥OS에서 R을 사용하기 위한 몇가지 노력

1. 몇몇 패키지들은 .EXE파일로 되어 있어 윈도우에서만 작동가능하다.

이를 해결해 줄 수 있는 것이 XQuartz 이다.

예 – BEFORE)
>library(rgl)
Error: package or namespace load failed for ‘rgl’:
.onLoad failed in loadNamespace() for ‘rgl’, details:
call: dyn.load(file, DLLpath = DLLpath, …)
error: unable to load shared object ‘/Library/Frameworks/R.framework/Versions/3.4/Resources/library/rgl/libs/rgl.so’:

dlopen(/Library/Frameworks/R.framework/Versions/3.4/Resources/library/rgl/libs/rgl.so, 6): Library not loaded: /opt/X11/lib/libGLU.1.dylib
Referenced from: /Library/Frameworks/R.framework/Versions/3.4/Resources/library/rgl/libs/rgl.so
Reason: image not found

예 – AFTER)

> library(rgl)
> example(plot3d)

plot3d> open3d()
glX
1

plot3d> x <- sort(rnorm(1000))

plot3d> y <- rnorm(1000)

plot3d> z <- rnorm(1000) + atan2(x, y)

plot3d> plot3d(x, y, z, col = rainbow(1000))

 

2. .csv확장자 파일의 한글이 깨질 때

위와 같이 엑셀에서부터 깨지는 .csv 파일 대처법

빈 엑셀 파일을 불러 온 후 Data – From Text를 선택

원하는 데이터를 로딩

파일 오리진(File Origin)을 UTF-16이라던지 UTF-8이라던지 바꾸라는 말이 있지만 나의 데이터의 경우엔 “Korean (Windows, DOS)” 로 변경 시 제대로 한글이 나왔다.

이렇게~ 다음 누르고

Delimiters 에 “Comma”도 체크 후 “Finish”

“OK”

파일이 잘 인코딩 되어 나왔다.

원하는 이름으로 바꾸고 Save As

저장 형식은 UTF-16 Unicode Text (.txt)

 

이제 R스튜디오로 가보자

> excel1<-read.csv(“/저장폴더/example_studentlist.txt”, fileEncoding = “UTF-16”)
> excel1

헤더는 “.” 으로 구분되어 있고

컬럼은 “\t”로 구분되어 있다.

이를 해결하기 위해서는

> excel1<-read.csv(“/저장폴더/example_studentlist.txt”, header=T, sep=”\t”, fileEncoding = “UTF-16”)
> excel1

위와 같이 명령어를 더해준다.

(header=T –> Header True 즉 Header가 있다. 없다면 header=F)

(sep –> Separator를 설정)

R로 잘 불러와 졌다.

 

3. 보다 쉽게 한글 CSV 파일 불러오기

> list<-read.csv(“/저장폴더/example_studentlist.csv”, header=T, sep=”,”, fileEncoding = “euc-kr”)
> list

엑셀을 거치지 않고 인코딩만 바꿈으로서 로딩 완료!

19대 대선결과 분석

[요약 = 지역적갈등 + 세대간갈등 + 홍준표의 의외의 선방]

1. 아직도 좁혀지지 않는 지역간 편향
(대구, 경북, 경남 = 우파)
(광주, 전북, 전남 = 좌파)
(세종 = 문재인 강하게 선호 & 홍준표 강하게 비선호)

2. 세종이 문재인을 강하게 선호하고 홍준표를 강하게 비선호하는것은 젊은 공무원 거주 인구가 많아서가 아닐까…. 하고 조심스레 짐작…

3. 서울은 비교적 성향편중에서 중립적임 + 부산은 홍준표 선호도가 높으나 주변지역의 비해 어마어마하게 중립적

4. 신기한건 부산 주변 도시 창원 양산 김해 거제 울산등은 비교적 중립적이거나 부산과 비슷함.

5. 20-40과 50+ 간의 세대적 표심 견해가 분명히 들어나 있음. 특히 60대는 반문재인의 성향이 두드러짐. 어쨌건 이분들은 빨갱이 공포증 혹은 박정희 팬심이 강하셔서 홍준표 지지 혹은 반문재인 성향이 강한 듯 추정.

6. 세대별 표를 보면 현재 50대는 60대와의 중간다리 역할인듯함. 예상컨데 50대 후반은 60대의 성향을 가지고 있을 가능성이 큼. 즉 베이붐세대 이전까지는 강한 좌빨공포심이 있고 박정희 찬양성이 있음. 아니면 정말 강한 독재자를 원해서 Strong Man 리더쉽을 좋아하거나… 정말 전 새누리당 진골친박을 좋아하거나…

7. 성별차이에서 여자가 심상정을 좀 더 선호하고 안철수를 좀 덜 선호한다. + 홍준표 지지도의 여성과 남성차이가 별로 없음은 “홀로 죄사함 하신 강간미수의 돼지발정제 사건”이건 “여자는 집안에서 설겆이나 하건” 아무렇거나 어쨌건 홍반장 지지할 사람은 지지한다.

비고: [보수와 진보로의 구분은 대한민국에 해당하지 않는 것 같음으로 사용하지 않음]

홍준표의 정의한국당의 [지니계수]선전의 대하여…

1. 어차피 통계청 가계동향조사는 0.01%의 재벌의 소득수준을 잡아내지 못한다. (패널데이터에서 소득수준이 겁나 높은 관찰값이 있다면 이는 이건희 혹은 이재용이다라는 식으로 추론이 가능하기 때문에… 또한 이들이 조사에 응해줄리도 없을뿐더러…)
 
2. 자세한 데이터는 봐야 알겠지만 노무현 정부이후부터 상위 1분위의 소득또한 크게 늘었던 것은 아니다.
 
3. 노빠도 아니고 문빠는 아니지만 저 통계청 지니 수치가 이명박정부때 개선 되었다고 해서 우리나라의 재벌위주의 소득불평등이 개선되었다고 할 수 있을까?
 
4. 지니를 어떻게 계산한지는 더 들여다 봐야 알겠지만 10분위건 100분위건 상위 1분위가 어차피 우리나라 대부분의 소득을 책임지는 상위 1%를 잡아내기 힘들다면 지니계수는 크게 의미가 있을까?
5. 정책의 방향성과 방법의 따라 즉각 효과가 나오는 정책이 있을 수도 있고 Lag가 있을수도 있긴핟…. 이렇게 한 정부를 탓하는건 좀 불공평하지 않은가…?

[Excel] Table Visualisation (테이블 깔끔하게 프레젠트 하기)

1. 조건부 서식 – 데이터 막대
매출액 추이를 세로 형태의 타임시리즈로 볼 수 있음

2. 조건부 서식 – 색조
온도등을 색의 강도 혹은 색온도로 표현 가능

3. 조건부 서식 – 아이콘 집합
별의 채워지기로 성과표시

4. 조건부 서식 – 상위 10% / 하위 10%
상하위 10%값을 색으로 표시함으로서 Outlier 검출가능

5. 삽입 – 선 스파크라인 / 열 스파크라인
셀 하나에 변동추이를 넣어 보여줄 수 있음

 

 

참고 파일: Table Visualisation