BeFRee

Day 0. 엑셀 정도까지만 R을 써봅시다. 본문

R

Day 0. 엑셀 정도까지만 R을 써봅시다.

씨티 2018. 4. 22. 02:35

엑셀로 일을 하려니 점점 데이터 양도 많아지고, 복잡한 분석하기에 불편했습니다.

 

회귀분석, 코호트분석, 군집화, 의사결정나무, 장바구니 분석 등을 하려는데 엑셀은 한계가 있더군요

 

표 형식인 데이터를 지도에 넣기도 힘들고, 

 

뭔가 해보려면 서버 구매해야 하고 (이거 한다고 예산 받아내기도 힘들고...)

 

회사에서 사용하는 노트북 성능은 따라오지 못하고 (노트북 업그레이드 예산 따위는 없고...)

 

 

구글링해보니 R과 Python이 눈에 띄었습니다.

 

설치해서 써보니 R은 자바스크립팅 같은 스트립팅 언어 정도로 보였고. 

Python은 PHP 같은 정도의 프로그램 언어로 보였습니다.

 

당연히 상대적으로 쉬워보이고, 뭔가 있어 보이는... 

(그리고, 공연히 "개발을 왜??"라는 말 안들어도 되는...)

도구를 선택. R.

 

위에서 해보고 싶었던 분석을 해보기로 하고. 최소한 내가 엑셀을 쓰는 것 만큼 R을 써보자라는 목표를 잡아봤습니다.

 

인터넷에는 이미 다양한 R 설명 블로그, 사이트들이 있긴 하지만.

 

공부한 내용 정리할 겸. 누군가에게 나중에 다시 설명해줄 때 자료로 쓸 겸. 정리합니다.

 

 

 

목표 : R을 엑셀만큼 쓸 수 있게 함.

 

[ 엑셀로 하는 것 ]

1. 표 정리하기

2. 간단한 수식으로 셈하기

3. 피벗 만들기

4. 그래프 그리기

5. 통계 분석하기

6. 다양한 시각화 자료 만들기

 

 

 

[ R로 배워볼 것 ]

Day 1. R에 대해서 조금 알아 보기

 

Day 2. R로 데이터프레임 다뤄보기

Session 1.

- 데이터프레임이란?

- 데이터 불러오기

- 데이터프레임 이름 바꾸기

- 데이터 바꾸기

- 조건에 맞는 데이터 추출하기

Session 2.

- 그래프 그려보기 (기본 형식)

- 막대 그래프

- 선 그래프

- 산점도

- 버블 차트

- 상자 그림

 

Day 3. R로 통계 분석해보기

- 결측치. 이상치란?

- 결측치, 이상치 제거하기

- 이런 저런 통계 분석 (Iris. Titanic, Cars, ETC)

 

Day 4. R로 다양한 정보 시각화해보기

- 텍스트 마이닝

- 지도 시각화

- 네트워크 그래프

 

Day 5. R로 다양한 분석해보기

     - 군집 분석

     - 의사결정나무

     - 장바구니 분석

     - 추천

Comments