데이터 인사이트

데이터 전문가 칼럼
데이터 전문가가 전하는 데이터 노하우

[빅데이터 분석] 김승욱의 R을 R려줘 시즌I: 엑셀을 넘어 R 바다로! (1회)

작성자
관리자
작성일
2020-10-26 11:15
조회
306

김승욱의 R을 R려줘 시즌I: 엑셀을 넘어 R 바다로! (1회)

익숙한 것과의 결별, R로 엑셀 분석 뛰어넘기

 
김승욱 encaion@korea.kr 기상청에서 연구원으로 있으며 데이터 분석이 직업이자 취미이다. 주로 R과 관련된 활동을 하며 온오프라인 강의, 집필, 스터디, 멘토링 등 벌여놓은 일로 ‘고통’을 받고 있다.
 

빅데이터라는 유행이 훑고 지나간 요즘, 김 대리의 상심은 깊어갑니다. 작년만 해도 착착 통과되었던 보고서들이 "더 괜찮은 거 없어?"라는 약간의 핀잔 섞인 반응과 함께 다시 책상위로 놓입니다. 분명 주변 사람들은 엑셀의 기능을 활용하면 다 된다고 말을 합니다. 하지만 막상 떨어진 일을 해결하려고 보면 어떤 함수를 써야 하는지도 막막할 때가 많습니다. 게다가 복잡한 수식을 구현하려면 함수를 중첩하고 중첩해야 되는데 이 괄호가 누구 괄호인지, 에러는 도대체 어디서 생긴 것인지….

오늘도 모닝커피와 함께 고민중인 김 대리의 스마트폰의 페이스북 대화창 알람이 도착했습니다.



만지던 다른 엑셀파일을 뒤로한 채 김 대리는 부랴부랴 파일을 받아봅니다. 파일이 생각보다 용량이 큽니다. 일단 김 대리는 늘 하던 방식으로 엑셀로 파일을 열어봅니다.



 아니 세상에… 도대체 이 파일은 무어란 말인가?? 앞이 캄캄합니다. 도대체 엑셀로 열리지 않는 파일이라니! 엑셀 하나로 버티고 버텼는데 분명 무언가가 잘못 됐습니다. 다시 탐색기를 열어 파일을 확인해 보아도 분명 엑셀 아이콘으로 표기가 되어있으니 엑셀에서 열 수 있는 파일이 맞습니다.


일단 급하게 친구한테 요청을 합니다.



결국 김 대리는 R 프로그램을 검색한 끝에 R과 RStudio를 다운받고 설치하게 됩니다. 이제 드디어 과장님이 넘겨주신 파일을 처리할 수 있겠다는 큰 꿈을 안고 RStudio 프로그램을 실행합니다.



PC의 모니터 화면도 김 대리의 머리도 같이 표백이 되었습니다. 갑갑해진 김 대리는 또 다시 친구에게 요청을 합니다.



그렇게 김 대리는 친구의 도움을 받아 리포트를 만들게 됩니다. 이제 친구가 보내준 코드를 보고 여러분도 따라 해보세요

"이게 일별 판매 그래프인가… 글자도 너무 작고 날짜 확인도 안 되고…."



"이거 생긴 것은 참 답답해 보이는데 꽤 쓸만하네!"

그렇게 김 대리는 그래프를 첨부하여 리포트를 다 만들고 외근중인 부장님께 이메일을 보냈습니다. 아직은 모르는 점이 많지만 엑셀도 참 좋은 것 같은데 R이라는 프로그램도 꽤나 요긴하게 쓰일 것 같다는 생각을 하면서 점심 식사를 하러 갑니다.



여태 엑셀을 사용하면서 함수 몇 개만 중첩해서 써도 뿌듯해 하던 김 대리는 오전의 경험이 참 신선했습니다. 자칫 잘못하다간 부장님이 엄청난 일을 시킬 수도 있다는 불안감이 스쳐 지나갔지만, 이 기회에 점수를 따두는 것도 좋겠다는 생각을 합니다. 아직은 R이라는 이놈이 얼마나 대단한지 감이 잡히지 않지만, 친구가 뚝딱뚝딱 결과를 만들어 주는 것을 보니 나도 충분히 할 수 있지 않을까? 라는 자신감이 생기기도 합니다.

"그래, 기왕 하는 거."

 
그렇게 김 대리는 친구와 주말 약속을 잡고 질문 목록을 만들어 갑니다. 지금 상태로 보았을 때는 삼겹살을 꽤나 사야 될 것 같지만 당분간 제대로 R을 배우겠다는 다짐을 하며…. 다음 회에는 ‘R로 들여다 보는 데이터 전처리의 속살’이라는 주제로 여러분을 찾아 뵙겠습니다. (다음 회에 계속)

출처 : 한국데이터베이스진흥원

제공 : 데이터 전문가 지식포털 DBguide.net