국민대 빅데이터 MBA과정에서 첫 학기에 수강하는 과목 중에 python 이라는 과목이 있다. 며칠 전 R에 이어, 오늘은 python 설치에 대해 포스팅하고자 한다.


python, 즉 파이썬은 1991년 네덜란드 프로그래머인 휘도 판 로숨(Guido Van Rossum)이 첫 버전을 발표했으며, 현재 3.6 버전까지 발표되고 있다. 파이썬은 데이터 사이언스, 분석, 머신러닝 측면에서 R과 함께 사용 빈도가 가장 높은 프로그램 언어이다.


파이썬의 장점은 다음과 같다.

   - 오픈소스 (무료)

   - 대화형 환경

   - 많은 사용자와 활발한 커뮤니티

   - 다양한 방면에서 사용(구글, NASA, 유투브 등)


파이썬의 단점은 속도가 느리다는 점과 모바일 앱 개발에 쓰기 어렵다는 점이 있다. 속도가 느리다는 정도는 데이터 처리 자체가 1분이나 10분씩 걸린다는 것이 아니라, 상대적으로 빠른 프로그램이 0.0001초에 끝낼 계산을 파이썬은 0.001초에 끝낸다는 의미이니 일상적인 사용에는 문제가 없겠다.


파이썬으로 할 수 있는 것에는 다음의 것들이 있다.

   : 웹 개발, 게임 개발, 업무 자동화, 데이터 분석, 기계 학습, 과학 계산, 텍스트 처리, 이미지 처리, 멀티미디어, 데이터베이스 등


데이터 분석을 위해 파이썬을 설치하는 방법에는 크게 2가지가 있다.

1. 파이썬을 설치한다.

   : https://www.python.org/

2. 아나콘다(anaconda)를 설치한다.

   : https://www.anaconda.com/


파이썬에서는 필요한 패키지를 직접 설치해줘야 하는데, 이것이 번거롭고 버전 충돌 문제로 인해 불편하다. 이러한 불편함을 덜어주기 위해 아나콘다(anaconda)는 데이터 분석에 자주 쓰이는 모듈과 함께 파이썬을 패키지로 제공한다. 그래서 데이터 분석을 위해 파이썬을 사용하는 경우, 아나콘다를 설치하는 것이 수월하다.




자, 이제 아나콘다 설치 과정에 대해 알아보자



<그림1. 아나콘다 홈페이지>

https://www.anaconda.com

- 본인의 운영체제에 맞는 버전을 설치하면 되겠다.

- 설치 전에 반드시 본인의 컴퓨터 시스템 종류가 32비트인지 64비트인지 확인한 후 설치하여야 한다.

- 내 컴퓨터 시스템 종류(32비트/64비트) 확인 방법

   ① 윈도우버튼+r → 실행창에서 dxdiag 실행 → 운영체제에서 확인

   ② 램이 2기가 이하이면 100% 32비트, 8기가 이상이면 100% 64비트, 4기가면 반반



<그림2. 아나콘다 설치 과정<

- 설치과정에는 별 어려움 없이 다음을 선택하면 된다. 주의할 점 몇 가지가 있다.

- ③번에서 권한 등의 문제로 인해 "Just me"를 선택하는 것이 정신건강에 좋다.

- ⑤번에서 두 가지 옵션을 모두 선택한다. 첫 번째 옵션은 아나콘다를 패쓰에 추가해주는 옵션이다. 두 번째 옵션은 아나콘다를 기본 파이썬으로 인식한다는 옵션이다.


<그림3. 아나콘다 버전확인>

- 아나콘다 설치가 성공적으로 완료되었는지, 그리고 아나콘다의 버전을 확인하는 방법은 다음과 같다.

  : 윈도우+r → "cmd" 입력 후 엔터 → "conda --version" 입력 후 엔터 → 버전 확인 → cmd 창을 닫을 때는 "exit" 입력하고 엔터



이제 파이썬을 사용할 준비가 완료되었다!


2018.04.02. 코리.



'Big Data > Python 놀이터' 카테고리의 다른 글

파이썬(python, anaconda) 설치하기  (0) 2018.04.02





국민대 빅데이터 MBA과정에서 첫 학기에 수강하는 과목 중에 R 이라는 과목이 있다. 오늘은 R 이라는 프로그램의 설치 방법에 대해 포스팅하고자 한다.


R 프로그램 설치는 누구나 할 수 있을 정도로 쉽고 간단하기 때문에 아래 설치 사진으로 대체하고, R에 대한 소개와 장단점에 대해 먼저 알아보자. 


R은 통계 계산과 그래픽을 위한 프로그래밍 언어이자 소프트웨어 환경이다. 통계 소프트웨어 개발과 자료 분석에 널리 사용되고 있으며, 패키지 개발이 용이하여 통계학자들 사이에서 통계 소프트웨어 개발에 많이 사용되고 있다. R은 C, Fortran 그리고 R을 이용해서 만들어졌다. 


R은 뉴질랜드 오클랜드 대학의 Ross Ihaka와 Robert Gentleman에 의해 시작되어, 현재는 R 코어 팀이 유지관리는 해오고 있다. 프로그램 이름이 R인 이유에는 다음과 같은 썰이 있다.1)

1. 개발자 2명(Ross, Robert)의 이름에서 유래되었다.

2. R의 기반이 된 또 다른 통계언어인 S를 뛰어 넘기 위해 알파벳에서 S 앞에 오는 R로 이름을 지었다.


R은 open source로 제공되어 무료로 다운로드 및 설치가 가능하다. R의 다운로드는 CRAN(https://cran.r-project.org)에서 가능하다. CRAN은 Comprehensive R Archive Network의 약자로 R과 관련된 다양한 자료들의 창고이다. 


R과 항상 함께 따라다니는 RStudio라는 프로그램이 있다. RStudio는 R의 통합개발환경(IDE, Integrated development environment)으로 R을 보다 손쉽게 사용할 수 있게 해주는 도구이며, R이 설치되어 있어야 이용이 가능하다. RStudio는 www.rstudio.com에서 무료로 설치할 수 있다. 개인용은 무료이지만, 기업용은 비용을 지불하고 사용해야 한다. R을 설치 한 후에 RStudio를 또 설치하는 것에 의문을 가질 수 있다. 둘 간의 관계는 R을 말(horse)에 비유하면 RStudio는 안장인 셈이다. 안장 없이 말을 탈 수 있지만 불편하기 때문에 모든 사람들이 말 등에 안장을 얹진 후 말을 타는 것이다. 그러므로 R을 처음 사용하는 사람이라면, R을 설치하고 바로 RStudio를 설치하도록 하자. 


R의 장점과 단점은 다음과 같다.


장점

1. 오픈소스라서 무료로 이용이 가능하다. 

2. 상대적으로 진입장벽이 낮다.

3. 수많은 추가기능 사용이 가능하다. 전 세계 많은 통계학 관련 교수 및 학생들이 package(추가 기능)을 만들어 올리고 있다.

4. 다양한 데이터를 활용하여 손쉽게 고품질 그래픽 생성이 가능하다.


단점

1. 대부분의 패키지가 해당 분야 전문가들이 만들었기 때문에 초보자들이 사용하기 쉽지 않다.

2. 한글을 감안하고 만들지 않은 패키지의 경우, 한글이 깨지는 등의 오류가 있다. 

3. In-Memory 기술을 이용하므로 대용량 자료 처리에는 불편함이 있다.

4. GUI(Graphic User Interface) 관련 기능이 미흡하지만 RStudio가 많은 부분을 보완하고 있다.



이제 R과 RStudio 설치와 절차와 방법을 소개한다.

R은 위에서 언급한 CRAN(https://cran.r-project.org)에서 다운로드 및 설치가 가능하다.


<그림1. R 설치하기1>

- CRAN 초기 화면

- 본인의 컴퓨터 운영체제(윈도우, 맥, 리눅스)에 맞는 버전을 다운로드 할 수 있다.



<그림2. R 설치하기2>



<그림3. R 설치하기3>

- 시스템 종류(32비트, 64비트)에 상관없이 하나의 파일을 받으면 된다. 설치 중간에 32비트 또는 64비트를 선택해야 한다.



<그림4. R 설치하기4>

- 3번에서 32비트 또는 64비트 중 본인의 컴퓨터에 맞는 것을 선택해야 한다.

- 내 컴퓨터 시스템 종류(32비트/64비트) 확인 방법

  ① 윈도우버튼+r → 실행창에서 dxdiag 실행 → 운영체제에서 확인

  ② 램이 2기가 이하이면 100% 32비트, 8기가 이상이면 100% 64비트, 4기가이면 반반

- 이제 R 설치가 완료되었다!!




RStudio는 위에서 언급한 www.rstudio.com에서 다운로드 및 설치가 가능하다.


<그림5. RStudio 설치하기1>

- www.rstudio.com에서 다운로드 가능하다.



<그림6. RStudio 설치하기2>

- 무료 버전을 다운로드 한다.



<그림7. RStudio 설치하기3>

- 본인 컴퓨터의 OS에 맞는 버전을 설치한다.



<그림8. RStudio 설치하기4>

- 5 단계 만에 설치가 완료된다!!




이렇게 R에 대한 간략 소개와 설치방법에 대한 포스팅을 마무리 한다.



출처 및 참고자료

1) 위키페디아 https://en.wikipedia.org/wiki/R_(programming_language)



2018.03.29. 코리


'Big Data > R 놀이터' 카테고리의 다른 글

R과 RStudio 설치하기  (0) 2018.03.29

+ Recent posts

티스토리 툴바