윈도우(windows)에서 카이(Khaiii) 설치하기 - 그 네 번째 이야기. Khaiii 빌드와 설치

 

 

첫 번째 이야기 보러가기 - 리눅스 설치

두 번째 이야기 보러가기 - 리눅스 세팅

세 번째 이야기 보러가기 - 필요한 패키지 설치와 jupyter notebook 실행

 

 

리눅스에서 jupyter notebook까지 실행했다면, 이제 마지막 단계를 남겨두고 있다. 드디어 Khaiii를 설치한다. Khaiii 설치는 다음의 단계를 따른다.

   - 빌드 툴 설치

   - Khaiii 빌드

   - Khaiii 설치

 

오늘도 가슴 설레는 오류가 기다리고 있다.

 

 

 

▲  위는 동영상

  아래는 글

 

 

sudo pip3 install cmake

 

우선 cmake 3.10. 이상의 설치가 필요합니다.

 

CMake(Cross Platform Make)는 멀티플랫폼으로 사용할 수 있는 Make의 대용품을 만들기 위한 오픈소스 프로젝트이다[1]. 여기서 make는 소프트웨어 개발을 위해 유닉스 계열 운영 체제에서 주로 사용되는 프로그램 빌드 도구이다 [2].

무슨 말인지 모르겠다. 그냥 뭔가 설치하기 위한 도구인가 보다.

 

 

 

시작하자마자 오류를 출력합니다. 그렇지... 오류 없이 그냥 지나가면 허전하지...

 

"Module Not Found Error : No module named 'skbuild' "

Command "python setup.py egg_info" failed with error code 1 in /tmp/pip-build-dpt1duvm/cmake/

 

일단 skbuild라는게 없어서 오류가 나는 것으로 보입니다.

"scikit-build / cmake-python-distributions" 라는 github에 유사한 증상에 관한 글이 있지만 이미 해결된 상태(closed)입니다.[3]

 

한참 동안 방법을 찾다가 앞서서 사용한 "apt-get"이 떠올랐습니다. 무작정 해봤습니다. 됩니다.

sudo apt-get install cmake

 

무작정 해본 거라, 소 뒷걸음질 치다 쥐 잡은 꼴입니다. 

좀 찾아보니 "pip3 install"과 "apt-get"에는 어디서부터 패키지를 받아오는지에 대한 작은 차이가 있었습니다.

 

앞서 살펴본 바와 같이 pip는 package installer for python을 의미한다. 반면 apt는 Advanced Packaging Tool을 의미합니다. pip로 설치하면 파이썬과 관련된 곳에서 파일을 다운로드 받고, apt를 사용하면 우분투와 관련된 곳에서 파일을 다운받는 것으로 확인된다.

 

위에 오류난 그림에서 보면 "Downlonding https://files.pythonhosted.org/packages/....." 으로 나타나지만, apt-get으로 실행한 화면에서는 "Get: 1 http://archive.ubuntu.com/ubuntu bionic..."로 나타난다.

 

 

git clone https://github.com/kakao/khaiii.git

깃헙에서 khaiii 관련 파일을 복사한다.

 

 

# khaiii 폴더로 이동(cd = change directory)
cd khaiii

# khaiii 폴더 아래에 build 폴더 만들기(mkdir = make directiory)
mkdir build

# build 폴더로 이동
cd build

# 프로그램에 필요한 리소스 준비(끝에 점 2개 찍어야 함) - 약 10분 정도 걸림
sudo cmake ..

# 빌드 실행 - 약 5분 걸림
sudo make all

# 리소스 빌드(large와 base중 선택, 저장용량에 문제가 없다면 large 선택)
sudo make large_resource # large
sudo make resource       # base

# khaiii 설치
sudo make install 

# python과 바인딩
sudo make package_python
cd package_python
sudo pip3 install . # 마지막에 점 하나 찍어야 함, 약 5분 걸림

 

 

드디어 khaiii 설치를 완료하였습니다.

"Successfully installed khaiii"가 반갑습니다.

 

 

이제 khaiii를 설치했으니, 다음에는 khaiii를 활용한 간단한 분석 이야기를 해볼까 합니다.

 

 

참고자료

 

[1] https://ko.wikipedia.org/wiki/CMake 

[2] https://ko.wikipedia.org/wiki/Make_(소프트웨어)

[3] https://github.com/scikit-build/cmake-python-distributions/issues/86

 

 

2020.04.12. 코리.

 

 

 

 

 

윈도우(windows)에서 카이(Khaiii) 설치하기 - 그 두 번째 이야기. 리눅스 세팅

 

 

첫 번째 이야기 보러가기 - 리눅스 설치

 

 

윈도우에 리눅스(Ubuntu)를 성공적으로 설치하였다면, 카이를 사용하기 위한 몇 가지 세팅이 필요하다.

할 일은 다음과 같다.

   - username과 password 입력

   - 전체 패키지 업데이트

   - 전체 패키지 업그레이드

   - pip 설치

 

 

 

 

 

▲  위는 동영상

  아래는 글

 

 

리눅스 아이콘에 마우스 우클릭하여 관리자 권한으로 실행한다.

그럼, CMD창이나 예전 DOS창과 같은 검은색 화면이 하나 실행된다. 처음 구동하는 경우, 시간이 1~2분 정도 걸리니 여유롭게 기다려야 한다.

 

 

준비가 되면 username을 입력하라는 메시지가 나타난다. 자기 컴퓨터에서만 사용되는 이름이니 아무것이나 입력해도 된다.

 

username을 입력하면 password를 입력하라는 메시지가 나타난다. 비밀번호는 반드시 메모를 해둬야 한다. 비밀번호를 잊어버리면 리눅스를 다시 설치해야 하는 불상사가 생긴다. 비밀번호를 타이핑해도 입력 커서가 움직이지 않는다. ***로 입력되지도 않는다. 그래도 정상적으로 입력되는 것이니 오타 내지 않도록 잘 입력한다. 비밀번호를 확인하기 위해 한 번 더 입력하는 절차가 있다.

 

 

전체 패키지를 upgrade 하고 update 하기 위해 다음의 코드를 하나씩 실행한다. 

sudo apt-get upgrade
sudo atp-get update

 

첫 번째 줄을 실행하면 비밀번호를 입력하라는 메시지가 나타난다. 위에서 입력한 비밀번호를 입력하고 엔터키를 누르면 된다. 그 이유는 리눅스의 "sudo" 명령어가 윈도우의 "관리자 권한으로 실행"과 유사한 개념으로 "Super User DO"를 의미한다. 관리자 권한으로 뭔가를 하려고 하니 관리자 비밀번호를 입력하라는 것이다.

 

upgrade와 update는 생각보다 시간이 꽤 걸린다. 둘 다 합쳐서 10분 정도 걸린 것으로 기억난다. 

 

 

 

 

다음 단계는 파이썬 패키지 인스톨러인 pip 설치를 위해 다음의 코드를 실행한다.

sudo apt-get install python3-pip

 

pip는 package installer for python을 의미한다. 파이썬으로 작성된 패키지를 다운로드, 설치, 관리하기 위한 것이다.[1] 

pip3는 python3 버전으로 설치하는 것이고, 그냥 pip는 python2 버전으로 설치하는 것이다.[2] pip 설치 중 오류가 발생하면 위에서 실시한 update를 될 때까지 계속해봐야 한다.

 

 

 

pip가 정상적으로 설치되었는지 확인하기 위해 다음의 코드를 실행한다.

pip3 --version

실행 결과 위 그림과 같이 조회되면 제대로 설치된 것이다.

 

 

 

 

파이썬을 학습하며 남기는 블로그입니다.

질문, 지적, 조언은 항상 환영합니다.

 

참고자료

[1] https://ko.wikipedia.org/wiki/Pip_(%ED%8C%A8%ED%82%A4%EC%A7%80_%EA%B4%80%EB%A6%AC%EC%9E%90), https://pip.pypa.io/en/stable/

[2] https://kaen2891.tistory.com/27

 

 

2020.04.06.

코리

 

 

 

 

 

 

Khaiii(Kakao Hangul Analyzer Ⅲ)는 카카오가 개발한 세번째 형태소 분석기이다.

 

공식자료는 깃헙에서 찾아볼 수 있다.(github.com/kakao/khaiii)

 

Khaiii는 C++14로 개발했기 때문에 이를 지원하는 컴파일러가 필요하다.

   - CentOS 7.4 : gcc-5.3.1 (devtoolset-4)

   - Ubuntu 16.04 : gcc-5.4.0

   - MacOS Mojave : LLVM-11.0.0

   - 공식적으로Window는 지원하지 않음

 

 

윈도우를 지원하지 않으므로, jupyter notebook에서 "!pip install khaiii" 라고 해도 실행되지 않는다.

 

윈도우에서 Khaiii를 설치하기 위한 첫번째 이야기는,

윈도우에 리눅스(Linux)의 일종인 우분투(ubuntu)를 설치하는 것이다.

 

 

 

 

 

▲  위는 동영상 

  아래는 글

 

 

 

 

우선 "제어판-windows 기능 켜기"에서 리눅스 기능을 켜주어야 한다.

체크되어 있지 않으면, 체크를 한다. 이 경우 컴퓨터 재시작이 필요하다.

 

 

 

MS Store에서 Linux를 검색한 후 왼쪽에 있는 ubuntu를 클릭하여 설치한다.

 

 

자, 이제 윈도우에서 카이를 설치하기 위한 첫 단계가 끝났다. 

 

다음 이야기는 방금 설치한 리눅스(ubuntu) 셋팅에 대한 이야기 이다. - 보러가기

 

 

파이썬을 학습하며 남기는 블로그입니다.

질문, 지적, 조언은 항상 환영합니다.

 

 

2020.04.06.

코리

 

 

+ Recent posts