윈도우(windows)에서 카이(Khaiii) 설치하기 - 그 네 번째 이야기. Khaiii 빌드와 설치

 

 

첫 번째 이야기 보러가기 - 리눅스 설치

두 번째 이야기 보러가기 - 리눅스 세팅

세 번째 이야기 보러가기 - 필요한 패키지 설치와 jupyter notebook 실행

 

 

리눅스에서 jupyter notebook까지 실행했다면, 이제 마지막 단계를 남겨두고 있다. 드디어 Khaiii를 설치한다. Khaiii 설치는 다음의 단계를 따른다.

   - 빌드 툴 설치

   - Khaiii 빌드

   - Khaiii 설치

 

오늘도 가슴 설레는 오류가 기다리고 있다.

 

 

 

▲  위는 동영상

  아래는 글

 

 

sudo pip3 install cmake

 

우선 cmake 3.10. 이상의 설치가 필요합니다.

 

CMake(Cross Platform Make)는 멀티플랫폼으로 사용할 수 있는 Make의 대용품을 만들기 위한 오픈소스 프로젝트이다[1]. 여기서 make는 소프트웨어 개발을 위해 유닉스 계열 운영 체제에서 주로 사용되는 프로그램 빌드 도구이다 [2].

무슨 말인지 모르겠다. 그냥 뭔가 설치하기 위한 도구인가 보다.

 

 

 

시작하자마자 오류를 출력합니다. 그렇지... 오류 없이 그냥 지나가면 허전하지...

 

"Module Not Found Error : No module named 'skbuild' "

Command "python setup.py egg_info" failed with error code 1 in /tmp/pip-build-dpt1duvm/cmake/

 

일단 skbuild라는게 없어서 오류가 나는 것으로 보입니다.

"scikit-build / cmake-python-distributions" 라는 github에 유사한 증상에 관한 글이 있지만 이미 해결된 상태(closed)입니다.[3]

 

한참 동안 방법을 찾다가 앞서서 사용한 "apt-get"이 떠올랐습니다. 무작정 해봤습니다. 됩니다.

sudo apt-get install cmake

 

무작정 해본 거라, 소 뒷걸음질 치다 쥐 잡은 꼴입니다. 

좀 찾아보니 "pip3 install"과 "apt-get"에는 어디서부터 패키지를 받아오는지에 대한 작은 차이가 있었습니다.

 

앞서 살펴본 바와 같이 pip는 package installer for python을 의미한다. 반면 apt는 Advanced Packaging Tool을 의미합니다. pip로 설치하면 파이썬과 관련된 곳에서 파일을 다운로드 받고, apt를 사용하면 우분투와 관련된 곳에서 파일을 다운받는 것으로 확인된다.

 

위에 오류난 그림에서 보면 "Downlonding https://files.pythonhosted.org/packages/....." 으로 나타나지만, apt-get으로 실행한 화면에서는 "Get: 1 http://archive.ubuntu.com/ubuntu bionic..."로 나타난다.

 

 

git clone https://github.com/kakao/khaiii.git

깃헙에서 khaiii 관련 파일을 복사한다.

 

 

# khaiii 폴더로 이동(cd = change directory)
cd khaiii

# khaiii 폴더 아래에 build 폴더 만들기(mkdir = make directiory)
mkdir build

# build 폴더로 이동
cd build

# 프로그램에 필요한 리소스 준비(끝에 점 2개 찍어야 함) - 약 10분 정도 걸림
sudo cmake ..

# 빌드 실행 - 약 5분 걸림
sudo make all

# 리소스 빌드(large와 base중 선택, 저장용량에 문제가 없다면 large 선택)
sudo make large_resource # large
sudo make resource       # base

# khaiii 설치
sudo make install 

# python과 바인딩
sudo make package_python
cd package_python
sudo pip3 install . # 마지막에 점 하나 찍어야 함, 약 5분 걸림

 

 

드디어 khaiii 설치를 완료하였습니다.

"Successfully installed khaiii"가 반갑습니다.

 

 

이제 khaiii를 설치했으니, 다음에는 khaiii를 활용한 간단한 분석 이야기를 해볼까 합니다.

 

 

참고자료

 

[1] https://ko.wikipedia.org/wiki/CMake 

[2] https://ko.wikipedia.org/wiki/Make_(소프트웨어)

[3] https://github.com/scikit-build/cmake-python-distributions/issues/86

 

 

2020.04.12. 코리.

 

 

 

 

윈도우(windows)에서 카이(Khaiii) 설치하기 - 그 세 번째 이야기. 필요한 패키지 설치와 jupyter notebook 실행

 

 

첫 번째 이야기 보러가기 - 리눅스 설치

두 번째 이야기 보러가기 - 리눅스 세팅

 

 

 

윈도우에 리눅스(Ubuntu)를 성공적으로 설치하고 기본적인 세팅을 완료하였으니, Khaiii 설치를 위한 기본 패키지를 설치해야 한다.

   - jupyter, numpy, pandas 설치하기 

 

 

 

 

▲  위는 동영상

  아래는 글

 

 

sudo pip3 install jupyter numpy pandas

 

위의 명령어로 jupyter, numpy, pandas를 설치합니다. 설치하는데 시간이 조금 걸립니다. (한 5분 정도)

 

이제 낯선 리눅스와 이별하기 위해 jupyter notebook을 입력하고 실행합니다.

오류 없이 실행되면 허전합니다.

 

 

 

jupyter notebook을 입력하고 실행하면 위 사진의 윗부분과 같은 결과가 나타나야 정상인데, 화면이 깜빡이면서 아래 빨간색 글자가 0.1초 나타났다가 완전히 먹통(검은색 화면으로 바뀌어버리는) 오류가 나타납니다. 오류는 항상 설레죠.

 

먹통인 화면에서 탈출하는 방법은 "ctrl+c"를 눌러 중지시킨 후, "shutdown this notebook server?" 라는 질문에 "y"로 응답해주면 됩니다.

 

빨간색 오류는....

categoryinfo : invalid operation [start-process], invalid operation exception

fully qualified error id : Invalid Operation Exception.Microsoft.PowerShell.Commands.StartProcessCommand

 

뭔가 잘못된다고 합니다. 원인을 찾아 헤매다가 근본 원인을 파악하여 해결하지는 못했지만, jupyter notebook을 실행하기 위한 방법은 찾았습니다.

 

jupyter notebook --no-browser

브라우저 없이 주피터 노트북을 실행하도록 하면, 위에서 경험한 오류 없이 원하던 정보가 나타납니다. 아마도 위에서 경험한 오류는 주피터 노트북을 실행하는 과정에서 브라우저와 뭔가 연결이 잘 안돼서 나타나는 현상이라 추정됩니다.

 

 

 

원하던 정보가 정상적으로 출력되었습니다.

가장 아래 출력된 두 줄은 jupyter notebook을 실행할 수 있는 내부 주소입니다. 두 줄 중 한 줄을 마우스로 긁어서 복사(ctrl+c)합니다.

 

윈도우에서 브라우저(크롬 등)를 실행해서 주소창에 복사한 내용을 붙여놓고 엔터키를 눌러주면 드디어 jupyter notebook이 실행됩니다.

 

 

 

반가운 김에 hello world를 출력해 봅니다.

 

 

 

이제 Khaiii를 사용하기 위한 기본 준비를 마쳤습니다.

다음은 본격적인 khaiii 설치에 대한 내용을 포스팅할 예정입니다.

 

다음 이야기 보러가기 :

2020/04/12 - [Bigdata_tips] - [python] 윈도우에서 카이(Khaiii) 설치하기_04.Khaiii 빌드와 설치

 

 

파이썬을 학습하며 남기는 블로그입니다.

질문, 지적, 조언은 항상 환영합니다.

 

 

2020.04.08. 코리.

 

 

 

 

 

Khaiii(Kakao Hangul Analyzer Ⅲ)는 카카오가 개발한 세번째 형태소 분석기이다.

 

공식자료는 깃헙에서 찾아볼 수 있다.(github.com/kakao/khaiii)

 

Khaiii는 C++14로 개발했기 때문에 이를 지원하는 컴파일러가 필요하다.

   - CentOS 7.4 : gcc-5.3.1 (devtoolset-4)

   - Ubuntu 16.04 : gcc-5.4.0

   - MacOS Mojave : LLVM-11.0.0

   - 공식적으로Window는 지원하지 않음

 

 

윈도우를 지원하지 않으므로, jupyter notebook에서 "!pip install khaiii" 라고 해도 실행되지 않는다.

 

윈도우에서 Khaiii를 설치하기 위한 첫번째 이야기는,

윈도우에 리눅스(Linux)의 일종인 우분투(ubuntu)를 설치하는 것이다.

 

 

 

 

 

▲  위는 동영상 

  아래는 글

 

 

 

 

우선 "제어판-windows 기능 켜기"에서 리눅스 기능을 켜주어야 한다.

체크되어 있지 않으면, 체크를 한다. 이 경우 컴퓨터 재시작이 필요하다.

 

 

 

MS Store에서 Linux를 검색한 후 왼쪽에 있는 ubuntu를 클릭하여 설치한다.

 

 

자, 이제 윈도우에서 카이를 설치하기 위한 첫 단계가 끝났다. 

 

다음 이야기는 방금 설치한 리눅스(ubuntu) 셋팅에 대한 이야기 이다. - 보러가기

 

 

파이썬을 학습하며 남기는 블로그입니다.

질문, 지적, 조언은 항상 환영합니다.

 

 

2020.04.06.

코리

 

 

+ Recent posts