[KoSpacing] 한글 띄어쓰기 패키지를 사용해보자

R KoSpacing installr keras conda reticulate

KoSpacing은 한글 띄어쓰기를 해주는 딥러닝 모델 패키지이다. python이 함께 필요한 패키지 기반으로 만들어서 python도 설치해야 한다. windows는 conda만 지원하므로 conda를 설치하여 사용해보자.

true
2018-05-02

업데이트

세줄요약

  1. KoSpacing은 한글 띄어쓰기를 해주는 딥러닝 모델 패키지이다.
  2. python이 함께 필요한 패키지 기반으로 만들어서 python도 설치해야 한다.
  3. windows는 conda만 지원하므로 conda를 설치하여 사용해보자.

한글 띄어쓰기 API 이용하는 포스트에서 소개했던 API가 R & Python 패키지로 탄생하였습니다. (R 패키지 바로가기, Python 패키지 바로가기) 이같은 멋진 패키지를 개발해주신 전희원님님 감사합니다.

KoSpacing 패키지는 전례가 없는 딥러닝 모델로 결과를 만드는 패키지로 본인의 포스트에서 Model as a Program 이라고 소개한바 있습니다. R에는 tensorflowkerasreticulate 패키지를 이용해서 python 패키지를 기반으로 최신 딥러닝 프레임워크를 사용할 수 있습니다. KoSpacingkeras로 작성된 모델을 사용하기 때문에, 패키지 사용을 위해서 reticulate 설치가 필요합니다. KoNLP 역시 java 기반의 라이브러리를 R에서 사용하기 위해 rJava 설치가 필요했습니다. java의 경로 설정에 비해 간편하긴 하지만 python을 또 설치해야 한다는 압박이 있을 수 있다고 생각이 들었습니다. 간편하게 R에서 사용하는 도구들의 설치를 도와주는 installr를 이용해서 miniconda를 설치해 보겠습니다.

installr

installr 패키지는 windows 환경에서 R에서 사용하는 여러 외부 프로그램들(pandoc, latex, 등등)을 콘솔 명령으로 설치해주고, R의 버전 업데이트 등을 할 수 있는 함수를 제공합니다. 완전히 Rphabetic(알파베틱)하죠. unix 계열(mac 포함)은 완전히 같은 기능을 제공하는 패키지가 없다는 점이 조금 아쉽습니다.

Rtools를 설치하지 않으셨다면 아래 두 줄을 콘솔에서 실행해주세요.

install.packages('installr')
install.Rtools()

이제 devtools를 설치하고 최신 버전의 installr를 설치하도록 하겠습니다.

if (!require('devtools')) install.packages('devtools')
devtools::install_github('talgalili/installr')

최신 버전의 installr 패키지는 install.conda() 함수를 제공합니다. 이를 이용해서 KoSpacing 환경을 설치해보겠습니다.

library(installr)
install.conda()

install.conda() 함수는 windows 환경에 miniconda의 설치 파일을 다운 받아 실행해 줍니다. 다운로드 페이지에서 자신에게 맞는 설치 파일을 다운로드 받아 실행하셔도 같은 동작을 하는 것입니다. 기본 옵션들을 유지한 채로 계속 다음을 눌러 설치를 완료해 주세요.

이제 KoSpacing을 설치해 보겠습니다.

if (!require('remotes')) install.packages('remotes')
remotes::install_github('forkonlp/KoSpacing')
# remotes::install_github('haven-jeon/KoSpacing')
library(KoSpacing)

잘 되셨나요? 저와는 조금 다른 메세지들이 보이실 수도 있습니다만, 마지막 library(KoSpacing)이 잘 수행되면 성공인 겁니다! loaded KoSpacing model! 메세지를 확인하셨나요?

이제 패키지를 사용해볼까요?

spacing("김형호영화시장분석가는'1987'의네이버영화정보네티즌10점평에서언급된단어들을지난해12월27일부터올해1월10일까지통계프로그램R과KoNLP패키지로텍스트마이닝하여분석했다.")

R에서 keras를 사용하기 위해서 python이 설치되어 있어야 합니다. windows는 conda만 사용할 수 있습니다. macOS와 linux 계열은 pip, virtualenvs도 사용할 수 있습니다. installr 패키지는 windows 설치용 패키지라는 것을 잊지 마세요.

잘못된 내용이 있거나 문제가 생기면 언제든지 알려주세요. 감사합니다.

Corrections

If you see mistakes or want to suggest changes, please create an issue on the source repository.

Reuse

Text and figures are licensed under Creative Commons Attribution CC BY-NC-ND 4.0. Source code is available at https://github.com/mrchypark/mrchypark.github.io, unless otherwise noted. The figures that have been reused from other sources don't fall under this license and can be recognized by a note in their caption: "Figure from ...".

Citation

For attribution, please cite this work as

Park (2018, May 2). mrchypark: [KoSpacing] 한글 띄어쓰기 패키지를 사용해보자. Retrieved from https://mrchypark.github.io/post/kospacing-한글-띄어쓰기-패키지를-사용해보자/

BibTeX citation

@misc{park2018[kospacing],
  author = {Park, Chanyub},
  title = {mrchypark: [KoSpacing] 한글 띄어쓰기 패키지를 사용해보자},
  url = {https://mrchypark.github.io/post/kospacing-한글-띄어쓰기-패키지를-사용해보자/},
  year = {2018}
}