KoNLP 설치 방법

KoNLP install install.packages R-universe

install.packages(“KoNLP”, repos = “https://forkonlp.r-universe.dev”, INSTALL_opts = c(“–no-multiarch”) )

true
2021-06-01

KoNLP는 한국어 형태소 분석 R 패키지입니다. KoNLP 패키지는 java로 제작된 한나눔 형태소 분석기를 사용합니다. java를 사용하기 때문에 크게 2가지 단계로 패키지 설치를 진행합니다. jdk란 자바 개발 킷의 줄임 표현으로 자바 언어를 사용하기 위해 설치하는 프로그램입니다.

  1. jdk 설치
  2. KoNLP 패키지 설치

jdk의 설치는 원래 어려웠습니다. KoNLP 패키지가 2020년 2월 1일부로 cran에서 내려가서 설치가 어려워졌습니다. 두 단계 모두 접근하기 좋은 방법을 소개합니다.

1. jdk 설치

jdk 설치는 확인과 설치 단계로 진행합니다.

1.1 jdk 설치 확인

기존에 잘 동작하는 jdk가 설치되어 있는지 확인합니다. 확인은 rJava 패키지의 초기화 함수를 사용합니다. rJava 패키지는 R에서 자바 프로그램을 사용하기 위한 패키지입니다.

install.packages("rJava")

초기화 함수로 설치되어 있는지 확인합니다.

rJava::.jinit()
[1] 0

0 이라는 출력이 없을 수도 있습니다. 위 함수를 실행하고 에러가 없다면, jdk가 잘 설치되어 있는 것입니다. 그러니 jdk 설치 단계를 건너서 2. KoNLP 설치 단계로 가세요.

1.2 jdk 설치하기

jdk를 설치하기 위해 multilinguer 패키지를 사용합니다. jdk는 다운로드하고, 설치하고, 실행 경로를 등록하는 과정으로 설치합니다. multilinguer 패키지는 jdk를 설치하는 복잡한 과정을 대신해줍니다.

install.packages("multilinguer")
multilinguer::install_jdk()

multilinguer::install_jdk() 을 실행하면 R 새션을 재시작합니다.

jdk 설치 확인을 한번 더 해보고, 동작하면 아래 KoNLP 설치 과정으로 넘어갑니다.

2. KoNLP 설치

아래 코드로 KoNLP 패키지를 설치하세요.

install.packages("KoNLP", 
    repos = "https://forkonlp.r-universe.dev",
        dependencies = TRUE,
    INSTALL_opts = c("--no-multiarch")
  )

이제 사용해서 잘 동작하는지 확인하겠습니다.

library("KoNLP")
SimplePos09("안녕하신가요?")

설명

현재 KoNLP 패키지는 CRAN에서 내려가 있는 상태입니다. 그래서 다른 패키지 저장소인 r-universe.dev에 빌드에서 업로드를 해둔 상태입니다. r-universe.dev는 사설 패키지 저장소라고 보시면 될 것 같습니다.

그래서 install.packages() 명령에 추가 저장소 주소를 더하는 줄을 추가하였습니다. 다른 패키지들은 기본 CRAN을 사용하므로 함께 작성하였습니다. 패키지 설치시 32비트와 64비트를 모두 설치하는 것이 기본 동작인 듯합니다. 현재 java 64bit 만 설치되어 있으므로 기본 64bit 패키지만 설치하라는 옵션을 추가했습니다.

전체 코드

설치만 진행하는 전체 코드를 정리합니다. 꼭 한 줄 씩 실행해주세요.

install.packages("multilinguer")
multilinguer::install_jdk()
install.packages("KoNLP", 
    repos = "https://forkonlp.r-universe.dev",
    INSTALL_opts = c("--no-multiarch")
  )

조심해야 할 점

multilinguer 패키지의 install_jdk() 함수는 기존에 jdk가 설치되어 있는지 등을 확인하지 않습니다. 환경 변수를 건드리는 동작이 있기 때문에 기존에 설치된 부분이 꼬여서 동작하지 않을 수 있습니다. 혹시 문제가 발생하면 패키지 이슈에 알려주세요.

Corrections

If you see mistakes or want to suggest changes, please create an issue on the source repository.

Reuse

Text and figures are licensed under Creative Commons Attribution CC BY-NC-ND 4.0. Source code is available at https://github.com/mrchypark/mrchypark.github.io, unless otherwise noted. The figures that have been reused from other sources don't fall under this license and can be recognized by a note in their caption: "Figure from ...".

Citation

For attribution, please cite this work as

Park (2021, June 1). mrchypark: KoNLP 설치 방법. Retrieved from https://mrchypark.github.io/post/KoNLP-설치-방법/

BibTeX citation

@misc{park2021konlp,
  author = {Park, Chanyub},
  title = {mrchypark: KoNLP 설치 방법},
  url = {https://mrchypark.github.io/post/KoNLP-설치-방법/},
  year = {2021}
}