Skip to contents

theeuh

Lifecycle: stable R-CMD-check CRAN status runiverse-name runiverse-package metacran downloads Downloads Codecov test coverage

{theeuh(띄어)} 패키지는 한글 띄어쓰기를 교정하는 기능을 제공합니다.

설치

pythononnxruntime 패키지를 사용하므로 설치 지침을 꼭 읽고 사용해주세요. 설치는 3단계로 진행합니다.

1. 패키지 설치

# CRAN 아직 안됩니다!
install.packages("theeuh")

# 개발버전 설치 r-universe
install.packages('theeuh', repos = "https://mrchypark.r-universe.dev")

2. 파이선 의존성 설치

theeuh 패키지는 onnxruntime이라는 파이썬 패키지를 사용합니다. 그래서 이 둘을 먼저 설치하고 R에서 사용할 수 있도록 연결해야 합니다.

파이썬 설치나 R과의 연결에 대해 잘 알지 못하실 수 있습니다. 그렇다면 새롭게 miniconda를 설치하는 것을 권장합니다.

2-1. miniconda 설치

reticulate::install_miniconda()

miniconda 가 설치되고 나면 reticulate 패키지는 r-reticulate라는 conda 환경을 기본값으로 생성합니다.

2-2. onnxruntime package

theeuh 패키지는 onnxruntime 파이썬 패키지 설치를 위해 install_onnxruntime() 함수를 제공합니다. install_onnxruntime() 함수는 활성화된 가상환경에 onnxruntime 패키지를 설치합니다. 가상환경에 대해 잘 모르신다면 새로운 가상환경 이름(예>r-theeuh``)을 사용하기를 추천합니다. 기존에 없는envname`을 추가하면 새 가상환경을 생성하여 설치합니다.

library("theeuh")
install_onnxruntime(envname = "r-theeuh")
#> Using Python: /usr/local/Cellar/python@3.10/3.10.6_1/Frameworks/Python.framework/Versions/3.10/bin/python3.10
#> Creating virtual environment 'r-theeuh' ...
#> + '/usr/local/Cellar/python@3.10/3.10.6_1/Frameworks/Python.framework/Versions/3.10/bin/python3.10' -m venv '/Users/runner/.virtualenvs/r-theeuh'
#> Done!
#> Installing packages: 'pip', 'wheel', 'setuptools', 'numpy'
#> + '/Users/runner/.virtualenvs/r-theeuh/bin/python' -m pip install --upgrade --no-user 'pip' 'wheel' 'setuptools' 'numpy'
#> Virtual environment 'r-theeuh' successfully created.
#> Using virtual environment 'r-theeuh' ...
#> + '/Users/runner/.virtualenvs/r-theeuh/bin/python' -m pip install --upgrade --no-user --ignore-installed 'onnxruntime==1.12.0'
#> 
#> Installation complete.

install_onnxruntime() 함수의 헬프 페이지에서 더 많은 정보를 확인하세요.

사용법

library("theeuh")
space("김형호영화시장분석가는'1987'의네이버영화정보네티즌10점평에서언급된단어들을지난해12월27일부터올해1월10일까지통계프로그램R을이용하여텍스트마이닝하여분석했다.")
#> [1] "김형호 영화시장 분석가는 '1987'의 네이버 영화 정보 네티즌 10점 평에서 언급된 단어들을 지난해 12월 27일부터 올해 1월 10일까지 통계 프로그램 R을 이용하여 텍스트마이닝하여 분석했다."

특별 감사

원본 패키지는 전희원님이 만드신 KoSpacing입니다. 많은 부분의 코드와 모델파일들은 원본 패키지에 있는 것을 사용했습니다.