Source:
vignettes/articles/README_kr.Rmd
README_kr.Rmd
elbird
elbird 패키지는 cpp
기반의 Kiwi 를 wrapping한 형태소 분석기 패키지입니다. 다른 분석기에 비해 빠른 성능과 쉬운 사용자 사전 추가, 미등록 명사 추출 등의 편의 기능이 있습니다.
설치
elbird는 아래 명령어로 설치할 수 있습니다.
# CRAN
install.packages("elbird")
# Dev version
install.packages("elbird", repos = 'https://mrchypark.r-universe.dev')
사용예
아래 예시들은 elbird의 함수의 동작을 소개합니다.
tokenize 함수
기본적으로 tibble 자료형으로 출력하는 tokenize()
, tidytext와의 호환을 지원하는 tokenize_tidy()
함수를 제공합니다.
library(elbird)
tokenize("안녕하세요 kiwi 형태소 분석기의 R wrapper인 elbird를 소개합니다.")
#> # A tibble: 9 × 5
#> sent form tag start len
#> <chr> <chr> <chr> <int> <int>
#> 1 1 안녕하세요 NNP 1 5
#> 2 1 kiwi SL 7 4
#> 3 1 형태소 NNG 12 3
#> 4 1 분석기 NNG 16 3
#> 5 1 R SL 21 1
#> 6 1 wrapper SL 23 7
#> 7 1 elbird SL 32 6
#> 8 1 소개 NNG 40 2
#> 9 1 ᆸ니다 EF 42 3
tokenize_tidy("안녕하세요 kiwi 형태소 분석기의 R wrapper인 elbird를 소개합니다.")
#> [[1]]
#> [1] "안녕하세요/NNP" "kiwi/SL" "형태소/NNG" "분석기/NNG"
#> [5] "R/SL" "wrapper/SL" "elbird/SL" "소개/NNG"
#> [9] "ᆸ니다/EF"
여러 문장의 경우 vector
나 list
로 입력받아서 list
로 출력합니다.
tokenize(c("새롭게 작성된 패키지 입니다.", "tidytext와의 호환을 염두하고 작성하였습니다."))
#> # A tibble: 9 × 5
#> sent form tag start len
#> <chr> <chr> <chr> <int> <int>
#> 1 1 새롭 VA 1 2
#> 2 1 작성 NNG 5 2
#> 3 1 패키지 NNG 9 3
#> 4 1 ᆸ니다 EF 13 3
#> 5 2 tidytext SL 1 8
#> 6 2 호환 NNG 12 2
#> 7 2 염두 NNG 16 2
#> 8 2 작성 NNG 21 2
#> 9 2 습니다 EF 25 3
tokenize_tidy(c("새롭게 작성된 패키지 입니다.", "tidytext와의 호환을 염두하고 작성하였습니다."))
#> [[1]]
#> [1] "새롭/VA" "작성/NNG" "패키지/NNG" "ᆸ니다/EF"
#>
#> [[2]]
#> [1] "tidytext/SL" "호환/NNG" "염두/NNG" "작성/NNG" "습니다/EF"
With tidytext
tokenize_tidy()
함수는 tokenize_tt()
, tokenize_tidytext()
로도 사용할 수 있습니다. 아래는 tidytext 패키지와 함께 사용하는 예시 입니다. 아래 tar
는 형태소 분석을 위한 타겟 텍스트입니다.
# 텍스트 데이터는 presidentSpeech 패키지를 사용했습니다.
# install.packages("presidentSpeech", repos = "https://forkonlp.r-universe.dev/")
library(vroom)
tar <- vroom("exam.txt")
#> Rows: 62 Columns: 2
#> ── Column specification ────────────────────────────────────────────────────────
#> Delimiter: "\t"
#> chr (1): content
#> dbl (1): paragraph
#>
#> ℹ Use `spec()` to retrieve the full column specification for this data.
#> ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
tar
#> # A tibble: 62 × 2
#> paragraph content
#> <dbl> <chr>
#> 1 1 존경하는 국민 여러분!
#> 2 2 700만 해외동포 여러분!
#> 3 3 이 자리에 참석하신 노무현ㆍ김대중ㆍ김영삼ㆍ전두환 전 대통령, 그리…
#> 4 4 저는 오늘 국민 여러분의 부름을 받고 대한민국의 제17대 대통령에 취…
#> 5 5 저는 이 자리에서 국민 여러분께 약속드립니다. 국민을 섬겨 나라를 편…
#> 6 6 올해로 대한민국 건국 60주년을 맞이합니다. 우리는 잃었던 땅을 되찾…
#> 7 7 지구 상에서 가장 가난했던 나라가 세계 10위권의 경제 대국이 되었습…
#> 8 8 그러나 우리는 알고 있습니다. 그것은 기적이 아니라 우리가 다 함께 …
#> 9 9 독립을 위해 목숨을 바친 선열들, 전선에서 산화한 장병들, 뙤약볕과 …
#> 10 10 장롱 속 금붙이를 들고나와 외환위기에 맞섰던 시민들, 겨울 바닷가에…
#> # … with 52 more rows
#> # ℹ Use `print(n = ...)` to see more rows
tar
를 tidytext 패키지의 함수인 unnest_tokens()
로 elbird의 tokenize_tidy()
를 tokenizer로 사용하는 예시입니다.
library(tidytext)
unnest_tokens(
tar,
input = content,
output = word,
token = tokenize_tidy
)
#> # A tibble: 2,117 × 2
#> paragraph word
#> <dbl> <chr>
#> 1 1 존경/nng
#> 2 1 국민/nng
#> 3 1 여러분/np
#> 4 2 700/sn
#> 5 2 해외/nng
#> 6 2 동포/nng
#> 7 2 여러분/np
#> 8 3 자리/nng
#> 9 3 참석/nng
#> 10 3 시/ep
#> # … with 2,107 more rows
#> # ℹ Use `print(n = ...)` to see more rows
analyze 함수
추가로 여러 분석 후보와 분석결과의 점수를 함께 제공하는 analyze()
함수를 제공합니다.
library(elbird)
analyze("안녕하세요 kiwi 형태소 분석기의 R wrapper인 elbird를 소개합니다.")
#> [[1]]
#> [[1]]$Token
#> [[1]]$Token[[1]]
#> [[1]]$Token[[1]]$form
#> [1] "안녕하세요"
#>
#> [[1]]$Token[[1]]$tag
#> [1] "NNP"
#>
#> [[1]]$Token[[1]]$start
#> [1] 1
#>
#> [[1]]$Token[[1]]$len
#> [1] 5
#>
#>
#> [[1]]$Token[[2]]
#> [[1]]$Token[[2]]$form
#> [1] "kiwi"
#>
#> [[1]]$Token[[2]]$tag
#> [1] "SL"
#>
#> [[1]]$Token[[2]]$start
#> [1] 7
#>
#> [[1]]$Token[[2]]$len
#> [1] 4
#>
#>
#> [[1]]$Token[[3]]
#> [[1]]$Token[[3]]$form
#> [1] "형태소"
#>
#> [[1]]$Token[[3]]$tag
#> [1] "NNG"
#>
#> [[1]]$Token[[3]]$start
#> [1] 12
#>
#> [[1]]$Token[[3]]$len
#> [1] 3
#>
#>
#> [[1]]$Token[[4]]
#> [[1]]$Token[[4]]$form
#> [1] "분석기"
#>
#> [[1]]$Token[[4]]$tag
#> [1] "NNG"
#>
#> [[1]]$Token[[4]]$start
#> [1] 16
#>
#> [[1]]$Token[[4]]$len
#> [1] 3
#>
#>
#> [[1]]$Token[[5]]
#> [[1]]$Token[[5]]$form
#> [1] "의"
#>
#> [[1]]$Token[[5]]$tag
#> [1] "JKG"
#>
#> [[1]]$Token[[5]]$start
#> [1] 19
#>
#> [[1]]$Token[[5]]$len
#> [1] 1
#>
#>
#> [[1]]$Token[[6]]
#> [[1]]$Token[[6]]$form
#> [1] "R"
#>
#> [[1]]$Token[[6]]$tag
#> [1] "SL"
#>
#> [[1]]$Token[[6]]$start
#> [1] 21
#>
#> [[1]]$Token[[6]]$len
#> [1] 1
#>
#>
#> [[1]]$Token[[7]]
#> [[1]]$Token[[7]]$form
#> [1] "wrapper"
#>
#> [[1]]$Token[[7]]$tag
#> [1] "SL"
#>
#> [[1]]$Token[[7]]$start
#> [1] 23
#>
#> [[1]]$Token[[7]]$len
#> [1] 7
#>
#>
#> [[1]]$Token[[8]]
#> [[1]]$Token[[8]]$form
#> [1] "이"
#>
#> [[1]]$Token[[8]]$tag
#> [1] "VCP"
#>
#> [[1]]$Token[[8]]$start
#> [1] 30
#>
#> [[1]]$Token[[8]]$len
#> [1] 1
#>
#>
#> [[1]]$Token[[9]]
#> [[1]]$Token[[9]]$form
#> [1] "ᆫ"
#>
#> [[1]]$Token[[9]]$tag
#> [1] "ETM"
#>
#> [[1]]$Token[[9]]$start
#> [1] 30
#>
#> [[1]]$Token[[9]]$len
#> [1] 1
#>
#>
#> [[1]]$Token[[10]]
#> [[1]]$Token[[10]]$form
#> [1] "elbird"
#>
#> [[1]]$Token[[10]]$tag
#> [1] "SL"
#>
#> [[1]]$Token[[10]]$start
#> [1] 32
#>
#> [[1]]$Token[[10]]$len
#> [1] 6
#>
#>
#> [[1]]$Token[[11]]
#> [[1]]$Token[[11]]$form
#> [1] "를"
#>
#> [[1]]$Token[[11]]$tag
#> [1] "JKO"
#>
#> [[1]]$Token[[11]]$start
#> [1] 38
#>
#> [[1]]$Token[[11]]$len
#> [1] 1
#>
#>
#> [[1]]$Token[[12]]
#> [[1]]$Token[[12]]$form
#> [1] "소개"
#>
#> [[1]]$Token[[12]]$tag
#> [1] "NNG"
#>
#> [[1]]$Token[[12]]$start
#> [1] 40
#>
#> [[1]]$Token[[12]]$len
#> [1] 2
#>
#>
#> [[1]]$Token[[13]]
#> [[1]]$Token[[13]]$form
#> [1] "하"
#>
#> [[1]]$Token[[13]]$tag
#> [1] "XSV"
#>
#> [[1]]$Token[[13]]$start
#> [1] 42
#>
#> [[1]]$Token[[13]]$len
#> [1] 1
#>
#>
#> [[1]]$Token[[14]]
#> [[1]]$Token[[14]]$form
#> [1] "ᆸ니다"
#>
#> [[1]]$Token[[14]]$tag
#> [1] "EF"
#>
#> [[1]]$Token[[14]]$start
#> [1] 42
#>
#> [[1]]$Token[[14]]$len
#> [1] 3
#>
#>
#> [[1]]$Token[[15]]
#> [[1]]$Token[[15]]$form
#> [1] "."
#>
#> [[1]]$Token[[15]]$tag
#> [1] "SF"
#>
#> [[1]]$Token[[15]]$start
#> [1] 45
#>
#> [[1]]$Token[[15]]$len
#> [1] 1
#>
#>
#>
#> [[1]]$Score
#> [1] -91.58401
#>
#>
#> [[2]]
#> [[2]]$Token
#> [[2]]$Token[[1]]
#> [[2]]$Token[[1]]$form
#> [1] "안녕"
#>
#> [[2]]$Token[[1]]$tag
#> [1] "NNG"
#>
#> [[2]]$Token[[1]]$start
#> [1] 1
#>
#> [[2]]$Token[[1]]$len
#> [1] 2
#>
#>
#> [[2]]$Token[[2]]
#> [[2]]$Token[[2]]$form
#> [1] "하"
#>
#> [[2]]$Token[[2]]$tag
#> [1] "XSA"
#>
#> [[2]]$Token[[2]]$start
#> [1] 3
#>
#> [[2]]$Token[[2]]$len
#> [1] 1
#>
#>
#> [[2]]$Token[[3]]
#> [[2]]$Token[[3]]$form
#> [1] "시"
#>
#> [[2]]$Token[[3]]$tag
#> [1] "EP"
#>
#> [[2]]$Token[[3]]$start
#> [1] 4
#>
#> [[2]]$Token[[3]]$len
#> [1] 1
#>
#>
#> [[2]]$Token[[4]]
#> [[2]]$Token[[4]]$form
#> [1] "어요"
#>
#> [[2]]$Token[[4]]$tag
#> [1] "EF"
#>
#> [[2]]$Token[[4]]$start
#> [1] 4
#>
#> [[2]]$Token[[4]]$len
#> [1] 2
#>
#>
#> [[2]]$Token[[5]]
#> [[2]]$Token[[5]]$form
#> [1] "kiwi"
#>
#> [[2]]$Token[[5]]$tag
#> [1] "SL"
#>
#> [[2]]$Token[[5]]$start
#> [1] 7
#>
#> [[2]]$Token[[5]]$len
#> [1] 4
#>
#>
#> [[2]]$Token[[6]]
#> [[2]]$Token[[6]]$form
#> [1] "형태소"
#>
#> [[2]]$Token[[6]]$tag
#> [1] "NNG"
#>
#> [[2]]$Token[[6]]$start
#> [1] 12
#>
#> [[2]]$Token[[6]]$len
#> [1] 3
#>
#>
#> [[2]]$Token[[7]]
#> [[2]]$Token[[7]]$form
#> [1] "분석기"
#>
#> [[2]]$Token[[7]]$tag
#> [1] "NNG"
#>
#> [[2]]$Token[[7]]$start
#> [1] 16
#>
#> [[2]]$Token[[7]]$len
#> [1] 3
#>
#>
#> [[2]]$Token[[8]]
#> [[2]]$Token[[8]]$form
#> [1] "의"
#>
#> [[2]]$Token[[8]]$tag
#> [1] "JKG"
#>
#> [[2]]$Token[[8]]$start
#> [1] 19
#>
#> [[2]]$Token[[8]]$len
#> [1] 1
#>
#>
#> [[2]]$Token[[9]]
#> [[2]]$Token[[9]]$form
#> [1] "R"
#>
#> [[2]]$Token[[9]]$tag
#> [1] "SL"
#>
#> [[2]]$Token[[9]]$start
#> [1] 21
#>
#> [[2]]$Token[[9]]$len
#> [1] 1
#>
#>
#> [[2]]$Token[[10]]
#> [[2]]$Token[[10]]$form
#> [1] "wrapper"
#>
#> [[2]]$Token[[10]]$tag
#> [1] "SL"
#>
#> [[2]]$Token[[10]]$start
#> [1] 23
#>
#> [[2]]$Token[[10]]$len
#> [1] 7
#>
#>
#> [[2]]$Token[[11]]
#> [[2]]$Token[[11]]$form
#> [1] "이"
#>
#> [[2]]$Token[[11]]$tag
#> [1] "VCP"
#>
#> [[2]]$Token[[11]]$start
#> [1] 30
#>
#> [[2]]$Token[[11]]$len
#> [1] 1
#>
#>
#> [[2]]$Token[[12]]
#> [[2]]$Token[[12]]$form
#> [1] "ᆫ"
#>
#> [[2]]$Token[[12]]$tag
#> [1] "ETM"
#>
#> [[2]]$Token[[12]]$start
#> [1] 30
#>
#> [[2]]$Token[[12]]$len
#> [1] 1
#>
#>
#> [[2]]$Token[[13]]
#> [[2]]$Token[[13]]$form
#> [1] "elbird"
#>
#> [[2]]$Token[[13]]$tag
#> [1] "SL"
#>
#> [[2]]$Token[[13]]$start
#> [1] 32
#>
#> [[2]]$Token[[13]]$len
#> [1] 6
#>
#>
#> [[2]]$Token[[14]]
#> [[2]]$Token[[14]]$form
#> [1] "를"
#>
#> [[2]]$Token[[14]]$tag
#> [1] "JKO"
#>
#> [[2]]$Token[[14]]$start
#> [1] 38
#>
#> [[2]]$Token[[14]]$len
#> [1] 1
#>
#>
#> [[2]]$Token[[15]]
#> [[2]]$Token[[15]]$form
#> [1] "소개"
#>
#> [[2]]$Token[[15]]$tag
#> [1] "NNG"
#>
#> [[2]]$Token[[15]]$start
#> [1] 40
#>
#> [[2]]$Token[[15]]$len
#> [1] 2
#>
#>
#> [[2]]$Token[[16]]
#> [[2]]$Token[[16]]$form
#> [1] "하"
#>
#> [[2]]$Token[[16]]$tag
#> [1] "XSV"
#>
#> [[2]]$Token[[16]]$start
#> [1] 42
#>
#> [[2]]$Token[[16]]$len
#> [1] 1
#>
#>
#> [[2]]$Token[[17]]
#> [[2]]$Token[[17]]$form
#> [1] "ᆸ니다"
#>
#> [[2]]$Token[[17]]$tag
#> [1] "EF"
#>
#> [[2]]$Token[[17]]$start
#> [1] 42
#>
#> [[2]]$Token[[17]]$len
#> [1] 3
#>
#>
#> [[2]]$Token[[18]]
#> [[2]]$Token[[18]]$form
#> [1] "."
#>
#> [[2]]$Token[[18]]$tag
#> [1] "SF"
#>
#> [[2]]$Token[[18]]$start
#> [1] 45
#>
#> [[2]]$Token[[18]]$len
#> [1] 1
#>
#>
#>
#> [[2]]$Score
#> [1] -95.38721
#>
#>
#> [[3]]
#> [[3]]$Token
#> [[3]]$Token[[1]]
#> [[3]]$Token[[1]]$form
#> [1] "안녕"
#>
#> [[3]]$Token[[1]]$tag
#> [1] "NNG"
#>
#> [[3]]$Token[[1]]$start
#> [1] 1
#>
#> [[3]]$Token[[1]]$len
#> [1] 2
#>
#>
#> [[3]]$Token[[2]]
#> [[3]]$Token[[2]]$form
#> [1] "하"
#>
#> [[3]]$Token[[2]]$tag
#> [1] "XSA"
#>
#> [[3]]$Token[[2]]$start
#> [1] 3
#>
#> [[3]]$Token[[2]]$len
#> [1] 1
#>
#>
#> [[3]]$Token[[3]]
#> [[3]]$Token[[3]]$form
#> [1] "시"
#>
#> [[3]]$Token[[3]]$tag
#> [1] "EP"
#>
#> [[3]]$Token[[3]]$start
#> [1] 4
#>
#> [[3]]$Token[[3]]$len
#> [1] 1
#>
#>
#> [[3]]$Token[[4]]
#> [[3]]$Token[[4]]$form
#> [1] "어요"
#>
#> [[3]]$Token[[4]]$tag
#> [1] "EF"
#>
#> [[3]]$Token[[4]]$start
#> [1] 4
#>
#> [[3]]$Token[[4]]$len
#> [1] 2
#>
#>
#> [[3]]$Token[[5]]
#> [[3]]$Token[[5]]$form
#> [1] "kiwi"
#>
#> [[3]]$Token[[5]]$tag
#> [1] "SL"
#>
#> [[3]]$Token[[5]]$start
#> [1] 7
#>
#> [[3]]$Token[[5]]$len
#> [1] 4
#>
#>
#> [[3]]$Token[[6]]
#> [[3]]$Token[[6]]$form
#> [1] "형태소"
#>
#> [[3]]$Token[[6]]$tag
#> [1] "NNG"
#>
#> [[3]]$Token[[6]]$start
#> [1] 12
#>
#> [[3]]$Token[[6]]$len
#> [1] 3
#>
#>
#> [[3]]$Token[[7]]
#> [[3]]$Token[[7]]$form
#> [1] "분석기"
#>
#> [[3]]$Token[[7]]$tag
#> [1] "NNG"
#>
#> [[3]]$Token[[7]]$start
#> [1] 16
#>
#> [[3]]$Token[[7]]$len
#> [1] 3
#>
#>
#> [[3]]$Token[[8]]
#> [[3]]$Token[[8]]$form
#> [1] "의"
#>
#> [[3]]$Token[[8]]$tag
#> [1] "JKG"
#>
#> [[3]]$Token[[8]]$start
#> [1] 19
#>
#> [[3]]$Token[[8]]$len
#> [1] 1
#>
#>
#> [[3]]$Token[[9]]
#> [[3]]$Token[[9]]$form
#> [1] "R"
#>
#> [[3]]$Token[[9]]$tag
#> [1] "SL"
#>
#> [[3]]$Token[[9]]$start
#> [1] 21
#>
#> [[3]]$Token[[9]]$len
#> [1] 1
#>
#>
#> [[3]]$Token[[10]]
#> [[3]]$Token[[10]]$form
#> [1] "wrapper"
#>
#> [[3]]$Token[[10]]$tag
#> [1] "SL"
#>
#> [[3]]$Token[[10]]$start
#> [1] 23
#>
#> [[3]]$Token[[10]]$len
#> [1] 7
#>
#>
#> [[3]]$Token[[11]]
#> [[3]]$Token[[11]]$form
#> [1] "이"
#>
#> [[3]]$Token[[11]]$tag
#> [1] "VCP"
#>
#> [[3]]$Token[[11]]$start
#> [1] 30
#>
#> [[3]]$Token[[11]]$len
#> [1] 1
#>
#>
#> [[3]]$Token[[12]]
#> [[3]]$Token[[12]]$form
#> [1] "ᆫ"
#>
#> [[3]]$Token[[12]]$tag
#> [1] "ETM"
#>
#> [[3]]$Token[[12]]$start
#> [1] 30
#>
#> [[3]]$Token[[12]]$len
#> [1] 1
#>
#>
#> [[3]]$Token[[13]]
#> [[3]]$Token[[13]]$form
#> [1] "elbird"
#>
#> [[3]]$Token[[13]]$tag
#> [1] "SL"
#>
#> [[3]]$Token[[13]]$start
#> [1] 32
#>
#> [[3]]$Token[[13]]$len
#> [1] 6
#>
#>
#> [[3]]$Token[[14]]
#> [[3]]$Token[[14]]$form
#> [1] "를"
#>
#> [[3]]$Token[[14]]$tag
#> [1] "JKO"
#>
#> [[3]]$Token[[14]]$start
#> [1] 38
#>
#> [[3]]$Token[[14]]$len
#> [1] 1
#>
#>
#> [[3]]$Token[[15]]
#> [[3]]$Token[[15]]$form
#> [1] "소개"
#>
#> [[3]]$Token[[15]]$tag
#> [1] "NNG"
#>
#> [[3]]$Token[[15]]$start
#> [1] 40
#>
#> [[3]]$Token[[15]]$len
#> [1] 2
#>
#>
#> [[3]]$Token[[16]]
#> [[3]]$Token[[16]]$form
#> [1] "하"
#>
#> [[3]]$Token[[16]]$tag
#> [1] "XSV"
#>
#> [[3]]$Token[[16]]$start
#> [1] 42
#>
#> [[3]]$Token[[16]]$len
#> [1] 1
#>
#>
#> [[3]]$Token[[17]]
#> [[3]]$Token[[17]]$form
#> [1] "ᆸ니다"
#>
#> [[3]]$Token[[17]]$tag
#> [1] "EF"
#>
#> [[3]]$Token[[17]]$start
#> [1] 42
#>
#> [[3]]$Token[[17]]$len
#> [1] 3
#>
#>
#> [[3]]$Token[[18]]
#> [[3]]$Token[[18]]$form
#> [1] "."
#>
#> [[3]]$Token[[18]]$tag
#> [1] "SF"
#>
#> [[3]]$Token[[18]]$start
#> [1] 45
#>
#> [[3]]$Token[[18]]$len
#> [1] 1
#>
#>
#>
#> [[3]]$Score
#> [1] -95.38721
analyze(c("안녕하세요 kiwi 형태소 분석기의 R wrapper인 elbird를 소개합니다."), top_n = 1)
#> [[1]]
#> [[1]]$Token
#> [[1]]$Token[[1]]
#> [[1]]$Token[[1]]$form
#> [1] "안녕하세요"
#>
#> [[1]]$Token[[1]]$tag
#> [1] "NNP"
#>
#> [[1]]$Token[[1]]$start
#> [1] 1
#>
#> [[1]]$Token[[1]]$len
#> [1] 5
#>
#>
#> [[1]]$Token[[2]]
#> [[1]]$Token[[2]]$form
#> [1] "kiwi"
#>
#> [[1]]$Token[[2]]$tag
#> [1] "SL"
#>
#> [[1]]$Token[[2]]$start
#> [1] 7
#>
#> [[1]]$Token[[2]]$len
#> [1] 4
#>
#>
#> [[1]]$Token[[3]]
#> [[1]]$Token[[3]]$form
#> [1] "형태소"
#>
#> [[1]]$Token[[3]]$tag
#> [1] "NNG"
#>
#> [[1]]$Token[[3]]$start
#> [1] 12
#>
#> [[1]]$Token[[3]]$len
#> [1] 3
#>
#>
#> [[1]]$Token[[4]]
#> [[1]]$Token[[4]]$form
#> [1] "분석기"
#>
#> [[1]]$Token[[4]]$tag
#> [1] "NNG"
#>
#> [[1]]$Token[[4]]$start
#> [1] 16
#>
#> [[1]]$Token[[4]]$len
#> [1] 3
#>
#>
#> [[1]]$Token[[5]]
#> [[1]]$Token[[5]]$form
#> [1] "의"
#>
#> [[1]]$Token[[5]]$tag
#> [1] "JKG"
#>
#> [[1]]$Token[[5]]$start
#> [1] 19
#>
#> [[1]]$Token[[5]]$len
#> [1] 1
#>
#>
#> [[1]]$Token[[6]]
#> [[1]]$Token[[6]]$form
#> [1] "R"
#>
#> [[1]]$Token[[6]]$tag
#> [1] "SL"
#>
#> [[1]]$Token[[6]]$start
#> [1] 21
#>
#> [[1]]$Token[[6]]$len
#> [1] 1
#>
#>
#> [[1]]$Token[[7]]
#> [[1]]$Token[[7]]$form
#> [1] "wrapper"
#>
#> [[1]]$Token[[7]]$tag
#> [1] "SL"
#>
#> [[1]]$Token[[7]]$start
#> [1] 23
#>
#> [[1]]$Token[[7]]$len
#> [1] 7
#>
#>
#> [[1]]$Token[[8]]
#> [[1]]$Token[[8]]$form
#> [1] "이"
#>
#> [[1]]$Token[[8]]$tag
#> [1] "VCP"
#>
#> [[1]]$Token[[8]]$start
#> [1] 30
#>
#> [[1]]$Token[[8]]$len
#> [1] 1
#>
#>
#> [[1]]$Token[[9]]
#> [[1]]$Token[[9]]$form
#> [1] "ᆫ"
#>
#> [[1]]$Token[[9]]$tag
#> [1] "ETM"
#>
#> [[1]]$Token[[9]]$start
#> [1] 30
#>
#> [[1]]$Token[[9]]$len
#> [1] 1
#>
#>
#> [[1]]$Token[[10]]
#> [[1]]$Token[[10]]$form
#> [1] "elbird"
#>
#> [[1]]$Token[[10]]$tag
#> [1] "SL"
#>
#> [[1]]$Token[[10]]$start
#> [1] 32
#>
#> [[1]]$Token[[10]]$len
#> [1] 6
#>
#>
#> [[1]]$Token[[11]]
#> [[1]]$Token[[11]]$form
#> [1] "를"
#>
#> [[1]]$Token[[11]]$tag
#> [1] "JKO"
#>
#> [[1]]$Token[[11]]$start
#> [1] 38
#>
#> [[1]]$Token[[11]]$len
#> [1] 1
#>
#>
#> [[1]]$Token[[12]]
#> [[1]]$Token[[12]]$form
#> [1] "소개"
#>
#> [[1]]$Token[[12]]$tag
#> [1] "NNG"
#>
#> [[1]]$Token[[12]]$start
#> [1] 40
#>
#> [[1]]$Token[[12]]$len
#> [1] 2
#>
#>
#> [[1]]$Token[[13]]
#> [[1]]$Token[[13]]$form
#> [1] "하"
#>
#> [[1]]$Token[[13]]$tag
#> [1] "XSV"
#>
#> [[1]]$Token[[13]]$start
#> [1] 42
#>
#> [[1]]$Token[[13]]$len
#> [1] 1
#>
#>
#> [[1]]$Token[[14]]
#> [[1]]$Token[[14]]$form
#> [1] "ᆸ니다"
#>
#> [[1]]$Token[[14]]$tag
#> [1] "EF"
#>
#> [[1]]$Token[[14]]$start
#> [1] 42
#>
#> [[1]]$Token[[14]]$len
#> [1] 3
#>
#>
#> [[1]]$Token[[15]]
#> [[1]]$Token[[15]]$form
#> [1] "."
#>
#> [[1]]$Token[[15]]$tag
#> [1] "SF"
#>
#> [[1]]$Token[[15]]$start
#> [1] 45
#>
#> [[1]]$Token[[15]]$len
#> [1] 1
#>
#>
#>
#> [[1]]$Score
#> [1] -91.58401
형태소 태그
kiwipiepy패키지에서 사용하는 형태소 태그는 아래와 같습니다.
- The table below is fetched at 2022-08-12 16:20:13 UTC.
|