μμ μλ£μ 리 : ν μ€νΈ λ§μ΄λ
ν μ€νΈ λ§μ΄λ
λ¬Έμλ‘ λ λ°μ΄ν°μμ κ°μΉμλ μ 보λ₯Ό μ»λ λΆμ κΈ°λ² >> 'ν μ€νΈ λ§μ΄λ'
ν μ€νΈ λ§μ΄λμ ν λ κ°μ₯ λ¨Όμ νλ μμ μ 'ννμ λΆμ'μ΄λ€.
νκΈ μμ°μ΄ λΆμ ν¨ν€μ§ KoNLP λ₯Ό μ΄μ©νμ¬ ννμ λΆμμ ν μμλ€.
Rstudio μμ ν¨ν€μ§λ₯Ό μ€μΉνλ€
install.packages("rJava")
install.packages("memoise")
install.packages("KoNLP")
library(KoNLP)
library(dplyr)
*μ¬μ μ€μ νκΈ°
KoNLPμμ μ§μνλ μ¬μ μ 98λ§μ¬κ°μ λ¨μ΄λ‘ ꡬμ±λμ΄μλ€.
λ°λΌμ useNIADic()λ₯Ό μ λ ₯ν΄μ μ€μ νλ€.
*νΉμλ¬Έμ μ κ±°νκΈ°
λ¬Έμ₯μ μ΄λͺ¨ν°μ½μ΄λ νΉμλ¬Έμκ° ν¬ν¨λμ΄ μμΌλ©΄ μ€λ₯κ° λ°μνλ€.
stringrμ str_replace_all()μ μ΄μ©νμ¬ νΉμλΆμλ₯Ό λΉμΉΈμΌλ‘ μμ νλ€
install.packages("stringr")
library(stringr)
txt <- str_replace_all(txt," "||w", " ")
||wλ νΉμλ¬Έμλ₯Ό μλ―Ένλ 'μ κ· ννμ'μ΄λ€.
*λͺ μ¬ μΆμΆνκΈ°
KoNLPμ extractNoun()μ μ΄μ©νλ©΄ λ¬Έμ₯μμ λͺ μ¬λ₯Ό μΆμΆν μ μλ€.
μλ ν΄λΌμ°λ
μλ ν΄λΌμ°λλ λ¨μ΄μ λΉλλ₯Ό ꡬλ₯΄ λͺ¨μμΌλ‘ ννν κ·Έλνμ΄λ€.
wordcloudν¨ν€μ§λ₯Ό μ΄μ©ν΄μ μλ ν΄λΌμ°λλ₯Ό λ§λ€ μ μλ€.
install.packages("wordcloud")
library(wordcloud)
library(RColorBrewer)
ex)
wordcloud(words = df_word$word, #λ¨μ΄
freq = df_word$freq, #λΉλ
min.freq =2, #μ΅μ λ¨μ΄ λΉλ
max.words = 200, #νν λ¨μ΄ μ
random.order = F, #κ³ λΉλ λ¨μ΄ μ€μ λ°°μΉ
rot.per = .1, #νμ λ¨μ΄ λΉμ¨
scale = c(4,0.3), #λ¨μ΄ ν¬κΈ° λ²μ
colors = pal) # μμλͺ©λ‘
μΆλ ₯λ μλ ν΄λΌμ°λλ λ§μ΄ μ¬μ©λ λ¨μ΄μΌ μλ‘ ν¬κ³ κ°μ΄λ° λ°°μΉλλ©° λ μ¬μ©λ
λ¨μ΄ μΌμλ‘ λ°κΉ₯μͺ½μ μμ ννλλ€.