ํ ์คํธ ๋ง์ด๋
๋ฌธ์๋ก ๋ ๋ฐ์ดํฐ์์ ๊ฐ์น์๋ ์ ๋ณด๋ฅผ ์ป๋ ๋ถ์ ๊ธฐ๋ฒ >> 'ํ ์คํธ ๋ง์ด๋'
ํ ์คํธ ๋ง์ด๋์ ํ ๋ ๊ฐ์ฅ ๋จผ์ ํ๋ ์์ ์ 'ํํ์ ๋ถ์'์ด๋ค.
ํ๊ธ ์์ฐ์ด ๋ถ์ ํจํค์ง KoNLP ๋ฅผ ์ด์ฉํ์ฌ ํํ์ ๋ถ์์ ํ ์์๋ค.
Rstudio ์์ ํจํค์ง๋ฅผ ์ค์นํ๋ค
install.packages("rJava")
install.packages("memoise")
install.packages("KoNLP")
library(KoNLP)
library(dplyr)
*์ฌ์ ์ค์ ํ๊ธฐ
KoNLP์์ ์ง์ํ๋ ์ฌ์ ์ 98๋ง์ฌ๊ฐ์ ๋จ์ด๋ก ๊ตฌ์ฑ๋์ด์๋ค.
๋ฐ๋ผ์ useNIADic()๋ฅผ ์ ๋ ฅํด์ ์ค์ ํ๋ค.
*ํน์๋ฌธ์ ์ ๊ฑฐํ๊ธฐ
๋ฌธ์ฅ์ ์ด๋ชจํฐ์ฝ์ด๋ ํน์๋ฌธ์๊ฐ ํฌํจ๋์ด ์์ผ๋ฉด ์ค๋ฅ๊ฐ ๋ฐ์ํ๋ค.
stringr์ str_replace_all()์ ์ด์ฉํ์ฌ ํน์๋ถ์๋ฅผ ๋น์นธ์ผ๋ก ์์ ํ๋ค
install.packages("stringr")
library(stringr)
txt <- str_replace_all(txt," "||w", " ")
||w๋ ํน์๋ฌธ์๋ฅผ ์๋ฏธํ๋ '์ ๊ท ํํ์'์ด๋ค.
*๋ช ์ฌ ์ถ์ถํ๊ธฐ
KoNLP์ extractNoun()์ ์ด์ฉํ๋ฉด ๋ฌธ์ฅ์์ ๋ช ์ฌ๋ฅผ ์ถ์ถํ ์ ์๋ค.
์๋ ํด๋ผ์ฐ๋
์๋ ํด๋ผ์ฐ๋๋ ๋จ์ด์ ๋น๋๋ฅผ ๊ตฌ๋ฅด ๋ชจ์์ผ๋ก ํํํ ๊ทธ๋ํ์ด๋ค.
wordcloudํจํค์ง๋ฅผ ์ด์ฉํด์ ์๋ ํด๋ผ์ฐ๋๋ฅผ ๋ง๋ค ์ ์๋ค.
install.packages("wordcloud")
library(wordcloud)
library(RColorBrewer)
ex)
wordcloud(words = df_word$word, #๋จ์ด
freq = df_word$freq, #๋น๋
min.freq =2, #์ต์ ๋จ์ด ๋น๋
max.words = 200, #ํํ ๋จ์ด ์
random.order = F, #๊ณ ๋น๋ ๋จ์ด ์ค์ ๋ฐฐ์น
rot.per = .1, #ํ์ ๋จ์ด ๋น์จ
scale = c(4,0.3), #๋จ์ด ํฌ๊ธฐ ๋ฒ์
colors = pal) # ์์๋ชฉ๋ก
์ถ๋ ฅ๋ ์๋ ํด๋ผ์ฐ๋๋ ๋ง์ด ์ฌ์ฉ๋ ๋จ์ด์ผ ์๋ก ํฌ๊ณ ๊ฐ์ด๋ฐ ๋ฐฐ์น๋๋ฉฐ ๋ ์ฌ์ฉ๋
๋จ์ด ์ผ์๋ก ๋ฐ๊นฅ์ชฝ์ ์์ ํํ๋๋ค.
'R' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
์์ ์๋ฃ์ ๋ฆฌ :ํต๊ณ๋ถ์/๊ฐ์ค ๊ฒ์ (0) | 2019.05.31 |
---|---|
R๋ฐ์ดํฐ ๋ถ์ 4 (0) | 2019.04.15 |
์ฝ๊ฒ ๋ฐฐ์ฐ๋ R๋ฐ์ดํฐ ๋ถ์, ๋ถ์๋์ (0) | 2019.04.08 |
R ๋ฐ์ดํฐ๋ถ์ 3 (0) | 2019.03.26 |
R๋ฐ์ดํฐ ๋ถ์ 2 (0) | 2019.03.26 |