Skip to contents

kmeans clustering을 진행합니다.

Usage

Kmeans(vec, k, max = 1000, random_state = 123)

Arguments

vec

텍스트 벡터

k

형성할 군집 갯수

max

최대 반복 횟수

random_state

seed 값

Examples

df <- data.frame(
  "일자" = c(20230101, 20230102, 20230103),
  "언론사" = c("조선일보", "한겨례", "경향신문"),
  "제목" = c("[속보] 경찰, 민주노총 도심 집회 1차 해산명령", 
              "[사설] 한반도 긴장 높인 북한의 군사정찰위성 발사 규탄한다",
              "‘직권남용죄’ 남용 유감"),
  "키워드" = c("경찰,해산명령,민주,노총,도심,집회,해산,명령,민주노총",
                "한반도,긴장,북한,규탄,군사,정찰,위성,발사,북한,인공위성",
                "직권남용죄,남용,유감,왜냐면,이정환,민주사회,변호사모임"))

vec <- tfidf_vector(df)

cluster <- Kmeans(vec, k = 3, max = 1000)
#> Warning: Quick-TRANSfer stage steps exceeded maximum (= 1300)
cluster$cluster
#>  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 
#>  2  2  2  2  2  2  2  2  2  3  3  1  3  3  2  2  2  1  2  2  2  2  2  2  2  2