tfidf_vector
tfidf_vector.Rd
tfidf vector로 변환합니다.
Examples
df <- data.frame(
"일자" = c(20230101, 20230102, 20230103),
"언론사" = c("조선일보", "한겨례", "경향신문"),
"제목" = c("[속보] 경찰, 민주노총 도심 집회 1차 해산명령",
"[사설] 한반도 긴장 높인 북한의 군사정찰위성 발사 규탄한다",
"‘직권남용죄’ 남용 유감"),
"키워드" = c("경찰,해산명령,민주,노총,도심,집회,해산,명령,민주노총",
"한반도,긴장,북한,규탄,군사,정찰,위성,발사,북한,인공위성",
"직권남용죄,남용,유감,왜냐면,이정환,민주사회,변호사모임"))
data <- tfidf_vector(df)
head(data)
#> Terms
#> Docs 경찰 해산명령 민주 노총 도심 집회 해산 명령 민주노총 한반도
#> 1 4.70044 0.00000 0.00000 0.00000 0.00000 0.00000 0 0 0 0
#> 2 0.00000 4.70044 0.00000 0.00000 0.00000 0.00000 0 0 0 0
#> 3 0.00000 0.00000 4.70044 0.00000 0.00000 0.00000 0 0 0 0
#> 4 0.00000 0.00000 0.00000 4.70044 0.00000 0.00000 0 0 0 0
#> 5 0.00000 0.00000 0.00000 0.00000 4.70044 0.00000 0 0 0 0
#> 6 0.00000 0.00000 0.00000 0.00000 0.00000 4.70044 0 0 0 0
#> Terms
#> Docs 긴장 북한 규탄 군사 정찰 위성 발사 인공위성 직권남용죄 남용 유감 왜냐면
#> 1 0 0 0 0 0 0 0 0 0 0 0 0
#> 2 0 0 0 0 0 0 0 0 0 0 0 0
#> 3 0 0 0 0 0 0 0 0 0 0 0 0
#> 4 0 0 0 0 0 0 0 0 0 0 0 0
#> 5 0 0 0 0 0 0 0 0 0 0 0 0
#> 6 0 0 0 0 0 0 0 0 0 0 0 0
#> Terms
#> Docs 이정환 민주사회 변호사모임
#> 1 0 0 0
#> 2 0 0 0
#> 3 0 0 0
#> 4 0 0 0
#> 5 0 0 0
#> 6 0 0 0