Skip to contents

키워드의 tfidf score를 포함한 데이터 프레임을 반환합니다.

Usage

tfidf(df)

Arguments

df

BigKinds 원본 문서

Examples

df <- data.frame(
  "일자" = c(20230101, 20230102, 20230103),
  "언론사" = c("조선일보", "한겨례", "경향신문"),
  "제목" = c("[속보] 경찰, 민주노총 도심 집회 1차 해산명령", 
              "[사설] 한반도 긴장 높인 북한의 군사정찰위성 발사 규탄한다",
              "‘직권남용죄’ 남용 유감"),
  "키워드" = c("경찰,해산명령,민주,노총,도심,집회,해산,명령,민주노총",
                "한반도,긴장,북한,규탄,군사,정찰,위성,발사,북한,인공위성",
                "직권남용죄,남용,유감,왜냐면,이정환,민주사회,변호사모임"))
                
data <- tfidf(df)
head(data)
#>   rowid                                         제목   키워드        tf
#> 1     1 [속보] 경찰, 민주노총 도심 집회 1차 해산명령     경찰 0.1111111
#> 2     1 [속보] 경찰, 민주노총 도심 집회 1차 해산명령 해산명령 0.1111111
#> 3     1 [속보] 경찰, 민주노총 도심 집회 1차 해산명령     민주 0.1111111
#> 4     1 [속보] 경찰, 민주노총 도심 집회 1차 해산명령     노총 0.1111111
#> 5     1 [속보] 경찰, 민주노총 도심 집회 1차 해산명령     도심 0.1111111
#> 6     1 [속보] 경찰, 민주노총 도심 집회 1차 해산명령     집회 0.1111111
#>        idf   tf_idf
#> 1 1.098612 0.122068
#> 2 1.098612 0.122068
#> 3 1.098612 0.122068
#> 4 1.098612 0.122068
#> 5 1.098612 0.122068
#> 6 1.098612 0.122068