728x90
반응형

Long Short Term Memory
한글 분석하기
한글 형태소 분석기
kkma
komoran
okt
hannanum

 

 

import konlpy
from konlpy.tag import Kkma, Komoran, Okt, Hannanum
import time
kkma = Kkma()
komoran = Komoran()
okt = Okt()
hannanum = Hannanum()

 

def sample_ko_pos(text) :
    print(f"==={text}===")
    start = time.time()
    print("kkma:",kkma.pos(text),",실행시간:",time.time()-start)
    start = time.time()
    print("komoran:",komoran.pos(text),",실행시간:",time.time()-start)
    start = time.time()
    print("okt:",okt.pos(text),",실행시간:",time.time()-start)
    start = time.time()
    print("hannanum:",hannanum.pos(text),",실행시간:",time.time()-start)
    print('\n')

 

# 띄어쓰기 가 올바르지 않은 문장
text1 = '영실아안녕오늘날씨어때?'
sample_ko_pos(text1)

===영실아안녕오늘날씨어때?===
kkma: [('영', 'MAG'), ('싣', 'VV'), ('아', 'ECD'), ('안녕', 'NNG'), ('오늘날', 'NNG'), ('씨', 'VV'), ('어', 'ECD'), ('때', 'NNG'), ('?', 'SF')] ,실행시간: 3.219935178756714
komoran: [('영', 'NNP'), ('실', 'NNP'), ('아', 'NNP'), ('안녕', 'NNP'), ('오늘날', 'NNP'), ('씨', 'NNB'), ('어떻', 'VA'), ('어', 'EF'), ('?', 'SF')] ,실행시간: 0.004001617431640625
okt: [('영', 'Modifier'), ('실아', 'Noun'), ('안녕', 'Noun'), ('오늘날', 'Noun'), ('씨', 'Suffix'), ('어때', 'Adjective'), ('?', 'Punctuation')] ,실행시간: 2.025106191635132
hannanum: [('영실아안녕오늘날씨어때', 'N'), ('?', 'S')] ,실행시간: 0.5730204582214355

 

# 오타가 있는 문장
text2 = '안녕ㅎㅏㅅㅔ여 ㅈㅓ는ㄷㅐ학생 입니다.'
sample_ko_pos(text2)


===안녕ㅎㅏㅅㅔ여 ㅈㅓ는ㄷㅐ학생 입니다.===
kkma: [('안녕ㅎㅏㅅㅔ', 'UN'), ('여', 'JKI'), ('ㅈ', 'NNG'), ('ㅓ', 'UN'), ('는', 'JX'), ('ㄷ', 'NNG'), ('ㅐ', 'UN'), ('학생', 'NNG'), ('이', 'VCP'), ('ㅂ니다', 'EFN'), ('.', 'SF')] ,실행시간: 0.0388941764831543
komoran: [('안녕', 'NNP'), ('하', 'NNP'), ('세', 'NNB'), ('이', 'VCP'), ('어', 'EC'), ('저', 'NP'), ('는', 'JX'), ('대학생', 'NNG'), ('이', 'VCP'), ('ㅂ니다', 'EF'), ('.', 'SF')] ,실행시간: 0.0010001659393310547
okt: [('안녕', 'Noun'), ('ㅎㅏㅅㅔ', 'KoreanParticle'), ('여', 'Noun'), ('ㅈㅓ', 'KoreanParticle'), ('는', 'Verb'), ('ㄷㅐ', 'KoreanParticle'), ('학생', 'Noun'), ('입니다', 'Adjective'), ('.', 'Punctuation')] ,실행시간: 0.00400090217590332
hannanum: [('안녕ㅎㅏㅅㅔ', 'N'), ('이', 'J'), ('어', 'E'), ('ㅈㅓ는ㄷㅐ학생', 'N'), ('일', 'P'), ('ㅂ니다', 'E'), ('.', 'S')] ,실행시간: 0.0020003318786621094

 

text3 = "정말 재미있고 매력적인 영화에요 추천합니다."
sample_ko_pos(text3)

===정말 재미있고 매력적인 영화에요 추천합니다.===
kkma: [('정말', 'MAG'), ('재미있', 'VA'), ('고', 'ECE'), ('매력적', 'NNG'), ('이', 'VCP'), ('ㄴ', 'ETD'), ('영화', 'NNG'), ('에', 'JKM'), ('요', 'JX'), ('추천', 'NNG'), ('하', 'XSV'), ('ㅂ니다', 'EFN'), ('.', 'SF')] ,실행시간: 0.01355123519897461
komoran: [('정말', 'MAG'), ('재미있', 'VA'), ('고', 'EC'), ('매력', 'NNG'), ('적', 'XSN'), ('이', 'VCP'), ('ㄴ', 'ETM'), ('영화', 'NNG'), ('에', 'JKB'), ('요', 'JX'), ('추천', 'NNG'), ('하', 'XSV'), ('ㅂ니다', 'EF'), ('.', 'SF')] ,실행시간: 0.002000093460083008
okt: [('정말', 'Noun'), ('재미있고', 'Adjective'), ('매력', 'Noun'), ('적', 'Suffix'), ('인', 'Josa'), ('영화', 'Noun'), ('에요', 'Josa'), ('추천', 'Noun'), ('합니다', 'Verb'), ('.', 'Punctuation')] ,실행시간: 0.009005308151245117
hannanum: [('정말', 'M'), ('재미있', 'P'), ('고', 'E'), ('매력적', 'N'), ('이', 'J'), ('ㄴ', 'E'), ('영화', 'N'), ('이', 'J'), ('에요', 'E'), ('추천', 'N'), ('하', 'X'), ('ㅂ니다', 'E'), ('.', 'S')] ,실행시간: 0.003000497817993164

 

반응형

'Data_Science > Data_Analysis_Py' 카테고리의 다른 글

62. Tokenizer  (0) 2021.12.07
61. 네이버 영화리뷰 || LSTM  (0) 2021.12.07
58. IMDB || SimpleRNN  (0) 2021.12.07
57. seed || simpleRNN  (0) 2021.12.07
56. 영화리뷰 분석  (0) 2021.12.07

+ Recent posts