728x90
반응형
Long Short Term Memory
한글 분석하기
한글 형태소 분석기
kkma
komoran
okt
hannanum
import konlpy
from konlpy.tag import Kkma, Komoran, Okt, Hannanum
import time
kkma = Kkma()
komoran = Komoran()
okt = Okt()
hannanum = Hannanum()
def sample_ko_pos(text) :
print(f"==={text}===")
start = time.time()
print("kkma:",kkma.pos(text),",실행시간:",time.time()-start)
start = time.time()
print("komoran:",komoran.pos(text),",실행시간:",time.time()-start)
start = time.time()
print("okt:",okt.pos(text),",실행시간:",time.time()-start)
start = time.time()
print("hannanum:",hannanum.pos(text),",실행시간:",time.time()-start)
print('\n')
# 띄어쓰기 가 올바르지 않은 문장
text1 = '영실아안녕오늘날씨어때?'
sample_ko_pos(text1)
===영실아안녕오늘날씨어때?===
kkma: [('영', 'MAG'), ('싣', 'VV'), ('아', 'ECD'), ('안녕', 'NNG'), ('오늘날', 'NNG'), ('씨', 'VV'), ('어', 'ECD'), ('때', 'NNG'), ('?', 'SF')] ,실행시간: 3.219935178756714
komoran: [('영', 'NNP'), ('실', 'NNP'), ('아', 'NNP'), ('안녕', 'NNP'), ('오늘날', 'NNP'), ('씨', 'NNB'), ('어떻', 'VA'), ('어', 'EF'), ('?', 'SF')] ,실행시간: 0.004001617431640625
okt: [('영', 'Modifier'), ('실아', 'Noun'), ('안녕', 'Noun'), ('오늘날', 'Noun'), ('씨', 'Suffix'), ('어때', 'Adjective'), ('?', 'Punctuation')] ,실행시간: 2.025106191635132
hannanum: [('영실아안녕오늘날씨어때', 'N'), ('?', 'S')] ,실행시간: 0.5730204582214355
# 오타가 있는 문장
text2 = '안녕ㅎㅏㅅㅔ여 ㅈㅓ는ㄷㅐ학생 입니다.'
sample_ko_pos(text2)
===안녕ㅎㅏㅅㅔ여 ㅈㅓ는ㄷㅐ학생 입니다.===
kkma: [('안녕ㅎㅏㅅㅔ', 'UN'), ('여', 'JKI'), ('ㅈ', 'NNG'), ('ㅓ', 'UN'), ('는', 'JX'), ('ㄷ', 'NNG'), ('ㅐ', 'UN'), ('학생', 'NNG'), ('이', 'VCP'), ('ㅂ니다', 'EFN'), ('.', 'SF')] ,실행시간: 0.0388941764831543
komoran: [('안녕', 'NNP'), ('하', 'NNP'), ('세', 'NNB'), ('이', 'VCP'), ('어', 'EC'), ('저', 'NP'), ('는', 'JX'), ('대학생', 'NNG'), ('이', 'VCP'), ('ㅂ니다', 'EF'), ('.', 'SF')] ,실행시간: 0.0010001659393310547
okt: [('안녕', 'Noun'), ('ㅎㅏㅅㅔ', 'KoreanParticle'), ('여', 'Noun'), ('ㅈㅓ', 'KoreanParticle'), ('는', 'Verb'), ('ㄷㅐ', 'KoreanParticle'), ('학생', 'Noun'), ('입니다', 'Adjective'), ('.', 'Punctuation')] ,실행시간: 0.00400090217590332
hannanum: [('안녕ㅎㅏㅅㅔ', 'N'), ('이', 'J'), ('어', 'E'), ('ㅈㅓ는ㄷㅐ학생', 'N'), ('일', 'P'), ('ㅂ니다', 'E'), ('.', 'S')] ,실행시간: 0.0020003318786621094
text3 = "정말 재미있고 매력적인 영화에요 추천합니다."
sample_ko_pos(text3)
===정말 재미있고 매력적인 영화에요 추천합니다.===
kkma: [('정말', 'MAG'), ('재미있', 'VA'), ('고', 'ECE'), ('매력적', 'NNG'), ('이', 'VCP'), ('ㄴ', 'ETD'), ('영화', 'NNG'), ('에', 'JKM'), ('요', 'JX'), ('추천', 'NNG'), ('하', 'XSV'), ('ㅂ니다', 'EFN'), ('.', 'SF')] ,실행시간: 0.01355123519897461
komoran: [('정말', 'MAG'), ('재미있', 'VA'), ('고', 'EC'), ('매력', 'NNG'), ('적', 'XSN'), ('이', 'VCP'), ('ㄴ', 'ETM'), ('영화', 'NNG'), ('에', 'JKB'), ('요', 'JX'), ('추천', 'NNG'), ('하', 'XSV'), ('ㅂ니다', 'EF'), ('.', 'SF')] ,실행시간: 0.002000093460083008
okt: [('정말', 'Noun'), ('재미있고', 'Adjective'), ('매력', 'Noun'), ('적', 'Suffix'), ('인', 'Josa'), ('영화', 'Noun'), ('에요', 'Josa'), ('추천', 'Noun'), ('합니다', 'Verb'), ('.', 'Punctuation')] ,실행시간: 0.009005308151245117
hannanum: [('정말', 'M'), ('재미있', 'P'), ('고', 'E'), ('매력적', 'N'), ('이', 'J'), ('ㄴ', 'E'), ('영화', 'N'), ('이', 'J'), ('에요', 'E'), ('추천', 'N'), ('하', 'X'), ('ㅂ니다', 'E'), ('.', 'S')] ,실행시간: 0.003000497817993164
반응형
'Data_Science > Data_Analysis_Py' 카테고리의 다른 글
62. Tokenizer (0) | 2021.12.07 |
---|---|
61. 네이버 영화리뷰 || LSTM (0) | 2021.12.07 |
58. IMDB || SimpleRNN (0) | 2021.12.07 |
57. seed || simpleRNN (0) | 2021.12.07 |
56. 영화리뷰 분석 (0) | 2021.12.07 |