[NLP] 한국어/영어 불용어(Stopword) 제거하기 (+ 한국어 불용어 리스트) [한국어 자연어처리]
[ 자연어 처리 ] 해당 자료를 참고하여 재작성하였습니다 wikidocs.net/22530 이번 포스팅은 자연어처리를 하다보면 필요없는 단어가 있을겁니다 필요없는 단어를 불용어(Stopword) 라고 합니다 불용어를 제거하는 작업을 진행하겠습니다. 설치 아래와 같은 코드를 입력하여 nltk 불용어 리스트 데이터를 설치합니다. import nltk nltk.download('stopwords') 영어 불용어 리스트 확인 아래와 같은 코드를 입력하여 영어 불용어리스트를 불러올 수 있습니다. from nltk.corpus import stopwords print(stopwords.words('english')) ['i', 'me', 'my', 'myself', 'we', 'our', 'ours', 'ourse..
2021.06.28