Cómo eliminar palabras vacías en Python jieba split word
-*- Codificación: utf-8 -*-
importar jieba
importar jieba.analyse
importar sys
importar códecs
reload(sys)
sys.setdefaultencoding('utf-8')
# Leer la lista de parada usando otras codificaciones
#stoplist = codecs.open('... /... /file/stopword.txt','r',encoding='utf8').readlines()
#stoplist = set(w.strip ( ) para w en lista de parada)
#El archivo de palabras de desactivación está codificado en utf8
stoplist = {}.fromkeys([ line.strip() para línea en open("... / ... /file/stopword.txt") ])
#El archivo de palabras de desactivación está codificado en utf8, primero conviértalo a codificación utf8