Problemas de codificación encontrados al escribir un rastreador en Python: el código fuente de la página web es uft-8, la salida .read() contiene chino, use .endoce('utf-8')
Python imprimirá una lista de cadenas Unicode en este formato. Si lo haces en bucle, no hará esto. para artículo en artículos:
imprimir(artículo)