¿Cómo procesan Python y BeautifulSoup tablas html en csv?
Python y BeautifulSoup tratan la tabla html como csv, el código es el siguiente:
#Encoding: utf8
Importar urllib
Importar urllib2
Importar cookielib
Importar re
Importar csv
Importar códec
Importar BeautifulSoup desde bs4
wiki = ' pila('t[dh]')
Para filas en table.findAll("tr "):
celdas = fila.findAll(td_th)
Si len(celdas) == 6:
nombre = celdas[0]. Buscar(text=True)
Si no es un nombre:
Continuar
creador = celdas[1]. Buscar(texto=Verdadero)
primero = celda[2]. Buscar(texto=Verdadero)
Último=celda[3]. Buscar(texto=Verdadero)
Costo=celda[4]. Buscar(texto=Verdadero)
Licencia=celda[5]. Busque (text=True)
CSV _ escritor . writerow([x . encode(' utf-8 ')]) para x en [nombre, creador, primero, último, costo, licencia] p>
f.cerrar()