Red de conocimiento informático - Material del sitio web - Cómo usar beautifulsoup4 en Python para rastrear contenido en etiquetas

Cómo usar beautifulsoup4 en Python para rastrear contenido en etiquetas

Código fuente

de bs4 import BeautifulSoup

html_doc = '''

lt; div class="line-title"gt;

>lt; abarcar clase="título"gt;

lt;

111

lt; abarcar clase="t-pequeño c-verde" gt;

(222)

lt;/spangt;

lt;/bgt;

lt;/spangt; p>

lt;span class="sechovershow jzbtn c-lined pequeño marl10 act-ugc-edit act-ugc-edit-base1" style="margin-top:

lt;i class= "fa fa-pencil"gt;lt;/igt;

Editar

lt;/spangt;

lt;/divgt;

'''

sopa = BeautifulSoup(html_doc, "html.parser")

# Elemental

didi = sopa.b.next_element. strip ()

invest = sopa.b.span.next_element.strip()

# Avanzado

didi, invest = sopa.b.stripped_strings