Cómo usar beautifulsoup4 en Python para rastrear contenido en etiquetas
Código fuente
de bs4 import BeautifulSoup
html_doc = '''
lt; div class="line-title"gt;
>lt; abarcar clase="título"gt;
lt;
111
lt; abarcar clase="t-pequeño c-verde" gt;
(222)
lt;/spangt;
lt;/bgt;
lt;/spangt; p> p>
lt;span class="sechovershow jzbtn c-lined pequeño marl10 act-ugc-edit act-ugc-edit-base1" style="margin-top:
lt;i class= "fa fa-pencil"gt;lt;/igt;
Editar
lt;/spangt;
lt;/divgt;
'''
sopa = BeautifulSoup(html_doc, "html.parser")
# Elemental
didi = sopa.b.next_element. strip ()
invest = sopa.b.span.next_element.strip()
# Avanzado
didi, invest = sopa.b.stripped_strings p >