El rastreador de Python reemplaza los enlaces locales en las páginas HTML en línea con enlaces de imágenes y descarga archivos HTML localmente.
importar sistema operativo, re
def check_flag(flag):
regex = re.compile(r'images\/')
result = True si regex. coincidencia(bandera) else False
devolver resultado
#soup = BeautifulSoup(open('index.
'''
archivo = open(r'favorite-en.html', 'r', encoding="UTF-8")
sopa = BeautifulSoup(archivo, 'html.parser')
para elemento en sopa.find_all('img'):
si 'src' en elemento.attrs:
print(element.attrs['src'])
if check_flag(element.attrs[' src']):
#if element.attrs['src'].find("png"):
elemento. attrs['src'] = "michenxxxxxxxxxxxxxxxx" '/' elemento.attrs['src']
print("#################### ###############")
con open('index.html', 'w', encoding="UTF-8") como fp: p>
fp.write(soup.prettify()) # La función de prettify() es reducir sp.prettify() a un estado legible