Python usa expresiones regulares para extraer la expresión de la URL contenida en el archivo txt
Este formato de intercambio de datos estructurados se analiza mejor de acuerdo con el formato acordado, en lugar de utilizar expresiones regulares, para que los datos en la posición correspondiente en los datos se puedan recuperar con precisión. Así#!/usr/bin/env?python
#-*-?coding:?utf-8?-*-
import?json
con?open('google.txt')?as?f:
obj?=?json.loads(f.read())
urls?=?[e [0]?for?e?in?obj]
print(urls)
Utilicé algunos de los datos que proporcionaste anteriormente para crear un google.txt para realizar pruebas. El resultado es
[u'/terms/1/403bplan.asp']