Cómo utilizar Python para capturar visitas al blog csdn
Uno de los análisis de URL
Ingrese su propia página de blog, la URL es: patentada; MSIE 5.5 Windows NT)
headers = {'Usuario- Agente ':user_agent}
#Solicitud construida
req = urllib2.Request(myUrl,headers=headers)
#Visita la página
myResponse = urllib2.urlopen(req)
myPage = myResponse.read()
#Buscar si hay una 'última' página en la página Buscar la presencia de la etiqueta 'última página' para determinar si es la última página
notLast = re.findall('last page',myPage,re.S)
print '------ - ----------------------- página %d -----.----------------- -- -----------' % (page_num,)
# Utilice expresiones regulares para obtener el título del blog
title = re.findall('( . *? )' ,miPágina,re.S)
NotLast = re.findall('última página',miPágina,re.S)
imprimir '----- --- ----------------------- página %d --------------------- -- -----.S)
titleList=[]
para elementos en el título:
titleList.append(str(items).lstrip () .rstrip())
# Utilice expresiones regulares para obtener visitas al blog
view = re.findall('Read((. *?))',myPage,re. S)
viewList=[]
para elementos a la vista:
viewList.append(str(items).lstrip().rstrip())
# Resultado de salida
para n en el rango(len(titleList)):
imprimir 'Visitas:%s Título:%s' % (viewList[n ].zfill(4),titleList[n])
#Número de página más 1
num_página = num_página + 1
Aquí hay algunos resultados: p>
p>
Ingrese el nombre de inicio de sesión de csdn: xingjiarong
--------------------- -- Página 1 - --------------------------------
Visitas:1821 Título.Python Resumen de Plantillas de Programación Comunes
Visitas: 1470 Título: Patrones de diseño UML (1) Diagramas de clases y relaciones entre clases (generalización, implementación, dependencia, asociación, agregación, combinación)
Visitas: 0714 Título: Instalación y crackeo de Ubuntu14.04 MyEclipse2014
>
Visitas.1040 Título: Configuración de Ubuntu14.04 tomcat8
Visitas: 1355 Título: Resumen del método de llamada de Python en Java
Visitas: 0053 Título: Java multiproceso invocable y futuro
Visitas: 1265 Título: Aprende de mí en asamblea (3) La formación de registros y direcciones físicas
Visitas: 1083 Título: Aprende de mí en asamblea (2) Asamblea Wang Shuang construcción del entorno
Número de visitas: 0894 Título: Aprende de mí sobre ensamblaje (1) Conocimientos básicos
Visitas: 2334 Título: Java multithreading (1) Condiciones de carrera y sus causas
Visita: 0700 Título: Conceptos básicos de Matlab Matrix
Visita: 0653 Título: Variables de Matlab, sentencias de rama y sentencias de bucle
Visita: 0440 Título: Procesamiento de cadenas de Matlab
Visita: 0514 Título: Operadores y Operaciones en Matlab
Visita: 0533 Título: Tipos de Datos en Matlab
Visita: 0533 Título: Tipos de Datos en Matlab
Visitas: 0533 Título: Tipos de datos en Matlab
Visitas: 0533 Título: Tipos de datos en Matlab
Visitas: 0533 Título: Tipo de datos en Matlab