Red de conocimiento informático - Material del sitio web - Cómo utilizar Python para capturar visitas al blog csdn

Cómo utilizar Python para capturar visitas al blog csdn

Recientemente aprendí Python y los rastreadores y quería escribir un programa para practicar mis habilidades, así que pensé en el tráfico de mi propio blog que a todos les preocupa más y usé Python para obtener el tráfico de mi blog. del proyecto que llevaré a cabo más adelante. Analizaré el tráfico de mi blog en gráficos de líneas y gráficos circulares. Analizaré el tráfico de mi blog y lo visualizaré en forma de gráficos de líneas y gráficos circulares para poder saber más. Claramente, qué blogs tengo reciben más atención, así que no seas un experto en blogs porque yo no lo soy.

Uno de los análisis de URL

Ingrese su propia página de blog, la URL es: patentada; MSIE 5.5 Windows NT)

headers = {'Usuario- Agente ':user_agent}

#Solicitud construida

req = urllib2.Request(myUrl,headers=headers)

#Visita la página

myResponse = urllib2.urlopen(req)

myPage = myResponse.read()

#Buscar si hay una 'última' página en la página Buscar la presencia de la etiqueta 'última página' para determinar si es la última página

notLast = re.findall('last page',myPage,re.S)

print '------ - ----------------------- página %d -----.----------------- -- -----------' % (page_num,)

# Utilice expresiones regulares para obtener el título del blog

title = re.findall('( . *? )' ,miPágina,re.S)

NotLast = re.findall('última página',miPágina,re.S)

imprimir '----- --- ----------------------- página %d --------------------- -- -----.S)

titleList=[]

para elementos en el título:

titleList.append(str(items).lstrip () .rstrip())

# Utilice expresiones regulares para obtener visitas al blog

view = re.findall('Read((. *?))',myPage,re. S)

viewList=[]

para elementos a la vista:

viewList.append(str(items).lstrip().rstrip())

# Resultado de salida

para n en el rango(len(titleList)):

imprimir 'Visitas:%s Título:%s' % (viewList[n ].zfill(4),titleList[n])

#Número de página más 1

num_página = num_página + 1

Aquí hay algunos resultados:

p>

Ingrese el nombre de inicio de sesión de csdn: xingjiarong

--------------------- -- Página 1 - --------------------------------

Visitas:1821 Título.Python Resumen de Plantillas de Programación Comunes

Visitas: 1470 Título: Patrones de diseño UML (1) Diagramas de clases y relaciones entre clases (generalización, implementación, dependencia, asociación, agregación, combinación)

Visitas: 0714 Título: Instalación y crackeo de Ubuntu14.04 MyEclipse2014

>

Visitas.1040 Título: Configuración de Ubuntu14.04 tomcat8

Visitas: 1355 Título: Resumen del método de llamada de Python en Java

Visitas: 0053 Título: Java multiproceso invocable y futuro

Visitas: 1265 Título: Aprende de mí en asamblea (3) La formación de registros y direcciones físicas

Visitas: 1083 Título: Aprende de mí en asamblea (2) Asamblea Wang Shuang construcción del entorno

Número de visitas: 0894 Título: Aprende de mí sobre ensamblaje (1) Conocimientos básicos

Visitas: 2334 Título: Java multithreading (1) Condiciones de carrera y sus causas

Visita: 0700 Título: Conceptos básicos de Matlab Matrix

Visita: 0653 Título: Variables de Matlab, sentencias de rama y sentencias de bucle

Visita: 0440 Título: Procesamiento de cadenas de Matlab

Visita: 0514 Título: Operadores y Operaciones en Matlab

Visita: 0533 Título: Tipos de Datos en Matlab

Visita: 0533 Título: Tipos de Datos en Matlab

Visitas: 0533 Título: Tipos de datos en Matlab

Visitas: 0533 Título: Tipos de datos en Matlab

Visitas: 0533 Título: Tipo de datos en Matlab