Obtener el código fuente en línea
Ventajas: Rápido.
Desventajas: 1 Debido a que el servidor lo detecta rápida y fácilmente, puede limitar el rastreo de IP actual. Para este punto, puedes intentar usar el código IP para resolverlo.
2. Si los datos que desea rastrear se encuentran después de cargar la página web, js modifica los elementos de la página web y no se puede rastrear.
3. Si necesita rastrear algunos sitios web grandes, como páginas de inicio de sesión, es posible que necesite descifrar el algoritmo de cifrado de la cuenta del lado del servidor y varios algoritmos de cifrado para probar su tecnicismo.
Escenarios aplicables: la página web es completamente estática y los datos que desea rastrear se cargan cuando la página web se carga por primera vez. Páginas similares que implican operaciones de inicio de sesión o permisos no tienen ningún cifrado de cuenta o simplemente están cifradas.
Por supuesto, si los datos que obtiene de esta página web son json obtenidos a través de la interfaz, entonces estará más feliz y simplemente tomará la página json directamente.
Para una página con inicio de sesión, ¿cómo obtener el código fuente detrás de la página de inicio de sesión?
En primer lugar, quiero presentarles cómo el servidor determina la identidad del usuario cuando la sesión guarda la información de la cuenta.
Primero, después de que el usuario inicie sesión correctamente, el servidor guardará la información de la sesión actual del usuario en sesiones. Cada sesión tiene un identificador único, sessionId. Luego, el usuario visitará esta página y después de crear la sesión, recibirá el ID de sesión devuelto por el servidor y lo guardará en la cookie. Entonces podemos usar el navegador Chrome para abrir el elemento de verificación y ver el jsessionId de la página actual. La próxima vez que el usuario visite una página que requiera iniciar sesión, el ID de sesión se agregará al encabezado de la solicitud enviada por el usuario y el servidor puede determinar la identidad del usuario a través de este ID de sesión.
Aquí, configuro una página de inicio de sesión jsp simple y la información de la cuenta de inicio de sesión se guarda en la sesión del lado del servidor.
Ideas: 1. Iniciar sesión. 2. Obtenga cookies después de iniciar sesión correctamente. 3. Coloque la cookie en el encabezado de la solicitud y envíe la solicitud a la página de inicio de sesión.
Adjunte la versión java del código y python.
Versión Java: