Red de conocimiento informático - Material del sitio web - Cómo leer contenido de otra página usando JavaScript

Cómo leer contenido de otra página usando JavaScript

Para hacer esto, primero debe resolver el problema entre dominios del navegador. Es decir. No se puede acceder directamente a JavaScript en diferentes URL. En otras palabras, es difícil obtener el objeto de estructura de la página de destino directamente en su página.

La razón por la que no se puede obtener directamente es. Puede utilizar el objeto xmlhttp o cualquier tecnología disponible para obtener la página de destino. Pero todo lo que obtienes es una cadena html. También debe analizar la cadena html, y analizar la cadena html es lo que hace el navegador. En resumen, hay que implementar el navegador.

Por supuesto, existen algunos analizadores simples en Java que pueden analizar código HTML relativamente simple. Pero realmente no puedo darle una respuesta definitiva a su solicitud.

Último recurso: puede agregar scripts relevantes a la cadena html obtenida y combinarlos en una nueva cadena html. Luego, el nuevo html se envía al navegador para su análisis. En teoría, esto puede analizar cualquier página web.