Cómo leer contenido de otra página usando JavaScript
La razón por la que no se puede obtener directamente es. Puede utilizar el objeto xmlhttp o cualquier tecnología disponible para obtener la página de destino. Pero todo lo que obtienes es una cadena html. También debe analizar la cadena html, y analizar la cadena html es lo que hace el navegador. En resumen, hay que implementar el navegador.
Por supuesto, existen algunos analizadores simples en Java que pueden analizar código HTML relativamente simple. Pero realmente no puedo darle una respuesta definitiva a su solicitud.
Último recurso: puede agregar scripts relevantes a la cadena html obtenida y combinarlos en una nueva cadena html. Luego, el nuevo html se envía al navegador para su análisis. En teoría, esto puede analizar cualquier página web.