Cómo utilizar jsoup para analizar HTML y obtener código fuente HTML
Las siguientes son varias formas de obtener objetos Documento.
Analizar Dom desde Cadena
Usando el método de clase parse(String html) de Jsoup, puede obtener el objeto Documento de la cadena y luego analizarlo en detalle.
Obtener el objeto Documento de la URL
El método connect(String url) obtendrá una instancia de la clase Connection, que es una subclase de HttpConnection, y luego llamará a get( ), que enviará solicitudes de obtención y devolverá un objeto Documento. De manera similar, también podemos obtenerlo a través de post(), que depende principalmente de si nuestro tipo de solicitud es get o post. Si la solicitud requiere parámetros, podemos usar Map
Obtener el objeto Documento del archivo
Cuando tenemos un archivo html local, podemos usar el método parse(File in, String charsetName) para obtener el objeto Documento del archivo local. archivo.