¡Utilice JAVA para leer tablas de archivos HTML! public classReadHtml2 { publicstatic void main(String[] args) lanza IOException {//String strUrl=" /?reg&tpl=mn" /// URL url=new URL( strUrl); new File("fortest.htm"); /// Flujo de entrada /// InputStreamReader isr=newInputStreamReader(url.isr=newInputStreamReader(url. openStream()); InputStreamReader isr1= newInputStreamReader(new FileInputStream(f)); BufferedReader br =new BufferedReader(isr1); //convierte el html en String String s; String AllContent=""; while((s=br.readLine())! =null) { AllContent=AllContent+s } //.. .//Utilice el control de analizador post-HTML Parser myParser; NodeList nodeList = null; myParser =Parser.createParser(AllContent, "utf -8"); lastFilter.setPredicates( newNodeFilter[] { tableFilter }); try { // Obtener la lista de nodos etiquetados como tabla nodeList = myParser.parse(lastFilter); // Recorrer cada tabla for (int i = 0; i <=nodeList. tamaño (); i++) { if (nodeList.elementAt(i)instancia de TableTag) { Etiqueta TableTag = (TableTag)nodeList.elementAt(i); filas =tag.getRows(); -----------------------tabla "+i+"---------------------- ---------"); // Recorre cada fila for (int j = 0; j
. getStringText());// (salida en el formato que desee) } }.}}}} catch (ParserException e) { e.printStackTrace();
. getStringText());// (salida en el formato que desee) } }.}}}} catch (ParserException e) { e.printStackTrace();