Red de conocimiento informático - Aprendizaje de código fuente - Convertir WORD a HTML Eliminar código basura

Convertir WORD a HTML Eliminar código basura

// Borra el formato redundante en WORD y pega

función cleanAndPaste( html ) {

// Elimina todas las etiquetas SPAN

html = html.replace(/ < \/?replace(/<(\w[^>]*) style="([^"]*)"([^>]*)/gi, "<$1$3") ;

// Eliminar atributos de idioma

html = html.replace(/<(\w[^>]*) lang=([^ |>]*)([^>]*)/gi , "<$1$3") ;

// Elimina elementos y declaraciones XML

html = html.replace(/<\??xml[^>]*>/gi, " ") ;

// Eliminar etiquetas con declaraciones de espacio de nombres XML:

html = html.Read(/<\?replace( / <\/? \w+:[^>]*>/gi, "")

// Reemplazar

html = html.replace(/?/, " " );

// Convierte

a

var re = new RegExp("(]*>. *? ) ( )"", "gi");//Diferente debido a un error de IE 5.0

html = html.replace( re, ""

insertarHTML( html );

}