Revisar código HTML en Java

tOWERR

Buenas amigos, mi duda es la siguiente:

Tengo un plugin CKEditor el cual utilizo para realizar plantillas en la web, esto me genera un un código HTML, el cual después lo convierto a PDF. Hasta aquí bien.

El problema le tengo que al generar el template tengo problemas con los códigos, como por ejemplo, el " que es la doble comilla, con el > que es el símbolo mayor que, etc. Me gustaría saber si hay alguna librería en Java que al pasarle el código HTML como texto y lo revise y sustituya estos código por los símbolos correspondientes, es decir, si encuentra &quot, que lo sustituya por la doble comilla y así sucesivamente.

¿Alguien sabe si existe algo?Debe de ser en Java.

Un saludo.

tOWERR

Ya encontré algo para solucionar mi problema, es una librería llamada "StringEscapeUtils" que tiene un método llamado "unescapehtml(String text)" que se encarga de codificar el código html a texto normal.

Podéis cerrar el post, gracias.

Usuarios habituales

  • tOWERR