Sobre Open Office

integra2

Buenas , me he descargado este prgrama que tiene casi las mismas funciones que el windows office , pero no se si los 2 programas son compatibles , es deci podria abrir un documento de open writer en word ?(estoy haciendo un trabajo para informatica en casa y nose si en el ordenador del curso m sera compatible)

Gracias de antemano.

MrNobody

Lo que hagas con el openoffice lo guardas como documento word y ya esta , asi te lo leera el office del curso

Y

Aunque supuestamente los nuevos Microsoft office vendrán compatibles con odt (el formato nativo de Open Office) los programas actuales no lo son. Entonces, antes de guardar los documentos en doc, te recomiendo que los guardes en rtf. Porque?, es simple, el formato doc es un formato cerrado cuya posibilidad de escribir con otros programas que nosean el Microsoft Office, ha sido gracias al a ingenieria inversa. Por lo tanto, no deja de ser compatible, pero no es compatible del todo.

Sin embargo, el rtf es un formato de texto enriquecido compatible con todos los procesadores de texto. En este formato no tendrás ningún problema en pasar tus documentos de una suite como es el Open Office a otra como es el de Microsoft Office y viceversa

integra2

Muchas Gracias por la informacion ^^

tRaLlAdOr

Hay algo en open office o por el estilo parecido al publisher ( es que para hacer etiquetas i demas m va de pm, lo veo mu sencillo )

Sandevil

Hombre, un programa que tiene la misma funcionalidad final que el publisher, el scribus, pero no tiene compatilidad con el primero(lo cual me parece totalmente correcto).

Y estas de suerte ya que han sacado version para windows hace algunas semanas.

spakz

Yo suelo utilizar OpenOffice para hacer los documentos; primero los guardo en rtf y luego en doc para evitar incompatibilidades (necesito tenerlos en doc para poder hacerlos pdf con el "Convert doc to pdf")

Y

Con open office puedes exportar los documentos directamente a pdf. La exportación es nativa y lo realiza en formato pdf 1.4

B

Yohnah tú te has fijado qué texto coge el google para usarlo como título de sus resultados ¿?¿

Sabes a lo que me refiero ? Te lo comento porque pareces el que más se ha podido fijar en eso

Yo es que mandé un mail a google y la respuesta fue algo como "Google determina el título de los PDF a partir de la información que recoge en la página", y me quede igual. O no entendieron la pregunta, o la respuesta es secreta.

Y

Si te refieres a como obtener los datos de los pdf, o de los títulos. Osea, cuando haces una búsqueda y él te devuelve los resultados indicando que es un pdf, es muy sencillo.

Como sabrás, google utiliza linux y una caché, y en linux la potencia de los comandos es impresionante tanto, que al php por ejemplo (u cualquier otro sistema de script para web como perl por ejemplo) pueden realizar una ejecución a la shell y ejecutar aplicaciones como "file" que devuelve la información de un fichero, o de "pdftotext" que convierte un archivo pdf a texto y ser devueltos a una variable a través de una simple pipe (o tubería), o un volcado directo a la variable (o guardando el resultado en un simple fichero y luego leyendo el contenido de dicho fichero)

Yo una vez programé algo parecido como lo que hace google, pero no era un buscador basado en un spider, simplemente, en una página se tenian unos archivos en pdf y había un buscador. Simplemente cree una base de datos donde guardaban todo el texto de los pdf, así cuando se realizaran búsquedas simplemente buscaba en la base de datos a que fichero en pdf correspondía (algo parecido hace google).

En php simplemente ejecutaba

shell_exec("pdftotext archivo.pdf archivo.txt");

acto seguido tenía el pdf convertido a texto, que es lo que me interesaba almacenar en la base de datos.

Por cierto, si a pdftotext le pasas la opción --htmlmeta te genera un fichero html:

pdftotext --htmlmeta archivo.pdf archivo.htm

Que curiosamente, muestra el mismo formato que google cuando muestra los pdf en html ;).

Y para obtener el tipo de pdf, simplemente con ejecutar
file archivo.pdf

te devuelve el tipo:

ejemplo un archivo pdf mio me devuelve "PDF document, version 1.5"

Espero que te haya respondido la duda, aunque de todas formas, la posibilidad que sea así como lo hace google, es una suposición. Quizás tengan otras herramientas con la cual parseen mejor los pdf, o hayan generado alguna librería específica para php que realice la lectura de los pdf, pero vamos, que así seguro que se entiende la idea ;)

Usuarios habituales