Microsoft 0, Google 1: Digitalización de libros

B

A través de un comunicado oficial, Microsoft da por cerrado sus proyectos de digitalización de libros Live Search Book y Live Search Academic. Una sorpresiva medida si se tiene en cuenta la envergadura de esta iniciativa que hasta los momentos habia digitalizado más de 750.000 libros e indexado más de 80 millones de artículos de revistas.

Microsoft contaba para esto con un escáner muy avanzado, el Kirtas APT Book Scan 2400. De hecho, las dos empresas habían firmado un acuerdo a principios del 2007 para digitalizar obras protegidas pero suministradas por sus editores. En el anuncio dicen que se han dado cuenta de que el modelo que se habían planteado estaba equivocado e insinúan que los contenidos deben ser producidos y publicados por los mismos editores.

Ellos, dicen, se concentrarán en afinar las herramientas de búsqueda de los contenidos para fortalecer el modelo de negocio. De hecho, dicen que se concentrarán en contenidos que sean más rentables a corto plazo (como los de viajes, por ejemplo). Ofrecen la experiencia y la tecnología para la digitalización a “precios accesibles” a los publicadores y afirman que seguirán haciendo seguimiento al mercado.

Más allá de que es obvio que Google Books gana en esta apuesta, es importante reflexionar sobre las razones que subyacen a esta decisión y acerca de las dificultades que enfrentan los pequeños editores a la hora de digitalizar sus contenidos, ya que los componentes tecnológicos son muy costosos. Apostar porque sean los propios editores los que digitalicen no está mal tampoco, pero el gran reto es que todos los actores se involucren y que sea rentable para todos.

Es un golpe, sin embargo, que una iniciativa como ésta, que hacía de alguna manera contrapeso al imperio Google esté cerrando sus puertas. Los autores recibirán copias de sus obras digitalizadas y la anulación de las restricciones de uso a las que le sometía el contrato. Hablan de apoyar nuevas iniciativas sostenibles, pero ¿quién puede con Goliat? Es mucho lo que hemos de ver aún en este tema, seguro.

(http://www.papelenblanco.com/2008/05/25-microsoft-cierra-su-proyecto-de-digitalizacion-de-libros)

Bueno, era obvio que esto iba a suceder, el poder de digitalización de Google (http://books.google.es/) es alucinante, por ejemplo pongamos este libro es una edición digitalizada del texto, sí, pero además podemos realizar búsquedas de términos en él (cosa que no podemos hacer con una imagen, claro). Aún no sé muy bien qué ocr tiene Google, ni cuánto dinero le ha costado el aparatito, pero es muy muy bueno (lo mejor que existe actualmente).

Otra tema es la digitalización de textos con copyright y sin autorización de los escritores / editores, únicamente omitiendo un porcentaje de páginas del original y sin dar ningún tipo de beneficio... pero ese es otro tema, supongo.

Dod-Evers

Bydiox, no te engañes, tienen monos copiando libros, como los amanuenses en la edad media.

squ4r3

ehm...sencillamente... BRUTAL!

RusTu

En el documental "El mundo según google" salía como lo hacían y me dejó bastante impresionado la verdad. Dentro de poco ni Alejandría ni pollas. Google... bueno, de hecho ya lo es.

EiNh4nDeR

Google dominará el mundo.

Ya puedes incluso tener una agenda médica. Lo que faltaba.

M

a mi me pusieron en clase el documental de #4 y esta bien. cuando les ves "trabajando" a los de google ves que es lo que quieres ser de mayor (no hacen casi na)

Cyph3r

No había leido todo lo que has puesto y cuando he visto qeu se podía buscar en el texto que realmente tendría que ser una imagen he dicho oh my god eso es imposible !! xD

Vaya con google luego leere a ver como lo hacen.

kOnOrZ

Es cojonudo la verdad, lo que más me ha dejado flipando es la búsqueda de términos, ojalá en mi trabajo usáramos ese OCR, nos ahorraría muuuuuuuuuuuuuuuuuucho curro (tanto que no haríamos ni falta ahora que lo pienso :S)

ShAdOw000

WTF?!

#5

Josetxe

#1 hay un enlace en el que se te ha colado el paréntesis.

por cierto, busco el Tipler (libro costoso de fisica) y me dice donde comprarlo pero no veo para echarle un vistazo ni nada :\

Dante88

Valla caña, hay libros como el "como dibujar manga" xD

Voy a buscar el documental ese del que habláis, me ha entrado curiosidad xD

EDIT: GO bibliotecas virtuales xD

MTX_Anubis

#10 porque no está digitalizado, supongo que por temas de copyright o que aún no lo han hecho

EiNh4nDeR

#9

Esta noticia de cuando se anunció:
http://www.elmundo.es/elmundosalud/2008/02/21/medicina/1203617454.html
Y esta de su reciente comienzo:
http://blog.wired.com/wiredscience/2008/05/google-launches.html

1 mes después
B

Lo pongo aquí para no abrir otro tema:

Un millón de libros al alcance de un clic

Google inicia la digitalización de fondos de la Complutense

Todos los libros del mundo al alcance de un clic. O casi todos. Los que se escribirán y los que fueron escritos hace siglos. Los incunables y los absurdos. La buena y la mala literatura. No es una fantasía. En la gran biblioteca virtual que Google quiere construir en Internet se acumulan ya un millón de tomos, escritos en 40 idiomas distintos, digitalizados en un centenar de países, a los que se puede acceder a través del buscador de libros (books.google.es).

Imposible barruntar hasta dónde llegará el almacenaje virtual. No hay límite previsto, según Luis Collado, responsable del área de búsqueda de libros de Google. De momento, 20.000 editoriales y 28 bibliotecas (Oxford, Harvard, Stanford y Nueva York, entre otras) han aceptado la oferta para digitalizar sus fondos y colgarlos en la web desde que la iniciativa se lanzó en 2004.

La primera institución española en sumarse fue la Universidad Complutense de Madrid, seguida de la Biblioteca de Cataluña. "Marcará un antes y un después en el acceso al conocimiento, hoy en día más del 90% de la humanidad no tiene fondos accesibles", indicó el director de la biblioteca Complutense, José Antonio Magán. Una pantalla y una línea telefónica permitirán combatir este desigual acceso al conocimiento. Sin censuras, según Collado. La única diferencia entre países puede depender de las leyes que regulen la propiedad intelectual. Porque el proyecto defiende los derechos de autor. Hay obras de dominio público que pueden descargarse, como los Libros del saber de astronomía, de Alfonso X el Sabio, de los que se reproduce una página en la imagen.

Esta joya se encuentra en la Biblioteca Histórica de la Universidad Complutense, un espacio donde se conservan tesoros científicos y académicos como un poema carolingio de Rabanus Maurus del siglo IX, la Cosmografía de Claudio Ptolomeo (XV), la Biblia políglota (XVI) o un Quijote editado por la Real Academia en el XVIII. Todos ellos, así como sus 725 incunables, podrán consultarse en Internet tras la digitalización iniciada esta semana.

Sin embargo, las obras con copyright permitirán sólo una consulta limitada a ciertos extractos y ofertarán opciones de compra online o listados de librerías cercanas. Es el equivalente a hojear un volumen en una librería, comparó Collado. En puridad, serán ojeados.

http://www.elpais.com/articulo/cultura/millon/libros/alcance/clic/elpepucul/20080703elpepicul_10/Tes

Usuarios habituales