Google Books n-gram

elkaoD

Vale, esto iba a ser inicialmente un hilo en el foro de videos, pero creo que puede dar juego.


Erez Lieberman Aiden y Jean-Baptiste Michel son dos profesores de la Universidad de Harvard fundadores del proyecto Cultoromics. Un estudio de la lexicología computacional que se interesa en el comportamiento humano y las tendencias culturales a través del análisis de textos digitalizados.

Gracias a los 15 millones de libros escaneados por Google Books y de la adictiva herramienta
"n-gramas de Google Labs" que te permite buscar palabras en una base de datos del aproximadamente 4% de todos los libros publicados, Aiden y Michel nos muestran en
esta charla TED algunas de los datos sorprendentes que podemos aprender partiendo de 500.000 millones de palabras:

Evolución de las palabras "crisis" y "esperanza" desde el año 1800 hasta el 2000:

Fuente


Os recomiendo que veáis la charla, está curiosa.

La idea del hilo es que pongamos las curiosidades que vamos encontrando. Para ingaugurarlo, entenderéis que nada mejor que "fuck" y "shit".

Que alguien me explique por qué fuck venía dejando de molar desde 1800.

-

Este es curioso... Internet, ¿qué pasó en 1900? ¿Un viajero del futuro que fue asesinado rápidamente por la Policía del Tiempo?

-

Gráfica de "Einstein" en la base de datos en inglés:

Gráfica de "Einstein" en la base de datos en alemán. Fijáos en el "valle" de 1940:

2
LiKaN

1
elkaoD

La Ley de Benford en acción:

6
mlCriS

#1 https://encrypted.google.com/search?q=%22internet%22&tbs=bks:1,cdr:1,cd_min:1800,cd_max:1905&lr=lang_en

por eso sale la palabra Internet cerca del año 1900

1
Cryoned

5
B


qué pasó en el siglo XVIII?

1 respuesta
k4rstico

Es muy bien el programa, graficas como la de Einstein o la de Cryoned son muy curiosas

Petterrr

Pajas de sangre para algunos (Emotional)

1 respuesta
eagLe__

3
Andy

dangerous

¿AK o Colt?

¿Pepsi o Coca-Cola?

1 respuesta
ViCiOuS

Para que digan que la musica clasica esta muerta

MUAHAHAHAHA *entiendase el humor asociado a la imagen

kroaton

2
japuchi

Hola? Y eso de wapens con esos picos? Alucinante... xD

1 respuesta
_KzD_

#14

Los iluminati seguro.

S

Muchas gracias por el threat, me parece muy interesante. Vi el vídeo de TED, siempre me sorprenden muy gratamente, aprendo y me lo paso bien con ello, lo disfruto.

Tres que me han sorprendido:

Peace/War - Tenemos mucho trabajo todavía...

Freedom/Capitalism - ¿Pensáis que va conectado?

Vegetarian/Vegan - La conciencia está creciendo, parece imparable.

1 respuesta
_dabla_

#16 Pace? Paz es 'Peace'... xD

Te inserto las imagenes

Peace vs War

Freedom vs Capitalism

Vegetarian vs Vegan

#18 hecho!

1 1 respuesta
S

#17 Tienes razón. Me equivoqué. Ya lo he arreglado y editado por si también puedes insertar la imagen.

1 respuesta
A

1 1 respuesta
_dabla_

1
_KzD_

#19

Que nos caigan mal no significa que tengamos que ser injustos.

¿Ves? Ahora ya no hay queja posible.

2
c0ng0

no os fieis de las graficas, si os fijais en "wapens" el % que aparece es muy muy muy pequeño.
si no aparece nunca y en 1950 aparece una sola vez va a suponer un pico muy notorio.

Curioso el estudio :) y vuestras propuestas

1 respuesta
A

#22 Es que wapens no es una palabra que se usa a la ligera, tiene que estar wapens de verdad. Bueno eso y que en holandes es armas

Van de la mano:

jose46

http://books.google.com/ngrams/chart?content=bitch&corpus=0&smoothing=3&year_start=1800&year_end=2000

No hase falta desir nada mas...

spoiler
verseker

Esta mola bastante

http://books.google.com/ngrams/graph?content=ciencia&year_start=1500&year_end=2008&corpus=10&smoothing=3

guillauME

He buscado la palabra orco:

ninjachu

Y si hablamos de tipos de trabajos, xD

#28 este parece más actual

1
elkaoD

#6 #8 los datos antes de 1800 creo que son de muy pocos libros, así que la varianza entre años es mucho mayor. No haría mucho caso a las gráficas pre-1800.

#11 coke es un tipo de carbón xD

1 respuesta
menolikeyou

1
kroaton

Buff... en serio... esto, ¿qué coño busca realmente?