#36
Concuerdo con lo que tú dices.
El big data es la información en bruto y luego hay que trabajarla porque al final aunque te suministren datos hay que hacer análisis exploratorio y transformación / adecuación de variables, imputación de datos, eliminación de outliers... y sobre todo tener claro los datos que quieres / necesitas y el proyecto de investigación.
Sobre la biología...es que claro,cuando tu haces una comparación comparando 1000 genes por ejemplo, para encontrar una significación estadística "no viciada por la probabilidad" tendrías que aplicar bonferroni (o Tuckey).
Si haces bonferroni, pasas de encontrar significación con una p < 0.05 a necesitar una p < 0.00005.
Vamos, que se vuelve "excesivamente" exigente el test.
#38
El problema es la base de datos con la que lo entrenas.
Si tú entrenas con las bases de datos de youtube o twitter donde la gente se dice de todo...pues al final tendrás una IA con comentarios racistas / homofobos / machistas / whatever...
Igual que si le entrenas leyendo únicamente textos marxistas, que saldrá socialista, internacionalista y todo lo que quieras.
Ahora bien, a ver si te crees que tus héroes políticos no tenían defectos (además de ser casi todos burgueses XD)