Data & Gaming | #01 | O como sacar datos también puede ser divertido

richmonde

Lo prometido es deuda… y como dije en uno de los hilos de las entrevistas, me he animado a crear un hilo para describir un poco como es el mundillo en el que me muevo y que, quizá, puede servirle a alguien como inspiración para ello.

Introducción

¿Trabajar en “Data”?, ¿Qué es eso?

Desde hace unos pocos años, a raíz de muchos hechos recientes en el mundo (pandemia, precariedad laboral, necesidad de mejorar procesos, optimización, reorganizaciones, crecimiento empresarial) y el boom de la digitalización (internet, moviles, apps, smart TV, SaaS, etc…), se ha generado un volumen de datos de tamaño quasi incuantificable. En la TV te lo anuncian como “Big Data”, “Cloud”, etc… como si fuese tecnología alienígena.

La realidad es mucho más simple.

Todas estas aplicaciones, navegación, servicios, generan un tráfico de datos de los usuarios o clientes, que hasta no demasiado, eran simplemente espacio ocupado en bases de datos. Cada vez esas bases de datos tenían un tamaño mayor, y mayor, y… puedo seguir. Si, cada vez más mastodóntico.

Dada la situación de muchas empresas y los volúmenes de datos, los mecanismos tradicionales para consultar esos datos y posteriormente generar información, se antojaban complicados. Y ya no solo el hacer esos pasos, sino el propio almacenaje, y posterior tratamiento para limpiar esos datos era cada vez más costoso.

Con ese escenario, se dieron las variables perfectas para el nacimiento de unas de las profesiones que a día de hoy, son de las mejores remuneradas, más demandadas, y en esencia, lo que hoy en día te venden como unicornios.

¿Quieres trabajar desde casa? ¿Quieres ganar 50.000€ en menos de 3 años? ¿Estar a la última en el mercado laboral?... “Ven a este bootcamp de Data Engineering/Analysis/Science/Architect/etc…”

Sí, es un unicornio, pero no todo tiene tanto brilli brilli.

¡Vamos a desgranar un poco qué es este mundillo!

¿Qué es un Data Analyst/Scientist/Engineer/Architect?

Como podéis ver, definir en una palabra o una sola frase cualquiera de estas profesiones, se antoja harto complicado… Pero si tuviese que resumir un poco el espectro general de esas profesiones…

“Es un profesional que utiliza conocimientos en matemáticas, estadísticas, programación y habilidades de captación, procesamiento, almacenamiento y análisis de datos para extraer información valiosa de grandes conjuntos de datos. Dichos conjuntos de datos deberán estar apropiadamente distribuídos y limpios, de modo que su posterior análisis e interpretación, se pueda usar para tomar decisiones informadas y resolver problemas complejos en diversas áreas.”

Vale, pero… ¿donde puedo trabajar con estos estudios?

Virtualmente hablando… puedes trabajar donde quieras.

“Sí. Lo sé. Suena jodidamente ideal, a la par que ambiguo. Si puedo trabajar en cualquier sitio… porque no encuentro trabajo?”

Un Data X (en adelante, para referirme a cualquier profesión derivada de Data) puede trabajar en cualquier sector laboral, desde funcionario, hasta CTO. Desde el tratamiento de una planta de residuos, hasta hacer un sistema de predicción para operar ETFs. Desde gestionar sistemas de optimización de pedidos en un supermercado, hasta calcular en qué momento deberías ganar una tirada en tragaperras físicas o online.

Pero… Y ¿en gaming?

Un Data X en el sector de los videojuegos se encarga de procesar, limpiar, y/o analizar grandes volúmenes de datos generados por los usuarios para mejorar la experiencia de juego, optimizar el diseño de juegos y maximizar los ingresos, entre otras muchas labores (esto, dependiendo de qué profesión dentro de Data).

En el caso de Data Architech y Data Engineer, se trata de roles muy centrados en la extracción, almacenamiento de datos (ya sean telemetría técnica de los juegos, sea del comportamiento de los jugadores, sea de las pasarelas de compra, etc…), y el posterior tratamiento para dar una estructura organizada en toda esta información en modelos de almacenamiento que sean “fácilmente” escalables, eficientes en cuanto al acceso a la información, y que contengan la información relevante para que el siguiente equipo de datos pueda hacer bien su faena.

En el caso del Data Science y Data Analysis, se trata de un rol muy centrado en los datos, pero que tiende a estar en todos y cada uno de los puntos del desarrollo tanto de un producto (juego), como cualquier mejora en el mismo (UI/UX, arte, nuevas funcionalidades, balance de la economía, organización de los tutoriales, cuando mostrar cada funcionalidad, mejora, arma, skill, etc…)

En los casos de Analysis y Science, ambos son roles que están codo con codo con el equipo de Producción, el equipo de Producto (no confundirlos, son dos equipos independientes), y en esencia, es una especie de “Piedra roseta” o “Piedra angular” donde todo pasa por ese rol.

  • Porqué "Piedra rosetta" > Se espera de dicho rol, el descubrir el conocimiento oculto (en los datos) para poder entender muchas incógnitas (comportamiento, tendencias, expectativas, ...) y poder crecer con dicho conocimiento.
  • Porqué "Piedra angular" > Porque es una de las bases de crecimiento de una estructura grande. Todo equipo, producto, empresa, requiere de diferentes roles, especialidades para que funcione todo bien. Desarrolladores, márketing, producto, Q&A, support, CM's, ejecutiva... pero para poder conectar todas las partes y tomar buenas decisiones, se requiere de un rol que este en medio de todo el meollo, sintetice los datos y los transforme en conocimientos, recomendaciones, acciones, experimentación, y en definitiva, dirección al éxito.

Como podréis ver en este post, intentaré abarcar un poco de todo, sin poder profundizar mucho en detalle, pero dando la visión más global posible.

Por otro lado, escribir todo esto en forma de post me da un poco de urticaria, ya que mi rol y mi especialidad (en el trabajo) es poder decir todo esto en menos de 10 slides, pero como no todo el mundo puede absorber tanta densidad de contenido sintetizado en esas slides, lo haré así :)

¿Qué necesito estudiar y/o aprender para trabajar en ello?

Formación deseada

Formación relacionada con las matemáticas, la estadística, y la programación son tres de los grandes pilares que son necesarios, no todos ellos siendo PhD, pero si que a lo largo de la carrera laboral o formación, se debería adquirir dicho conocimiento.

Reglado (de menor a mayor importancia - más formación suele acarrear mejores resultados, pero eso es una vez dentro de la industria, no como entry point)

  • Bootcamps relacionados con Data
  • Cursos y formación certificada tipo Udemy, Coursera, etc...
  • Grado en Ciencias de la Computación, Ingeniería Informática, Matemáticas, Estadística o campos relacionados.
  • Máster o Doctorado en Ciencia de Datos, Inteligencia Artificial, o áreas afines es altamente valorado.

Cabe remarcar que son los puntos clave, pero ello no implica conseguir un curro de esto, y viceversa; Sin tener esta formación reglada pero superando pruebas técnicas, poder alcanzarlo.

Lo que está más claro que el agua, es que para estas profesiones debes soñar en SQL, R, Python, y tener estadística y matemáticas en las venas fluyendo. Para arrancar no es critico, pero para crecer es un must ineludible.

Tecnologías usadas habitualmente (las más usadas/extendidas, pero hay más)

  • Programación (Muy necesarias, como el respirar)
    • Python, R
  • Bases de datos (Muy necesarias, como el respirar)
    • SQL: AWS, BigQuery, Snowflake
    • NoSQL: MongoDB, Redis, Neo4j
  • Herramientas de Big Data
    • Hadoop
    • Spark
  • Análisis y visualización de datos
    • Herramientas de 3ºs: Looker, Tableau, PowerBI, D3.js
    • Python: Matplotlib, Seaborn, Altair-Vega
    • R: GGplot2 (la que conozco, soy Python user), ggplot2, Knitr y Rmarkdown, Quarto (para hacer notebooks y publicar), Shiny
  • Modelado estadístico y algoritmos de machine learning: Scikit-learn, TensorFlow, Keras, PyTorch
    • Bibliotecas: TensorFlow, Keras, PyTorch
    • Plataformas: Azure ML, Google AI Platform

Como podéis observar, el abanico de tecnología es absurdamente amplio, y posiblemente en unos años, la mitad de las cosas que cito aquí o bien tengan reemplazo, esten outdated, o haya salido tecnología nueva y formatos nuevos de visualizar información que requieran algo diametralmente diferente a lo mencionado.

Añadir, como “novedad” y el citado elefante en la sala…

  • AI Supporters, como Copilot, ChatGPT, LLM’s especializados en áreas específicas, GenAI models para resumir emails, presentaciones, etc…

Al final, es una herramienta más que si la sabéis utilizar, os hará la vida infinitamente más fácil, si se le da el uso en el caso de uso específico para el que es útil.

Habilidades necesarias

  • Pensamiento analítico y crítico
    • Saber sintetizar la información, saber qué buscar, que descartar, que es ruido, y que es relevante.
  • Comunicación efectiva
    • Habilidad para saber presentar información extremadamente especializada, en un formato coloquial, adaptar el mensaje y el contenido a la audiencia, y saber cómo desgranar la información de los datos.
    • Ser capaz de responder bien a la tensión de presentar, generalmente, a personas que van a creerse ciegamente y casi dogmáticamente lo que les vayas a decir. Para esas personas eres un mesías que guía el camino, y dichas personas las que lideran la marcha en la dirección que les has mandado.
  • Trabajo en equipo y colaboración
  • Capacidad para resolver problemas complejos

¿Qué se espera de estos roles?

Como he dicho anteriormente, en el caso de los juegos se generan una burrada de datos inimaginables, aunque se puede extrapolar a muchos otros campos. Y pese a ello, hay juegos que generan un volumen de información que no tienen nada que envidiar, o incluso competir de igual a igual con por ejemplo, Amazon.

Dicha cantidad de datos puede arrojar una información que puede valer perfectamente su peso en oro, mucho oro.

  • Cómo los jugadores interaccionan con los menus, el juego, otros jugadores, preferencias de uso de elementos del juego, posicionamiento, estrategias, etc…
  • Sabiendo la información previa, generar simulaciones de comportamiento, tendencias de actividad, gustos, patrones de comportamiento en grandes/pequeños grupos
    • Saber cuando vas a dejar de jugar, cuando vas a enfadarte con algo, cuando algo es muy dificil para ti, cuando te estas aburriendo, etc…
    • Quienes son tus referentes, contra que tipo de rivales tienes más probabilidades de estar mas tiempo
    • Saber cuando vas a comprar un producto en el juego, a que precio, con que frecuencia repetirás compra, y si vas a incrementar el gasto por compra o no
  • Con esa información, poder realizar mejoras y cambios experimentales y saber con exactitud si serán buenos o malos cambios.

Todos estos puntos, son algunos de los elementos más relevantes que permiten saber, operar, y actuar como tal para mejorar los productos.

Desde luego, esto es un ejemplo de muchas de las cosas que se pueden hacer, y ello conlleva tiempo y esfuerzo. Entiendo que muchos vais a tener preguntas, querer saber más, y quizá informaros un poco de esto.

Resta decir, que esta información de datos procesados, es extrapolable 1:1 a cualquier ámbito.

  • Donde pone juego, poned Netflix
  • Donde pone Netflix, poned Productos en Liquidación de Mercadona.
  • Donde pone Productos en Liquidación de Mercadona, poned “Ticket de compra online en Amazon”.
  • Donde pone eso, poned evaluación de manos ganadoras en el casino del Barrio gestionado por Inverama (por poner un ejemplo).

Esto es el “Puedes trabajar donde quieras”.

En resumen...

Si estáis haciendo BBDD, o matemáticas, o estadística, o programación para cloud, sabed que hay MUCHO trabajo disponible de esto, y encima... en el mundillo de los videojuegos.

A veces, es mejor separar el ocio del trabajo... pero el día que tu trabajo se convierte en ocio y te pagan por ello... ese día dejas de "trabajar" (obviamente, hay responsabilidades).

Quién ha trabajado de aquello que le gusta... conoce la sensación.

En los próximos días abriré otro hilo para los afines a la misma escuela, y los que quieran aprender más sobre esto... y espero que el hilo os haya parecido interesante. Veremos si podemos hacer comunidad con esto!

Stay tuned!


@Jastro lo he puesto con la etiqueta "Código", pero no se cual de las que hay aplica mejor. Quizá crear más subcategorías en Desarrollo y diseño sería buena idea. "Comunidad", "Formación", etc... Ahí te dejo unas ideas!

Por otro lado, si crees que este contenido encaja más en "Estudios y Trabajo", muevelo ahí sin problemas! :thumbsup:

@eXtreM3 @Sphere @Maaarc @refresco que recuerdo que estábais interesados en ello (por lo que recuerdo en otros hilos) - Si no es así, avisad y os quito la cita! :D

En no mucho, haré un par de hilos con ejemplos de cosas relevantes, usando o bien fake data, o como evaluar casos prácticos.


44
hda

¿Qué maravilla es esta? A por ello que voy.

Gracias de antemano por el hilo :)


Edit: Lo dicho, un placer leerte. Creo que a mucha gente le puede venir muy bien este introducción que nos compartes. ¡Gracias de nuevo! A la espera de los otros hilos quedo :D

Pd: no me ha llegado el quote. Creo que lo máximo en MV son 5 citaciones en el mismo post.

2
eXtreM3

De verdad que algunos usuarios sois gloria bendita. Enhorabuena por el hilo y por acordarte y citarme jejeje, a favoritos directo.

2
R

graxx.

A mi ahora mismo es cierto que me llaman mas y me contactan algo mas por linkedin pero el interes no pasa de ahi y no se materializa en nada. A ver si consig llegar a los 30k€ y te regalo un juego de steam.

p.s. muerte a los masters

Dr_Manhattan

Muy currado el hilo, muchas gracias, fijo que ayuda a aclarar las ideas de mucha gente.

Una cosilla, ya que has nombrado Spark, yo metería también Scala en el apartado de "Programación", es cierto que se usa mucho PySpark, pero las empresas que hacen un uso intensivo de Spark lo hacen con Scala, además está bien pagado.

Yo creo que un hilo que acompañaría muy bien a este sería otro para hablar de las arquitecturas cloud y servicios más comunes de big data, ej: databricks, adls, adf, kafka, delta tables. Pero vamos, si nos metemos ahí no terminamos nunca.

Lo dicho, muchas gracias por tomarte el tiempo de crear el hilo, si necesitas ayuda para esos futuros hilos cuenta conmigo

1
FlameThrower

Veo Java y Java Script (por separado, OJO, debe ser algo nuevo) en ese diagrama de Venn y me dan ganas de tirarme por la ventana. En la parte de data engineer nada más y nada menos.

NSFW
1 2 respuestas
Dr_Manhattan

#6 coincido con lo de SQL, muy necesario, lo de estadística lo dice en varios puntos

1 respuesta
FlameThrower

#7 si ya lo corregí. De cualquier forma MUCHA estadística.

1 1 respuesta
richmonde

#6 Muy buenos apuntes. Luego edito #1 en el PC, que acabo de llegar a casa y he de hacer la cena.

Sobre Quarto y los Notebooks, x1000 es la jodida gloria. Adios a reports manuales. Markdown, publicar, y queda jodidamente profesional, a la par que reutilizable sin tener que editar a mano todo.

1 respuesta
FlameThrower

#9 Yo todavía no he hecho ninguno con Quarto porque me quedé en Rmarkdown, que es muy similar, pero en cuanto tenga un rato me voy a actualizar ahora que acaba de salir al versión 1.0.

1 respuesta
richmonde

#10 Yo desde la experiencia de usarlo con los Jupyter NB, que ya el propio formato del NB acompaña al markdown de la mano, puedo dar fe que es una maravilla.

1
FlameThrower

A claro, que ahora soporta todo, R, Python y Jupyter.

Maaarc

Post muy interesante y una buena presentación de los distintos roles. Añadiría algo sobre MLOps y sobre demos frameworks como streamlit/shiny.

Y remarcar las softskills, como data analyst son lo que marcan el éxito o fracaso de cualquier proyecto de data. Te van a hacer más efectivo y útil.

1 2 respuestas
richmonde

#13 Si, ese punto es importantisimo.

Como digo, resumir todo en un post se hace jodido. Pero desde luego, la idea es crear mas adelante un “hub” de estos hilos, poniendo luego un hilo especifico para cada rama, o por lo menos, la parte de Eng/Arc, otra para DA/DS, y otra ML/AI, cada vez hay mas roles del 3r grupo.

R

Ahora falta otro tema de que decir en las entrevistas/CV usando jerga que les gusta a los de recursos humanos.

Desarrollador de pyspark---> amplia experiencia en el desarrollo de pipelines altamente eficientes con pyspark que permitieron un incremento en blablabla... Xd

AloRoma

Que hilo interesante. Me atrevo a participar a pesar de no estar muy informado y dedicarme a un rubro totalmente distinto, pero que en mucha menor escala también realiza analisis de datos para su compañia.

Tengo una pregunta que tal vez puede ser considerada una crítica a la profesión, pero mis motivos son únicamente conocer más, y que mejor que de mano de alguien que se dedica a ello.

Crees que el análisis de datos en grandes desarrolladoras sea el culpable de que durante años se haya perdido la magia o calidad en los AAA? Asumo que debe haber un equipo de analistas que identificó hace algún tiempo que cierto tipo de juegos de servicio eran los que generaban mayores ingresos y a partir de allí algunas grandes desarrolladoras intentaron replicar la formula ganadora (sin éxito evidentemente), dejando de lado proyectos que podrían haber sido mejores en calidad?

Entiendo que finalmente estas decisiones dependen de cómo los corpos interpreten y utilicen la información recopilada por los analistas, pero no deja de parecerme un arma de doble filo.

En ese mismo sentido; y tal vez cayendo en una paranoia injustificada, es posible que algunas de las -sorpresas- que han ido apareciendo y que llegarán en el futuro estén también planificadas al detalle? Es decir, que no son juego hechos por pasión y amor al arte sino producto de algún reporte de datos que indica que cada x años el cansancio sobre los videojuegos mainstream llega a su pico y es el momento perfecto para sacar algún indie pequeñito que revolucione un par de cosas y triunfe ahí donde todo lo demás está fracasando?

2 respuestas
Dr_Manhattan

#16 el desarrollo de videojuegos es un negocio, los negocios tienen como finalidad ganar dinero, en los inicios no era así, pero hace años que sí. Ya pasó antes con la música o el cine, es todo fórmula.

Si quieres evitar esto un poco, lo mejor es ir a lo indie

Alien_crrpt

Las IA dejarán en el paro a todo el mundo. Solo quedarán las profesiones antiguas, obrero, reparador de lo que sea. Todo lo que no pueda hacer un ordenador.

Y esto de la Big Data lo hará una IA 10000000000000 mejor que un humano. Solo hará falta un humano que no necesitara ni estudios. Solo preguntar lo que le interesa a la empresa. ( Ya no hay gente sin estudios ) Con ser listo y tener algo de estudios es suficiente.

2 respuestas
DevilJin

Bastante bien, para mi gusto añadiría temas de dwh y etls xD

Pero bastante bien

FlameThrower

#18 el big data hace años que se superó, nadie habla de big data hoy en dia, excepto la gente no informada.

Ahora pregúntate como se entrena la IA...

1 respuesta
Alien_crrpt

#20 Pues hoy en día con la gente que le pregunta a la IA + los robot recolectores de información de la web.

2 respuestas
FlameThrower

#21 No, con pipelines gigantes creados por ingenieros de datos. Y como se desarrolla la IA? Con equipos de datos, la IA no sé entrena sola.

¿Quien mantiene los miles de sistemas que se usan para entrenar los LLMs? Ingenieros de sistemas, gente de mlops, etc.

1
PhDfailer

Buen hilo rich, da gusto este contenido

2
Calzeta

Muchas gracias por el hilo, rich. Staying tuned.

1
richmonde

#8 #13 Editado con la información que habéis puesto. Que el finde he estado fuera todo el tiempo al final, y desde el movil es un engorro xD


#16 te respondo por partes!

#16AloRoma:

Crees que el análisis de datos en grandes desarrolladoras sea el culpable de que durante años se haya perdido la magia o calidad en los AAA

La respuesta a esto es simple. No. El análisis de datos no es el culpable. Los datos lo que muestran son hechos, posibles tendencias si las hay, y en esencia, cosas que pueden ser, son, o han sido.
Un arma dispara balas. Si le da a una persona o a un objeto depende de quien la empuñe y quien la dispare y contra que. El arma, son los datos.

Ahora bien, si estan en manos de un diseñador de gameplay, o un ejecutivo, esos mismos datos serán interpretados de dos modos diferentes.

#16AloRoma:

Asumo que debe haber un equipo de analistas que identificó hace algún tiempo que cierto tipo de juegos de servicio eran los que generaban mayores ingresos y a partir de allí algunas grandes desarrolladoras intentaron replicar la formula ganadora (sin éxito evidentemente), dejando de lado proyectos que podrían haber sido mejores en calidad?

Si, si, y no necesariamente.

  • Si, en todas las empresas de contenido audioviosual, entretenimiento, y en esencia a día de hoy, en todas partes... hay equipos de datos. En donde estoy trabajando actualmente, entre todos los estudios que hay y todas las empresas (solo gaming), sumamos más de 1300 Data Scientist, Analyst, MLOps, AI Specialist, etc... entre sus diferentes roles y seniorities. Y todos tenemos el mismo goal. Mostrar el "conocimiento" accionable, pero sin hacer juicios o condicionar, ya que como digo, son los hechos los que hay que dar, no los "deseos".
  • Es un hecho palpable que los GaaS son una fuente de dinero bestial y una apuesta MUY buena, tanto como producto de entretenimiento y como inversión... Solo si, sabes cuando hacerlos, como hacerlos, saber a quien va dirigido, saber cuando sacarlos, y teniendo muy muy muy claro que el modelo de negocio es completamente diferente al "videojuego tradicional". Si no se cumple que todo lo anterior lo hagas cuando toca... tienes un buen pufo y un cráter económico que vas a flipar para tapar eso.
  • El ultimo punto, lo de los proyectos apartados... depende. Si hoy sacas un Sims 5, posiblemente se estampe. Si sacas un Gears of War GaaS, es posible que salga bien, pero quizá es un juego muy nicho. Si sacas un Fortnite alike, seguramente te estampes. Cada proyecto tiene su momento de salir, y en esta industria en concreto, tienes que adivinar 3-6 años ANTES qué va a ser trending, que va a gustar, que género hacer, y a que target quieres llegar... ya que hacer un AAA son 3-6 años de desarrollo.
#16AloRoma:

Entiendo que finalmente estas decisiones dependen de cómo los corpos interpreten y utilicen la información recopilada por los analistas, pero no deja de parecerme un arma de doble filo.

Al final las decisiones son tomadas por el equipo ejecutivo. Al menos, las grandes como el destinar $2.000.000 al mes para un proyecto que PUEDE no funcionar.

#16AloRoma:

En ese mismo sentido; y tal vez cayendo en una paranoia injustificada, es posible que algunas de las -sorpresas- que han ido apareciendo y que llegarán en el futuro estén también planificadas al detalle? Es decir, que no son juego hechos por pasión y amor al arte sino producto de algún reporte de datos que indica que cada x años el cansancio sobre los videojuegos mainstream llega a su pico y es el momento perfecto para sacar algún indie pequeñito que revolucione un par de cosas y triunfe ahí donde todo lo demás está fracasando?

Como dije lineas atrás, hoy en día TODO esta analizado. Desde cuantos minutos tienes whatsapp abierto, con qué contacto hablas más, quienes son contactos de tu contacto. A que horas vas a cagar (por el hecho de ver el patron de conexion a un juego N de 10.33 a 10.54, y ver los niveles que has avanzado, cuantas veces escuchas una canción en spotify, itunes, youtube, etc...)

Los juegos, no son diferente, incluso los AAA single player. Si un jugador se atasca en un puzzle que es muy dificil (por los tiempos de resolucion de la seccion X del juego), al poco tiempo haran un parche para que ese puzzle tenga una layout mas fácil de resolver (por decir un ejemplo).


#18 #21 Este hilo está en la sección de Software y Hardware, no es offtopic. Es un hilo (de muchos que será) educativo, formación y/o para quienes quieran saber sobre el tema, o quieran aprender sobre el tema.

Si no tienes que aportar te pediría que antes de soltar cuñadeces de barra de bar, educadamente dejes de participar.

Complementa, critica, sugiere, como han hecho todos los demás. Pero no vengas a ensuciar el hilo, ya que en ese caso pediré que pasen la escoba sin miramientos.

Gracias :)

1
RSN

El contenido es brutal y eres una persona que junta dos cosas extrañas para un programador, tienes muchos conocimientos y sabes explicarlos para que los entienda prácticamente cualquiera.

1 2 respuestas
hda

#26 justo esa es una cualidad importante para los científicos de datos. Y estoy contigo, @richmonde sobresale en ello.

1 1 respuesta
richmonde

#27 #26 Venga va, no seáis pelotas hahahaha gracias!

Pero estoy de acuerdo en ese punto. Una de las cualidades importantes para un DA/DS (o según a quién le preguntes, la que más) es saber coger toda la información que te ha dado el análisis, modelo, etc... y confeccionar un hilo conductor sin sesgos, con conocimiento del producto, de la industria de la que trata, el contexto temporal de cada cosa que influye en ese resultado, y una vez lo tienes todo hilado, saber como comunicarlo adaptando el mensaje a la audiencia a la que va dirigido.

En mi caso, ha habido veces que he hecho 3 veces la misma presentación:

  • Una para el equipo de Data, con un énfasis bestial en la precisión de los datos, como se han sacado, que te ha tenido en cuenta, que otra información ha aportado que puede ser explorada para proponer ideas, deepdive, etc...
  • Otra adaptada al equipo en el que estoy, más multidisciplinar, donde hay artistas, UI/UX, developers cliente/backend, community, QA, etc... donde tienes que mostrar información relevante, pero sobra la "paja" técnica que desconocen y/o puede abrumarles, hacerse pesado, o perder el hilo conductor con tecnicismos.
  • Finalmente, la misma presentación pero para presentarla al equipo de leads, al VP of Product, o Director of Product, Head of (inserta rol). En esta, está el trabajo más "complicado" (cuando ya tienes soltura es la mas divertida), el cual es adaptar todo lo anterior a unas slides resumidas, to the point, sin vacilaciones ni respuestas abiertas. Lo que diga en estas reuniones/presentaciones va a misa. La prioridad de desarrollos, qué desarrollos, cuando, y que se espera, sale de estas reuniones. Y aquí tienes una ventana de atención de 5-10 minutos para hacer como en Inception. Plantar la idea, y que salga adelante.

Esto es importante, especialmente, en los DA y DS que están más enfocados al producto, que no en la parte más puramente técnica, de investigación, o modelado/AI.

1 respuesta
Sphere

¡Fantástico hilo @richmonde y gracias por el ping!

Lo bueno de esta rama es que hay una cantidad de tecnologías y especializaciones para colmar de entretenimiento a aquellos que tengan mucho interés en el mundillo y les mole el tema de cacharrear, y si te lo montas bien no te quedas encasillado. Lo normal es que salvo que estés en una empresa con una estructura y cultura de datos muy madura, termines haciendo un poco de DA (business knowledge que irás acumulando, reporting, dashboards), DE (ETLs, gestión de pipelines para proyectos concretos o gestión de las integraciones de datos entre plataformas), DS para los análisis más complejos tirando o no de ML, MLOPs para controlar los modelos y los resultados que están obteniendo, vigilar el data y model drifting, arquitectura de datos si llegas a un punto en el que te encargas de todo el schema de un proyecto…

Y por supuesto, saltar a un puesto de dev más “puro” también es posible, ya que se comparten muchos procedimientos operativos estándar y herramientas. No se cierra ninguna puerta.

1
eXtreM3
#28richmonde:

y una vez lo tienes todo hilado, saber como comunicarlo adaptando el mensaje a la audiencia a la que va dirigido

Me encanta este mensaje. Chinchetazo tremendo, muy muy importante.

1