Hola mi gente.
En mi proceso de cambio de carrera profesional estoy en el paso de crear un side project atractivo para el GitHub, una idea sencilla pero que toca varios palos. Este finde me he leído el libro de Kafka y pienso usarlo dentro del proyecto.
LA IDEA
Scrapeo de una web --> pasar los datos a un topic de Kafka --> procesar --> insertar en DDBB --> desde Kafka publicar tweets.
Mi duda viene en la parte de base de datos. Para no meter las consultas a martillo en el código, estaba pensando en usar microservicios, un ORM tipo Django o Flask, Django lo he usado, pero Flask no, tengo entendido que Flask es más "sencillito" que Django.
Una vez elegido el ORM según me recomendéis:
- ¿La parte de BBDD la meto en el mismo proyecto que scrapea etc? Yo lo haría así, más que nada por tenerlo dentro del mismo repo, pero me gustaría saber opiniones.
- ¿Las inserciones y lecturas a la DDBB la hago a través de API?
Gracias, os voy contando