Comunidad de Machine Learning / Deep learning

c0b4c

#90 diria que podrias usar mejor algo tipo simulated annealing or genetic algorithms. Si proporcionas mas detalles quiza pueda darte una respuesta mas concreta.

edit: me sonaba que ya planteaste el problema en otro hilo y lo he buscado https://www.mediavida.com/foro/dev/python-hilo-general-551473/28
está bien saber que lo que te he dicho yo casa con lo que te dijeron entonces XD voy aprendiendo

1 respuesta
CaNaRy_r00lz

#91 Si lo pregunte hace tiempo, pero como las cosas cambian y a veces aparecen nuevos enfoques por eso preguntaba de nuevo que en 2 años quizas algo nuevo habia salido, thanks

NocAB

¿Tenéis experiencia haciendo undersampling con Condensed Nearest Neighbor?

Lo tengo ejecutando desde hace 10h en colab y no sé si es normal porque, aunque sé que es un algoritmo lento, otros de undersampling me han tardado una media hora.

Lo tengo con n=1 y sampling_strategy='majority' para un dataset de (367705, 11).

R

#84 consegui llegar a un 76% en el test con una red muy simple. Aunque en el training estaba a 93% vaya overfiting xD

23 días después
gonya707

Estoy ya preparando los archivos para una segunda competicion, va a ser de clasificacion de imagenes y el modo que usé para clasificarlas manualmente hacia el trabajo manual facil pero ahora importarlos a tensorflow o lo que sea es un coñazo, asi que tengo que cambiar la estructura.

Si no muero de calor antes para este fin de semana comenzamos

gonya707

Dobleposteo porque estoy teniendo un problemilla que ya me está irritando para montar la competi en kaggle. He puesto los detalles en este post en el foro pero nadie responde :cry:

https://www.kaggle.com/discussions/questions-and-answers/331338

Algun alma caritativa puede echarle un vistazo? Ya no se que intentar

2 respuestas
NocAB

No creo que participe en esta edición porque una clasificación multinomial de imágenes me queda un poco grande. De hecho quiero mirarme cómo funcionan pero con datos numéricos/categóricos y hacer alguna prueba con scikit-multilearn cuando termine con las series temporales.

#96 haciendo una búsqueda rápida me ha parecido que kaggle no se lleva bien con las métricas para este tipo de clasificaciones pero sí que hay algunas competiciones parecidas así que se tiene que poder hacer algo.

20 días después
Phil_Rich

#96 Acabo de ver esto, sigues atascado? Te puedo intentar echar una mano

1 respuesta
ercabesa

No sabía si ponerlo, es un notición

4
gonya707

#98 La verdad es que si, luego te paso un dataset dummy a ver si puedes dar con la tecla, yo ya estoy desesperado

1
gonya707

Preparad vuestras mejores galas que esto vuelve en unos dias, gracias a @Phil_Rich he conseguido montar el tinglado finalmente

3
gonya707

https://www.mediavida.com/foro/dev/segunda-competicion-machine-learning-futurama-689127 alle vamos

1 mes después
Millonet1

Hace poco más de un año estaba haciendo cursos de Udemy para aprender machine learning de 0 y hoy han aceptado mi primer paper en una conferencia internacional, estoy exultante 😊

20 2 respuestas
hda

#103 Infinitas felicidades, tío bueno. Te mereces todo lo genial que te pase. Ejemplo de tesón e inteligencia :D

2 1 respuesta
khaxal

#103 Puedes comentar un poco cómo ha sido tu proceso de aprendizaje? Cursos, libros?
Este es un tema que siempre me ha interesado pero nunca paso de leer artículos que arañan la superficie.
(Sí, sé que en el primer post hay una lista de recursos estupenda)

1 respuesta
Millonet1

#104 gracias tío! Ya sabes que eres un referente.

#105 primero decir que cuento con la ventaja de tener una base de matemáticas que me ha permitido avanzar más rápido (por ejemplo, entender el libro de Bishop). En lo que me centré es en aprender a usar las librerías básicas de Python: numpy, scipy, tensorflow... y en hacer mis propias implementaciones de algoritmos básicos, como K-Means o expectation-maximization.

Por mi formación como matemático encontré un puesto de investigación en machine learning y ahí he ido centrándome en un tema (https://en.m.wikipedia.org/wiki/Dirichlet_process) leyendo la literatura académica. Precisamente por mi trayectoria donde más flojeo es en la parte de manejo de bases de datos y programación, que suele ser lo más importante a la hora de hacer Data Science en "el mundo real".

En machine learning hay muchos backgrounds diferentes, por lo que mi experiencia quizás no te sirva, pero sí que diría que una buena base de matemáticas (estadística, probabilidad, análisis, métodos numéricos...) facilita muchísimo las cosas.

1 1 respuesta
khaxal

#106 Probablemente controlo más de programación, de mates más allá de cálculo matricial, álgebra lineal y Monte Carlo, poco. Envidio tu base :)
Muchas gracias por la respuesta tan detallada!

1 respuesta
Millonet1

#107 bueno, piensa que lo que hago tira hacia lo académico, donde se usas matemáticas más sofisticadas. Para trabajar como ML engineer o cosas así se valoran otras cosas, y con lo que comentas yo creo que vas muy bien.

2 1 respuesta
hda

#108 pon por aquí o por MP si quieres, cuando estés online. Tengo ganas de ver ese papel. ¿Procesos de dirichlet? Suena sexy :D

1 respuesta
Millonet1

#109 cuando esté lista la versión definitiva lo dejaré por aquí :)

2 1 respuesta
NocAB

#110 me da que será algo muy avanzado para mí (lo mío es mucho más aplicado) pero me gustará poder verlo (e intentar entenderte xd).

12 días después
Sk8eR

muchachos os hago un par de preguntas, estoy por iniciarme en el mundo de DL:

1 respuesta
gonya707

#112 Sobre lo segundo: no. Las graficas para jugar no son las adecuadas para calcular tensores, si ves las GPU que usan los equipos en google colab ves que son cosas como Nvidia Tesla K80 (3.498 euros), Nvidia T4 (2.901 euros) etc. Graficas pensadas exclusivamente para computar estas cosas y que por no tener no tienen ni salida HDMI, no la necesitan.

A no ser que necesites tener un equipo 24/7 entrenando no te merece la pena comprar tu propia GPU/TPU, si en alguna ocasión necesitas unas horas o dias de GPU los servicios como colab pro y colab pro+, que las alquilan por calderilla. Incluso si es para algo puntual en kaggle tienes 35 horas semanales de GPU gratis

4
crb2222

Aprovecho este hilo a ver si alguien puede contarme experiencias en un caso similar al mio.

Siempre me ha interesado este mundillo, en la carrera (ing informática) las asignaturas relacionadas fueron mis favoritas, pero por cosas de la vida llevo 6 años currando de programador fullstack, lo típico

Llegue a hacer la pre matrícula al master de la UOC, pero acabé tirándome atrás, ya que en ese momento no me apetecía meterme a un master de 2 año (no planteo el itinerario de 1 año)

La cosa es, aunque me interesa mucho el sector , especialmente tema de machine learning, no se si me gustaría el trabajo para el día a día. Alguien puede contar su experiencia trabajando en el sector? Sus tareas diarias etc

Que tal la transición de front/back a un puesto de data science? Lo que mas me tira para atrás es la “perdida” de la experiencia en mi sector, empezar de junior (tal vez paso atrás en sueldo inicialmente)

15 días después
telemaco103

Alguno conoce o sabe de algún recurso bueno sobre Reinforcement Learning y Python? Quiero probar a ver si puedo aplicarlo a un proyecto de investigación de la uni.

gonya707

Me han mandado de Mathworks un pdf sobre ML en Matlab, pero la verdad es que es bastante teorico y puede aplicarse a cualquier cosa, una buena lectura introductoria:

https://es.mathworks.com/content/dam/mathworks/ebook/gated/machine-learning-ebook-all-chapters.pdf

1 respuesta
Kike_Knoxvil

#116 Si quieres te mando el Quick Reference del curso, que es donde viene las cosas y los comandos a usar

1 respuesta
gonya707

#117 a mi personalmente no me hace falta, hace mucho tiempo que no tengo matlab instalado, y para asuntos de ML ya estoy con python, pero gracias. Simplemente creo que el pdf introductorio ese esta bastante bien

1
Maaarc

Edit: Lo he resuelto con "xticks"

No se si preguntar esto aquí o por el hilo de Python. Pero bueno, lo pongo por aquí por si es algo que habéis tenido que hacer.

Tengo el siguiente subset que quiero printar ya que es un value_counts() de una columna de un dataframe.

freqDiabetesSex = df_diabetes['sex'].value_counts()

-0.044642    235
 0.050680    207

Y lo que quiero al sacar el print es que en las columnas me muestre "Hombre" o "Mujer" en vez de esos números que no tienen ningún sentido a la hora de representar-se.

La duda viene de que no se que es mejor, si buscar la manera de cambiar el nombre desde matplotlib o si modificar ese subset con un replace.

Que consideráis mejor practica? Creo que lo de matplotlib es más elegante, pero no he visto como hacerlo aún. Se agradecen consejos!

1 respuesta
CarlosML27

#119 Hombre yo si esos datos que dices son resultados de una predicción y el único sentido que tiene es categórico, yo lo cambiaría como tal a la categoría que corresponda y luego ya trabajaría con ellos siendo algo más legible y entendible.

Si por contra los necesitas así por algún motivo, como bien has puesto en el edit, puedes simplemente cambiar las labels en la representación.