Buenas, chavales. A ver si me podéis echar una manilla que me estoy partiendo los cuernos.
Estoy usando Pandas.DataFrame.duplicated() y la máscara booleana me está devolviendo ocurrencias que no están duplicadas. WTF?
aaa=df[df["SHA256"].duplicated()]
Como veis las tuplas 42 y 79 tienen valores SHA256 diferentes :S
Solucionado:
aaa=df[df["SHA256"].duplicated(keep=False)]
Así conservo todos los duplicados. Genial. Gracias. Solo he tenido que escribirlo para darme cuenta xDDDD