buenas, alguien tiene algun codigo en java que dado un codigo fuente lo trate de tal forma que extraiga los links?
gracias
Los links? links web?
Si fuese asi, no es mas que hacerte un programa que abra un archivo e irte paseando por cada linea y por cada letra, para buscar una cadena que empieze por http por ejemplo.. o por lo que tu quieras.
#2 es algo mas complicado que eso
en realidad me interesan los links del mismo dominio, no que vayan a otros dominios, pero bueno, cualquier cosa me vale
ves leyendo linea a linea con un ImputStreamReader, y lo vas tratando con las funciones de la clase String
primero debes buscar el tag de html '<a' i luego el parametro 'href=', justo despues del igual estara el link
Saludos y suerte
#6 si es como yo lo hago, o como he intentado hacerlo, pero es una mierda, cada link esta de una forma distinta y no es facil pillarlos para que te queden bien