[PROGRAM.] Acceder a elementos de ciertas webs

Kazjako

Buenas, conozco un poco de c++ y otro poco de java (aunque prefiero c++) y me gustaría hacer un programilla (a lo mejor es un script) con el que poder acceder a elementos de algunas webs. Es decir, por ejemplo, una web tiene una lista de links en una web, y a mi con el programilla me gustaría recorrerlos todos y acceder a lo que hay dentro de ese link. Como accedería a eso??

No se si me he explicado bien...

LOc0

Lo más sencillo para hacer lo que pides es usar la librería CURL-> http://curl.haxx.se/ La tienes para c/c++. Tb puedes usar CURL desde PHP (sabiendo c++ y java no te costará nada aprender PHP) -> http://es.php.net/curl

Con CURL te encargas de toda la parte de la conexión. Una vez tengas la web descargada tendrás que buscar lo que quieras a base de REGEX ( http://es.wikipedia.org/wiki/Expresi%C3%B3n_regular ) o "a pelo".

Edito: tb puedes bajarte CURL compilada como un ejecutable y usarla mediante un fichero .bat (windows) o un script de bash en Linux (esta última opción es la más rápida y potente si controlas bash aunque tb depende de qué quieras hacer exactamente).

Salu2 ;)

bLaKnI

La que te pario Loco!
Estuve buscando esto como una putilla cuando el fenómeno MyMiniCity estuvo en auge!
Y tuve que montarmelo con socks y otros para poder hacer algo y aun así, lo único que hice fue parsear a saco listas y listas de proxys free, y abrir multiples ventanas de navegador con las modificaciones pertinentes en el registro de windows!

Y ahora va, y como si nada apareces y dices "cURL"! xDDD

Mas vale tarde que nunca... ^^

Muchas gracias de rebote!

LOc0

#3 Jajaja ya ves. Yo descubrí esa librería de PHP hace unos años gracias a otro mediavidero y me enamoré al instante (de la librería xD). Luego me enteré que tb existía para C/C++ y jojojojo Varios programitas majos de sms salieron xD...

El último trabajo en que la he usado -> http://www.mediavida.com/vertema.php?fid=33&tid=336152

Salu2 ;)

bLaKnI

Ostia tus huevos grandes ahí con el ultimo proyecto!
Que guapo no? :)

Osea, que acabas obteniendo la URL real. Y usando CURL, vas "navegando" hasta la URL aun que este varias veces encapsulada por recursividad, hasta que obtienes a traves de un parsing, una url que no contiene la referencia al servicio en cuestion, no?

Me encanta! xD

Todavia quedan servidores free-SMS?

Cuenta cuenta... ^^

LOc0

Osea, que acabas obteniendo la URL real. Y usando CURL, vas "navegando" hasta la URL aun que este varias veces encapsulada por recursividad, hasta que obtienes a traves de un parsing, una url que no contiene la referencia al servicio en cuestion, no?

Exactamente. Bueno, luego dependiendo de cada web hay que parsear de una manera distinta (las más "jodidas" fueron lix.in por el captcha y los enlaces tipo "folder" (de un enlace lix.in salen X enlaces normales) y link-protector.com y urlhawk.com por el tema de los passwords y que en link-protector ofuscan la url de destino con javascript de una manera "curiosa").
Tb he dedicado tiempo en dejar el script completamente modularizado para que añadir nuevas webs de protección sea bastante sencillo. A lo mejor hago el código GPL o a lo mejor le meto publi, según me de :P

Y en cuanto a los SMS, que yo sepa la época dorada terminó hace bastante y la plateada, donde usaba mis programas también :( Ahora mismo desconozco si sigue habiendo servers gratuitos disponibles y con algún bug explotable...

Salu2 ;)

Usuarios habituales

  • LOc0
  • bLaKnI
  • Kazjako