begin process at 2012 02 11 12:39:24
  Trouver un code source :
 
dans
 
Accueil > Forum > 

C++ & C++ .NET

 > 

Windows

 > 

Réseau & Internet

 > 

Récupérer tous les liens d'un site


Derniers messages déposésPoser une question dans le forum ou lancer une discussion

Récupérer tous les liens d'un site

lundi 22 juin 2009 à 10:06:10 | Récupérer tous les liens d'un site

Linkman

Bonjour,

Mon but étant de récupérer tous les liens d'un site pour éventuellement faire un sitemap ou autre fichier de ce type.

J'ai commencé par utiliser cURL, et j'ai réussi à stocker le code d'une page dans une variable "String^".

C'est après que cela se complique.
Je ne sais pas vers quelle solution se pencher.
libmxl : pas trouvé de version pour Visual Studio
msxml : pas trouvé des exemples pour faire ce que je veux.

Puis j'ai pensé aux expression régulières pour prendre que ce qui se trouve entre les "href", mais je n'ai pas encore approfondi le sujet.

Quelqu'un peut-il m'éclairer sur la meilleure manière de faire, et comment faire. (exemple : si vous connaissez une autre librairie que cURL etc...)

Merci.


mardi 23 juin 2009 à 10:24:04 | Re : Récupérer tous les liens d'un site

krimog

Administrateur CodeS-SourceS
Salut

Pour les expressions régulières, tu peux faire un truc comme ça :

"( href=\")([a-zA-Z0-9_\\-./\\?\\&=:]+)(\")" => (espace, puis href=" puis une lettre min, maj, un chiffre, _, -, ., /, ?, &, =, ou : répétés 1 à n fois, puis ")

Tu récupères ce qui match l'expression régulière, tu remplaces par rien " href=\"" et le "\"" à la fin, et tu as ton url.

Je peux pas plus te donner d'infos sur la façon d'utiliser des expressions régulières en C++ en revanche, désolé.

Krimog : while (!(succeed = try())) ;
- NON, "LE BAR" n'est PAS un langage de programmation ! -
mercredi 24 juin 2009 à 15:16:38 | Re : Récupérer tous les liens d'un site

katsankat

Membre Club
Salut, on est une dizaine de développeurs à s'être penché sur le sujet pour un concours du meilleur code qui fait ça! Noter la vitesse moyenne d'exécution, et le nombre de lignes de code. Cliquer sur les noms pour voir le code. Tu devrais trouver ton bonheur. http://pagesperso-orange.fr/2007/resultats.htm
mercredi 24 juin 2009 à 21:02:52 | Re : Récupérer tous les liens d'un site

Linkman

Merci Krimog, je glisse ta réponse sous le coude pour étudier les regex plus tard.

Katsankat, ça m'a l'air très intéressant. Je vais regarder ça de plus prêt et je reviendrai vers vous.


dimanche 28 juin 2009 à 11:32:43 | Re : Récupérer tous les liens d'un site

deck_bsd

Membre Club
Yop,

J'ai déjà fait ce type de programme. Voici ma source :

http://www.cppfrance.com/codes/WIN32-AFFICHE-TOUT-LIENS-PAGE-HTML_42940.aspx

++
deck_bsd
___________________________________
[ [ Lien ]]


Cette discussion est classée dans : récupérer, site, liens, trouvé, curl


Répondre à ce message

Sujets en rapport avec ce message

Récupérer une bdd SQL en C++ avec Builder [ par jack_herrer ] Bonjour,je maitrise le langage C++ et le compilateur Borland C++ Builder 6.Par contre, j'y connais que dalle en SQL.Quelqu'un pourrait-il éclairer ma allegro mp3 [ par mat74 ] salut a ts voila je suis en train de faire un casse brique d'ailleur il est casiment fini ( d'ailleur je vais surement pas tarder de le mettre sur le [Linux/ Cpp] Récupérer la source d'un html avec curl avec proxy [ par ce18ce ] Bonjour, moi mon problème avec curl c'est que je ne sais pas comment récupérer le code source d'une page web à cause d'un proxy. Quelqu'un saurait com Liens vers page web [ par Wildschwein ] Bonjour,Je débute depuis peu la programmation sous Visual C++ et j'ai réalisé une petite application.Dans ma fenêtre "A propos..." j'ai mis l'adresse Example de jeu (WarGame) [ par norton ] Bonsoir, j'ai cherché sur le web un example de jeu WarGame --> alerte rouge, Command & Conquer Générals... . Mais je n'ai rien trouvé :( Savez vous ou 1er visite [ par popouu ] je viens de m'inscrire sur ce site car je connait la programmation C ET JAVASCRIPT a quoi sert le récapitulatif de points a chaque ouverture de ce sit Petite question [ par AMokers ] Voila j'ai chercher partout sur ce site, et je ne trouve plus ou c'est que l'on peut peut modifier l'image que l'on vois dans les forums, sources dépo Corba [ par kinder29 ] Je vais avoir besoin d'utiliser corba et je cherche un tutorial. Mais je n'arrive pas à trouver. Sur ce site je n'ai rien trouvé sur corba ou alors ai site cour c++ [ par pierre_33 ] Salut,Je voulais sasi vous connaissez un site qui explique le c++ de A à Z (du moin partant de A)Parce-que je troue plein de site mais il faut deja av Récupérer un mot dans une liste quand clique dessus [ par goutbouyo ] Salut,J'ai une liste qui affiche des noms enregistrées dans un fichier.Je voudrais que quand on clique sur un mot ça me donne le nom de ce mot pour qu


Nos sponsors


Sondage...

CalendriCode

Février 2012
LMMJVSD
  12345
6789101112
13141516171819
20212223242526
272829    

Consulter la suite du CalendriCode

 
Développement réalisé par Nicolas SOREL (Nix) avec l'aide de : Cyril DURAND et Emmanuel (EBArtSoft), Merci à Vincent pour ses précieux conseils.
CodeS-SourceS.com© Toute reproduction même partielle est interdite sauf accord écrit du Webmaster
CodeS-SourceS.com© est une marque déposée tous droits réservés

Google Coop CodeS-SourceS Google Coop CodeS-SourceS
Temps d'éxécution de la page : 2,293 sec (4)

Nous contacter | Annoncer sur CodeS-SourceS | Mentions légales