Accueil > Forum > > > > Supprimer les doublons d'un fichier texte ?
Supprimer les doublons d'un fichier texte ?
jeudi 27 novembre 2008 à 17:31:27 |
Supprimer les doublons d'un fichier texte ?

chtitpierre78
|
Bonjour, Je vient de coder un petit programme en C++, qui me permet de supprimer les doublons de mon fichier texte (qui contient près de 200000 lignes). Le problème c'est que c'est vraiment très très lent. Je crois me souvenir qu'il existe une commande Linux qui permet de faire ça tout seul, un truc du genre "sort -u in.txt > out.txt" ! Bon, tout ça c'est bien sympa, mais je bosse sous Windows. Je me demande donc si il n'existe pas un equivalent windows ? Cordialement K. Pierre
|
|
jeudi 27 novembre 2008 à 18:00:05 |
Re : Supprimer les doublons d'un fichier texte ?

fregolo52
|
Salut,
Tu fais erreur, la commande "sort" existe sous Windows. Je viens de faire un text avec un fichier qui contient les noms des pays, ça à l'air de marcher : sort pays.txt > pays2.txt
Ouvre une fenêtre DOS et tape : help sort.
|
|
jeudi 27 novembre 2008 à 18:34:51 |
Re : Supprimer les doublons d'un fichier texte ?

chtitpierre78
|
Effectivement, cette commande existe bel et bien sous DOS, mais elle ne semble pas remplir la meme fonction que sous Linux. La seul chose que j'ai reussie a faire avec cette commande là, c'est reorganiser mon fichier par ordre alphabetique. De plus, l'aide n'indique rien concernant les doublons ... :(
|
|
jeudi 27 novembre 2008 à 19:45:04 |
Re : Supprimer les doublons d'un fichier texte ?

BruNews
|
Par "doublon", tu entends ligne complète ?
ciao... BruNews, MVP VC++
|
|
jeudi 27 novembre 2008 à 19:59:32 |
Re : Supprimer les doublons d'un fichier texte ?

chtitpierre78
|
Oui, j'entend ligne compléte. Voila a quoi ressemble mon fichier :
C:\Program Files\toto\a.exe C:\Program Files\tata\b.exe C:\Documents and Settings\tutu\moi.jpg C:\Program Files\toto\a.exe C:\test.mp3 ...
Donc de temps en temps, j'ai 2 chemins qui sont identiques. Comme ici avec "C:\Program Files\toto\a.exe" qui apparait 2 fois. Je souhaiterais donc supprimer ce doublon, pour ne voir apparaire cette ligne qu'une fois. J'ai bien un petit programme en C++ qui me fait, mais ca prend des heures (des vrais heures, celle de 60 minutes hein ! ) ... !
Cordialement
K. Pierre
|
|
jeudi 27 novembre 2008 à 20:03:58 |
Re : Supprimer les doublons d'un fichier texte ?

BruNews
|
OK, j'ai un creux dans l'emploi du temps. Vois si tu peux zipper un fichier exemple (super BIG, genre 200 000 lignes) et le mettre sur un FTP pour que je puisse tester les perfs en situation réelle. PS: Pas envie de me burner avec la casse, sera case sensitive.
ciao... BruNews, MVP VC++
|
|
jeudi 27 novembre 2008 à 21:06:34 |
Re : Supprimer les doublons d'un fichier texte ?

chtitpierre78
|
Bah en fait, un simple "dir /b /s > tonfichier.txt" dans la console DOS suffit. Je fait comme ca pour tester. Tu prends 10 ou 20 lignes au pif dans le fichier de sortie, tu copies / colles ici et la dans le fichier, tu obtiens a peu de chose prés mon cas de figure. Actuellement ma procedure en C++ est la suivante :
- Lecture d'une ligne de mon fichier liste - Je regarde si la ligne lue est presente dans mon fichier de sortie (celui où chaque ligne sera unique) - Si elle n'est pas presente, je l'ecris dans ce fichier de sortie et je passe la la ligne suivante de ma liste - Si elle est presente, je n'ecris rien et je passe a la ligne suivante de ma liste
Je ne pourrais poster mes sources que demain, le tout est au boulot ;)
Cordialement
K. Pierre
|
|
jeudi 27 novembre 2008 à 21:14:47 |
Re : Supprimer les doublons d'un fichier texte ?

BruNews
|
Laisse tomber tes sources, en heures pas utile... Je vais tester sur petit et je te dirai quand sera dispo, tu testeras en situation réelle.
ciao... BruNews, MVP VC++
|
|
jeudi 27 novembre 2008 à 22:31:41 |
Re : Supprimer les doublons d'un fichier texte ?

BruNews
|
http://brunews.com/LignDbl.zip exe de 2.5 Ko dans le zip. J'ai juste testé sur petit fichier, tu nous diras si va bon je donnerai le code. ATTENTION: il faut mettre le fichier à traiter dans dossier du exe et le nommer a.txt, si tout ok on mettra le nom de fichier en param de la fonction (ou de l'exe). ciao... BruNews, MVP VC++
|
|
jeudi 27 novembre 2008 à 22:32:42 |
Re : Supprimer les doublons d'un fichier texte ?

BruNews
|
OUPS, oublié de préciser que le fichier est refait sur place, pas de fichier 2 de fait.
ciao... BruNews, MVP VC++
|
|
Cette discussion est classée dans : fichier, texte, supprimer, permet, doublons
Répondre à ce message
Sujets en rapport avec ce message
Supprimer les espaces dans un fichier texte!!! [ par salley ]
Voila j'ai un fichier texte avec plein de chiffres et entre chaque chiffre 5 espaces, j'aimerais le modifier :1/ J'aimerais enlever les 50 premiers ca
gestion de Fichier texte [ par aciid_washor ]
Bonjour, j'ai créé un programme qui me sert d'annuaire. L'annuaire en question est ecrit sous forme d'un fichier texte:nom telephonedéclarés comme s
supprimer les balises d'un fichier texte [ par mervat ]
bonjour, j'ai un fichier texte plein de balises telles que ( , , etc.) je veux les éliminer toutes pour avoir comme résultat seulement le texte. ya
fichier texte et enregistrement [ par brell ]
bon jour! comment je fait pour enregistrer un texte, entrer par le clavier et fini par un caractere spéciale,ligne par ligne dans fichier texte en lan
Fichier Texte, Affichage et TEMPS RÉEL [ par proggen ]
Bonjour, je veut coder un prog en temps réel. Celui-ci doit traiter des informations arrivant à chaque 0.25 secondes dans un fichier texte et ensuite
Supression de chaine dans un fichier [ par Ctimi ]
Bonjour à tous ! Je galère grave a rechercher une chaine de caractère dans un fichier et de la supprimer en langage C.... Mon but est d'entrer un nom
numéroter les phrases d'un fichier texte et les réécrire dans un autre fichier [ par mervat ]
bonjour, les instructions ci dessous me permettent en principe de copier un fichier texte dans un autre fichier en numérotant ses phrases, [code=cpp]
éliminer les mots vides d'un fichier texte [ par mervat ]
bonjour, j'ai un petit truc qui me bloque, je veux éliminer du fichier texte in les mots qui existent dans le fichier texte motvide et mettre le résul
Récupération d'un mot aléatoire depuis un fichier texte [ par Mornaloce ]
Bonjour à tous. Voilà je vous explique mon problème. J'aimerais faire un petit programme qui permet de récupérer un mot aléatoirement dans un fichier
Supprimer des doublons dans un tableau [ par aurel_67_1 ]
Bonjour, je voudrais savoir, comment faire pour supprimer des doublons dans un tableau non trié en C ? t = {1,3,4,2,5,4,5} Doublons à supprimer :
Livres en rapport
|
Derniers Blogs
[SHAREPOINT] LES SESSIONS TECHDAYS 2012.[SHAREPOINT] LES SESSIONS TECHDAYS 2012. par Patrick Guimonet
Voici donc pour ceux qui n'ont pas pu venir, ou ceux qui n'ont pas pu toutes les suivre la liste des sessions SharePoint aux TechDays 2012, que je mettrais à jour dès que les liens des vidéo seront disponibles. Ou ici : http...
Cliquez pour lire la suite de l'article par Patrick Guimonet TECHDAYS PARIS 2012 : SESSION PLEINIèRE JOUR 3TECHDAYS PARIS 2012 : SESSION PLEINIèRE JOUR 3 par ROMELARD Fabrice
Speaker: Bernard Ourghanlian Cette session est comme chaque jour transmise en live par BrainSonic, et j'ai donc suivi cette troisième pleinière par ce moyen sur mon iPad . Elle est dédiée comme chaque année à la mise en perspective de l'é...
Cliquez pour lire la suite de l'article par ROMELARD Fabrice MISHRA READER : UN LECTEUR RSS TRèS ZUNE STYLE EN OPEN SOURCE !MISHRA READER : UN LECTEUR RSS TRèS ZUNE STYLE EN OPEN SOURCE ! par Vko
Hier durant une session dédiée aux Techdays 2012, j'ai eu le plaisir d'annoncer la sortie de la Béta 2 de Mishra Reader. C'est quoi ? Pour les utilisateurs, c'est une vraie expérience de lecture de flux RSS sur Windows. Rien à voir avec les produit...
Cliquez pour lire la suite de l'article par Vko [FRAMEWORK 4] LES TASKS ET LE THREAD UI[FRAMEWORK 4] LES TASKS ET LE THREAD UI par fathi
Je viens de passer quelques temps au TechDay's et j'ai pu voir pas mal de session intéressante. Par contre une chose m'a un peu étonné lors de certaines de ces sessions qui abordaient les améliorations du framework .NET (donc le 4.5) : en gros, bea...
Cliquez pour lire la suite de l'article par fathi WORKFLOW FOUNDATION 3 A UN PIED DANS LA TOMBEWORKFLOW FOUNDATION 3 A UN PIED DANS LA TOMBE par JeremyJeanson
Depuis déjà un an, je conseille vivement les utilisateurs de Workflow Foundation 3 à migrer vers la version 4. L'information qui va suivre ne devrait donc pas trop prendre au dépourvu les personnes qui m'ont suivi. Je profite de ce poste, pour faire le re...
Cliquez pour lire la suite de l'article par JeremyJeanson
Logiciels
Academy System (17.2.1.0)ACADEMY SYSTEM (17.2.1.0)Logiciel de gestion des établissements.
- élèves/étudiants (inscription, dossier, absence...)
-... Cliquez pour télécharger Academy System Easy-Planning (1.0.0.1)EASY-PLANNING (1.0.0.1)Basé sur les mêmes principes que MyPlanning, Easy-Planning permet de créer des plannings sous la ... Cliquez pour télécharger Easy-Planning COLLECTOR PLUS (3.00B)COLLECTOR PLUS (3.00B)COLLECTOR PLUS version 3.00B est un logiciel utilisant une base de données alimentée par :
- L... Cliquez pour télécharger COLLECTOR PLUS PONAMEDIA PREMIUM - HELLLOOO FLASH DEMO (V7.4)PONAMEDIA PREMIUM - HELLLOOO FLASH DEMO (V7.4)PONAMEDIA TV DEVIENS HELLLOOO FLASH
LA TV SUR VOTRE ORDINATEUR.
Toute une plateforme Multi... Cliquez pour télécharger PONAMEDIA PREMIUM - HELLLOOO FLASH DEMO LettresFaciles 2011 (8.0.0.1)LETTRESFACILES 2011 (8.0.0.1)LettresFaciles est un logiciel facilitant la création et la rédaction de lettres types.
Son inte... Cliquez pour télécharger LettresFaciles 2011
|