Accueil > Forum > > > > nombre de fichiers contenant le même terme dans un répertoire
nombre de fichiers contenant le même terme dans un répertoire
dimanche 25 juillet 2010 à 22:53:14 |
nombre de fichiers contenant le même terme dans un répertoire

mervat
|
bonsoir,
ce programme permet de déterminer le nombre total de fichiers dans le répertoire "in"; vérifie si le terme "118" existe dans chaque fichier du répertoire et compte le nombre de fichiers contenant ce terme.
Code C/C++ : #include <stdio.h>
#include <dirent.h>
#include <iostream>
#include <fstream>
#include <string>
using std::ifstream;
using std::string;
int main (void)
{
DIR *rep = opendir ("in" );
if (rep != NULL)
{
struct dirent *lecture;
int i=0,j=0, existe=0; // i est le nombre de fichiers dans le répertoire
// j est le nombre de fichiers contenant le mot 118
// existe prend 1 si le terme 118 existe dans le fichier
ifstream entree;
string s;
while (lecture = readdir (rep))
{
printf ("%-25s ", lecture->d_name);
i++;
std::ifstream entree (lecture->d_name);
while ( entree >> s)
{
if (s == "118")
{ existe=1;
j++;
break;
}
}
if (existe==1)
std::cout << "existe" << std::endl;
else std::cout << "non" << std::endl;
existe=0;
}
if (j>0) std::cout << "le nombre de fichier contenant le terme est "<< j << std::endl;
entree.close();
closedir (rep), rep = NULL;
printf ("le nombre de fichiers est : %d\n", i-2);
}
system ("pause");
return 0;
}
le répertoire "in" contient 6 fichiers a,b,c,d,e,f et g dont d,e et f contiennent le terme "118".
le résultat obtenu par ce code est erroné
Code :
. non
.. non
a non
b non
c non
d non
e existe
f existe
g existe
le nombre de fichiers contenant le terme est 3
le nombre de fichiers est 7
j'espère que vous pouvez m'aider à trouver mes fautes.
|
|
lundi 26 juillet 2010 à 16:37:41 |
Re : nombre de fichiers contenant le même terme dans un répertoire

mervat
|
bonjour;
je suis encore bloquée, j'ai pas pu connaitre ma faute, le programme me parait juste;
aidez moi svp à connaitre la faute.
|
|
mardi 27 juillet 2010 à 15:42:32 |
Re : nombre de fichiers contenant le même terme dans un répertoire

CptPingu
|
Réponse acceptée !
Ton programme plante chez moi. Tu dois faire attention, ignorer les "." et les "..", et vérifier si un fichier à bien été ouvert.
De plus, si tu coupes ton programme en petites fonctions, c'est beaucoup plus lisibles.
Evite les NULL en C++, préfère 0, voir: [ Lien ]
Ne mélange pas C et C++. Donc oublie les printf au profit des std::cout.
En suivant ce que je viens de te dire, j'ai revu ton programme, et ça va beaucoup mieux:
Code C/C++ :
#include <dirent.h>
#include <stdio.h>
#include <iostream>
#include <fstream>
#include <iomanip>
bool exists(const std::string& filename, const std::string& pattern)
{
// entree se referme tout seul, lors de la desuction
// de l'objet ifstream
std::ifstream entree(filename.c_str());
std::string s;
while (entree >> s)
if (s == pattern)
return true;
return false;
}
bool isValid(const std::string& path)
{
return !path.empty() && path != "." && path != "..";
}
int main()
{
static const std::string folder = "in";
DIR* rep = opendir(folder.c_str());
if (rep)
{
struct dirent* lecture;
int nbFile = 0;
int totalFile = 0;
while ((lecture = readdir(rep)))
{
if (!isValid(lecture->d_name))
continue;
std::cout << std::left << std::setw(25) << lecture->d_name;
++totalFile;
if (exists(folder + "/" + lecture->d_name, "118"))
{
std::cout << "existe" << std::endl;
++nbFile;
}
else
std::cout << "non" << std::endl;
}
if (nbFile > 0)
std::cout << "Le nombre de fichier contenant le terme est "
<< nbFile << std::endl;
closedir(rep);
std::cout << "Le nombre de fichiers est : " << totalFile << std::endl;
}
return 0;
}
________________________________________________________________________
Historique de mes créations, et quelques articles:
http://0217021.free.fr/portfolio
Merci d'utiliser Réponse acceptée si un post répond à votre question
|
|
mardi 27 juillet 2010 à 16:14:12 |
Re : nombre de fichiers contenant le même terme dans un répertoire

mervat
|
bonjour,
je suis vraiment incapable de vous remercier car j'étais bloquée pendant 3 jours et j'ai pas pu connaitre ma faute;
j'ai essayé votre code, il m'a donné de bons résultats et je vais tout de suite le lire attentivement pour comprendre ce que vous avez fait.
|
|
mardi 27 juillet 2010 à 19:43:33 |
Re : nombre de fichiers contenant le même terme dans un répertoire

mervat
|
je vais encore vous gêner à propos de ce même code
j'ai ajouté une autre fonction et quelques instructions dans le main pour calculer le tf (term frequency)de chaque terme;
Code C/C++ : void creermap(const std::string& filename)
{ std::map<std::string, int> map;
std::ifstream entree(filename.c_str());
std::string s;
while (entree >> s)
++map[s];
}
int main()
{.... /*j'ai mis ce code du main juste après l'instruction (std::cout << "non" << std::endl;)*/
creermap(folder + "/" + lecture->d_name);
typedef std::map<std::string, int>::const_iterator iter;
for (iter it = map.begin(); it != map.end(); ++it)
som = som+ it->second;
if (strcmp (lecture->d_name, ".") !=0 && strcmp (lecture->d_name, "..") !=0)
sortie << " les tf du document " << lecture->d_name << std::endl;
for (iter it = map.begin(); it != map.end(); ++it)
if (som !=0)
sortie << "tf du mot " << it->first << " est " << (float)it->second / som << std::endl;
som=0;
}
....}
j'obtiens dans le résultat
Code : les tf du document a.txt
les tf du document b.txt
les tf du document c.txt
les tf du document d.txt
les tf du document e.txt
les tf du document f.txt
les tf du document g.txt
ce qui lui manque les tf des mots,
ce serait vraiment génial si j'aurais encore votre aide, et merci.
|
|
mercredi 28 juillet 2010 à 00:57:32 |
Re : nombre de fichiers contenant le même terme dans un répertoire

mervat
|
bonsoir,
j'ai essayé meme autrement, sans l'utilisation d'une fonction,
j'ai ajouté dans le main ces instructions:
Code C/C++ : while (entree >> s)
++map[s];
typedef std::map<std::string, int>::const_iterator iter;
for (iter it = map.begin(); it != map.end(); ++it)
som = som+ it->second;
if (strcmp (lecture->d_name, ".") !=0 && strcmp (lecture->d_name, "..") !=0)
sortie << " les tf du document " << lecture->d_name << std::endl;
for (iter it = map.begin(); it != map.end(); ++it)
if (som !=0)
sortie << "tf du mot " << it->first << " est " << (float)it->second / som << std::endl;
som=0;
le résultat obtenu est encore erroné,
pour les 5 premiers fichiers,le résultat est bon, et pour les 2 derniers fichiers j'ai obtenu les mots et les tf du fichier précédent, comme si la lecture n'a pas été faite pour les 2 derniers fichiers.
j'espère avoir votre aide.
|
|
mercredi 28 juillet 2010 à 16:40:41 |
Re : nombre de fichiers contenant le même terme dans un répertoire

CptPingu
|
Réponse acceptée !
Tu ne dois pas essayer de calculer le tf en mettant tout dans la même map.
Tu fais une map par fichier. Pense vraiment à décomposer le plus possible en petite fonction. Plus tu fais de sous fonctions, plus ton code sera facile à réaliser.
J'ai repris ce que tu as fait, et ai juste ajouter une petite correction.
Code C/C++ :
#include <dirent.h>
#include <stdio.h>
#include <iostream>
#include <fstream>
#include <iomanip>
#include <map>
bool exists(const std::string& filename, const std::string& pattern)
{
// entree se referme tout seul, lors de la desuction
// de l'objet ifstream
std::ifstream entree(filename.c_str());
std::string s;
while (entree >> s)
if (s == pattern)
return true;
return false;
}
bool isValid(const std::string& path)
{
return !path.empty() && path != "." && path != "..";
}
void fillMap(std::map<std::string, int>& map, const std::string& filename)
{
std::ifstream entree(filename.c_str());
std::string s;
while (entree >> s)
++map[s];
}
void showTermFrequency(const std::string& filename)
{
std::map<std::string, int> map;
fillMap(map, filename);
int som = 0;
typedef std::map<std::string, int>::const_iterator iter;
for (iter it = map.begin(); it != map.end(); ++it)
som += it->second;
std::cout << "\tLes tf du document " << filename << std::endl;
for (iter it = map.begin(); it != map.end(); ++it)
if (som !=0)
std::cout << "\t\t* tf du mot " << it->first << " est " << (float)it->second / som << std::endl;
}
int main()
{
static const std::string folder = "in";
DIR* rep = opendir(folder.c_str());
if (rep)
{
struct dirent* lecture;
int nbFile = 0;
int totalFile = 0;
while ((lecture = readdir(rep)))
{
if (!isValid(lecture->d_name))
continue;
std::cout << std::left << std::setw(25) << lecture->d_name;
++totalFile;
if (exists(folder + "/" + lecture->d_name, "118"))
{
std::cout << "existe" << std::endl;
++nbFile;
}
else
std::cout << "non" << std::endl;
showTermFrequency(folder + "/" + lecture->d_name);
std::cout << std::endl;
}
if (nbFile > 0)
std::cout << "Le nombre de fichier contenant le terme est "
<< nbFile << std::endl;
closedir(rep);
std::cout << "Le nombre de fichiers est : " << totalFile << std::endl;
}
return 0;
}
________________________________________________________________________
Historique de mes créations, et quelques articles:
http://0217021.free.fr/portfolio
Merci d'utiliser Réponse acceptée si un post répond à votre question
|
|
mercredi 28 juillet 2010 à 17:52:30 |
Re : nombre de fichiers contenant le même terme dans un répertoire

mervat
|
tellement votre méthodologie est supère, lorsque j'ai lu le code, j'ai dit il est si simple, malgré que j'ai tant essayé et ça n'a pas marché.
j'ai juste une petite question, pourquoi vous avez mis le map en paramètre dans la fonction fillMap?
|
|
mercredi 28 juillet 2010 à 17:59:28 |
Re : nombre de fichiers contenant le même terme dans un répertoire

CptPingu
|
J'ai mis ceci pour éviter une copie couteuse inutile.
En effet, si j'avais retourné une std::map, il y aurait eu copie. Si j'avais retourné l'adresse d'une std::map, alors j'aurais pointé sur une zone qui aurait été libéré au sortir de la fonction et ça aurait planté.
J'aurais alors pu faire un "new std::map" et retourner le pointeur, puis le libérer. Mais j'ai préféré éviter cela.
Donc la map se fait remplir par la fonction, et se détruit toute seul.
________________________________________________________________________
Historique de mes créations, et quelques articles:
http://0217021.free.fr/portfolio
Merci d'utiliser Réponse acceptée si un post répond à votre question
|
|
mercredi 28 juillet 2010 à 18:08:22 |
Re : nombre de fichiers contenant le même terme dans un répertoire

mervat
|
c'est vraiment super ce que vous dites, merci pour toutes ces explications.
|
|
Cette discussion est classée dans : nombre, fichiers, existe, contenant, terme
Répondre à ce message
Sujets en rapport avec ce message
aide sur les fichiers [ par dickymoe ]
VinceExiste-t-il une fonction permettant de savoir si un fichier existe ?et une autre permettant de savoir si un fichier est vide ?merci
Les fichiers *.ini et C++ comme en delphi [ par Le_neuveu ]
J'aimerai savoir si quelqu'un sais si il existe une facon simple de gerer ses propres fichiers ini, il me semble qu'il existe un moyen en delphi et j'
arborescence de fichiers [ par otofraise ]
Bonjour,J'aimerais savoir s'il existe un composant qui permet d'obtenir l'arborescence des repertoires/fichiers d'une machine, qui possede en racine l
fichiers partagés en cours d'utilisation [ par melkiorlenecrarque ]
Bonjour,Existe-il une fonction qui recupere le contenu de la console msdos,ou alors existe-il une fonction qui est similaire à la commande dos "net fi
nombre de documents où un terme apparaît [ par mervat ]
le programme ci-dessous détermine le nombre de documents où le mot "terme" apparaît. il est exécutable et il donne comme résultat 2 car le mot "terme"
Comparaison de fichiers en tant que nombre [ par vinceb666 ]
bonjour,je cherche un moyen de comparer 2 fichiers en les considerant comme 2 nombres et savoir lequel des 2 est le plus grandpar exemple comparaison
Algo de compression [ par PsyCaDi ]
Bonjour,J'ai besoin de faire un petit prog qui me permettrait de compresser des répertoires contenant un maximum de 100 000 fichiers. J'ai des fichier
trouver tous les fichiers d'un type d'un pc distant [ par laurent207 ]
Bonjours,J'aimerai bien savoir comment récupérer tous les chemins de tous les fichiers d'un type particulier (*.lts) sur un pc distant sous windows .
SOS manque d'inspiration [ par graall ]
J'ai besoin de faire un petit programme (en mode console) qui demande à l'utilisateur de saisir le nom d'un fichier et ensuite, qui vérifie si ce fich
private.h et private.rc [ par Scientophage ]
J'ai un gros problème : à chaque compilation, mon compilateur (DEV Cpp 4.9.9.0) me crée deux fichiers : *private.h et *private.rc Cela a pour effet de
Livres en rapport
|
Derniers Blogs
POUR RAPPEL ! LES SPéCIFICATIONS DES PROTOCOLES OFFICE ET SHAREPOINT SONT DISPONIBLES SUR MSDNPOUR RAPPEL ! LES SPéCIFICATIONS DES PROTOCOLES OFFICE ET SHAREPOINT SONT DISPONIBLES SUR MSDN par neodante
Quelle est le point commun entre : Microsoft il y a 10 ans et Apple aujourd'hui ? Réponse: avoir une politique de protocoles propriétaires et fermés :) Car pour rappel (si si je vous assure c'est important de le rappeler), la majorité des spécifications e...
Cliquez pour lire la suite de l'article par neodante JOYEUX ANNIVERSAIRE NIXJOYEUX ANNIVERSAIRE NIX par ebartsoft
Souhaitons un bon et joyeux anniversaire à notre hôte à tous, Nix.
Je ne le répéterais jamais assez mais sans lui rien ne serait possible. Il défit en permanence les lois de la gravité et comme il le dit si bien, si tu lui fais confiance ça devra...
Cliquez pour lire la suite de l'article par ebartsoft IMAGINE CUP 2012, MAKE A SIGN EN FINALEIMAGINE CUP 2012, MAKE A SIGN EN FINALE par junarnoalg
Voilà qui est fait, la nouvelle est officielle ! L'équipe belge "Make a Sign" va au pays des kangourous défendre son projet dans la catégorie Software Design. http://www.imaginecup.com/CompetitionsContent/Competition/WorldwideFinalists.aspx V...
Cliquez pour lire la suite de l'article par junarnoalg KINECT 1.5 IS OUT !KINECT 1.5 IS OUT ! par Vko
La version 1.5 du Kinect For Microsoft vient tout juste de sortir ! Plein de nouveautés: Tracking de squelette en Near Mode Détection en position assise Détection faciale avec un SDK dédié Documentation et des guideline (enfin) Un out...
Cliquez pour lire la suite de l'article par Vko LES ACTUALITéS DE LA SEMAINE SUR C2I.FR (14 MAI - 20 MAI) LES ACTUALITéS DE LA SEMAINE SUR C2I.FR (14 MAI - 20 MAI) par richardc
Mise à jour des Web API du 14 Mai
Réservez dès maintenant votre journée du 20 juin pour le Windows Azure Dev Camp 2012 à Paris
Mise à jour de Team Foundation Service
MechCommander 2 sur Windows 8
Entity Framework 5 Release Candidate e...
Cliquez pour lire la suite de l'article par richardc
Forum
MATLAB PROGRAMME MATLAB PROGRAMME par wahab1087
Cliquez pour lire la suite par wahab1087 RGB2GRAYRGB2GRAY par musa18
Cliquez pour lire la suite par musa18
Logiciels
sDEVIS-FACTURES vlPRO (8.1.0.3)SDEVIS-FACTURES VLPRO (8.1.0.3)sDEVIS-FACTURES vlPRO a été mis au point pour les particuliers, créateurs, entrepreneurs, artisa... Cliquez pour télécharger sDEVIS-FACTURES vlPRO 974 Application Server (12.2.4.6)974 APPLICATION SERVER (12.2.4.6)Développez de puissantes applications dans un environnement de 'cloud computing', clusterisé, séc... Cliquez pour télécharger 974 Application Server vPicture (1.4.2.1)VPICTURE (1.4.2.1)Avec vPicture, hébergez vos images facilement et rapidement.
vPicture est un utilitaire simple, ... Cliquez pour télécharger vPicture Easy-Planning (2.2.1.6)EASY-PLANNING (2.2.1.6)Easy-Planning permet de créer des plannings sous la représentation de diagrammes et est adapté au... Cliquez pour télécharger Easy-Planning COM-BACKUP (2.0)COM-BACKUP (2.0)
COM-BACKUP est un logiciel de sauvegarde qui permet de planifier les sauvegardes de vos dossiers ...
Cliquez pour télécharger COM-BACKUP
|