begin process at 2012 05 29 19:26:12
  Trouver un code source :
 
dans
 
Accueil > Forum > 

C++ & C++ .NET

 > 

Divers

 > 

Débutant(e)

 > 

nombre de fichiers contenant le même terme dans un répertoire


Derniers messages déposésPoser une question dans le forum ou lancer une discussion

nombre de fichiers contenant le même terme dans un répertoire

dimanche 25 juillet 2010 à 22:53:14 | nombre de fichiers contenant le même terme dans un répertoire

mervat

bonsoir,
ce programme permet de déterminer le nombre total de fichiers dans le répertoire "in"; vérifie si le terme "118" existe dans chaque fichier du répertoire et compte le nombre de fichiers contenant ce terme.
Code C/C++ :
#include <stdio.h>
#include <dirent.h>
#include <iostream>
#include <fstream>
#include <string>
using std::ifstream;
using std::string;

int main (void)
{
   DIR *rep = opendir ("in" );

   if (rep != NULL)
	 {
	  struct dirent *lecture;
	  int i=0,j=0, existe=0; // i est le nombre de fichiers dans le répertoire
						 // j est le nombre de fichiers contenant le mot 118
						// existe prend 1 si le terme 118 existe dans le fichier
	  ifstream entree;
	  string s;
	  while (lecture = readdir (rep))
		{
		   printf ("%-25s    ", lecture->d_name);
		   i++;
		   std::ifstream entree (lecture->d_name);
		   while ( entree >> s)
			{
			  if (s == "118")
				{ existe=1;
				  j++;
				  break;
				}
			}
		  if (existe==1)
		  std::cout << "existe" << std::endl;
		  else std::cout << "non" << std::endl;
		  existe=0;
		}
	  if (j>0)  std::cout << "le nombre de fichier contenant le terme est "<< j << std::endl;
	  entree.close();
	  closedir (rep), rep = NULL;
   printf ("le nombre de fichiers est : %d\n", i-2);
   }
   
   system ("pause");
   return 0;
} 

le répertoire "in" contient 6 fichiers a,b,c,d,e,f et g dont d,e et f contiennent le terme "118".
le résultat obtenu par ce code est erroné
Code :
.                         non
..                        non
a                         non
b                         non
c                         non
d                         non
e                         existe
f                         existe
g                         existe
le nombre de fichiers contenant le terme est 3
le nombre de fichiers est 7

j'espère que vous pouvez m'aider à trouver mes fautes.
lundi 26 juillet 2010 à 16:37:41 | Re : nombre de fichiers contenant le même terme dans un répertoire

mervat

bonjour;
je suis encore bloquée, j'ai pas pu connaitre ma faute, le programme me parait juste;
aidez moi svp à connaitre la faute.
mardi 27 juillet 2010 à 15:42:32 | Re : nombre de fichiers contenant le même terme dans un répertoire

CptPingu

Administrateur CodeS-SourceS
Réponse acceptée !
Ton programme plante chez moi. Tu dois faire attention, ignorer les "." et les "..", et vérifier si un fichier à bien été ouvert.
De plus, si tu coupes ton programme en petites fonctions, c'est beaucoup plus lisibles.
Evite les NULL en C++, préfère 0, voir: [ Lien ]
Ne mélange pas C et C++. Donc oublie les printf au profit des std::cout.

En suivant ce que je viens de te dire, j'ai revu ton programme, et ça va beaucoup mieux:
Code C/C++ :
#include <dirent.h>
#include <stdio.h>
#include <iostream>
#include <fstream>
#include <iomanip>

bool exists(const std::string& filename, const std::string& pattern)
{
  // entree se referme tout seul, lors de la desuction
  // de l'objet ifstream
  std::ifstream entree(filename.c_str());
  std::string s;
  while (entree >> s)
    if (s == pattern)
      return true;

  return false;
}

bool isValid(const std::string& path)
{
  return !path.empty() && path != "." && path != "..";
}

int main()
{
  static const std::string folder = "in";

  DIR* rep = opendir(folder.c_str());
  if (rep)
  {
    struct dirent* lecture;
    int nbFile = 0;
    int totalFile = 0;

    while ((lecture = readdir(rep)))
    {
      if (!isValid(lecture->d_name))
	continue;

      std::cout << std::left << std::setw(25) << lecture->d_name;
      ++totalFile;
      if (exists(folder + "/" + lecture->d_name, "118"))
      {
	std::cout << "existe" << std::endl;
	++nbFile;
      }
      else
	std::cout << "non" << std::endl;
    }

    if (nbFile > 0)
      std::cout << "Le nombre de fichier contenant le terme est "
		<< nbFile << std::endl;

    closedir(rep);
    std::cout << "Le nombre de fichiers est : " << totalFile << std::endl;
  }

  return 0;
}


________________________________________________________________________
Historique de mes créations, et quelques articles:
http://0217021.free.fr/portfolio

Merci d'utiliser Réponse acceptée si un post répond à votre question
mardi 27 juillet 2010 à 16:14:12 | Re : nombre de fichiers contenant le même terme dans un répertoire

mervat

bonjour,
je suis vraiment incapable de vous remercier car j'étais bloquée pendant 3 jours et j'ai pas pu connaitre ma faute;
j'ai essayé votre code, il m'a donné de bons résultats et je vais tout de suite le lire attentivement pour comprendre ce que vous avez fait.
mardi 27 juillet 2010 à 19:43:33 | Re : nombre de fichiers contenant le même terme dans un répertoire

mervat

je vais encore vous gêner à propos de ce même code
j'ai ajouté une autre fonction et quelques instructions dans le main pour calculer le tf (term frequency)de chaque terme;
Code C/C++ :
void creermap(const std::string& filename)
{ std::map<std::string, int> map;
   std::ifstream entree(filename.c_str());
   std::string s;
  while (entree >> s)
   ++map[s];

	}

int main()
{.... /*j'ai mis ce code du main juste après l'instruction (std::cout << "non" << std::endl;)*/
creermap(folder + "/" + lecture->d_name);
    typedef std::map<std::string, int>::const_iterator iter;
  for (iter it = map.begin(); it != map.end(); ++it)
	 som = som+ it->second;
  if (strcmp (lecture->d_name, ".") !=0 && strcmp (lecture->d_name, "..") !=0)
  sortie << " les tf du document " << lecture->d_name << std::endl;
  for (iter it = map.begin(); it != map.end(); ++it)
	 if (som !=0)
	  sortie << "tf du mot " << it->first << " est " << (float)it->second / som << std::endl;
	som=0;
	}

....}

j'obtiens dans le résultat
Code :
les tf du document a.txt
les tf du document b.txt
les tf du document c.txt
les tf du document d.txt
les tf du document e.txt
les tf du document f.txt
les tf du document g.txt

ce qui lui manque les tf des mots,
ce serait vraiment génial si j'aurais encore votre aide, et merci.

mercredi 28 juillet 2010 à 00:57:32 | Re : nombre de fichiers contenant le même terme dans un répertoire

mervat

bonsoir,
j'ai essayé meme autrement, sans l'utilisation d'une fonction,
j'ai ajouté dans le main ces instructions:
Code C/C++ :
while (entree >> s)
   ++map[s];
typedef std::map<std::string, int>::const_iterator iter;
  for (iter it = map.begin(); it != map.end(); ++it)
	 som = som+ it->second;
  if (strcmp (lecture->d_name, ".") !=0 && strcmp (lecture->d_name, "..") !=0)
  sortie << " les tf du document " << lecture->d_name << std::endl;
  for (iter it = map.begin(); it != map.end(); ++it)
	 if (som !=0)
	  sortie << "tf du mot " << it->first << " est " << (float)it->second / som << std::endl;
	som=0;

le résultat obtenu est encore erroné,
pour les 5 premiers fichiers,le résultat est bon, et pour les 2 derniers fichiers j'ai obtenu les mots et les tf du fichier précédent, comme si la lecture n'a pas été faite pour les 2 derniers fichiers.

j'espère avoir votre aide.
mercredi 28 juillet 2010 à 16:40:41 | Re : nombre de fichiers contenant le même terme dans un répertoire

CptPingu

Administrateur CodeS-SourceS
Réponse acceptée !
Tu ne dois pas essayer de calculer le tf en mettant tout dans la même map.
Tu fais une map par fichier. Pense vraiment à décomposer le plus possible en petite fonction. Plus tu fais de sous fonctions, plus ton code sera facile à réaliser.

J'ai repris ce que tu as fait, et ai juste ajouter une petite correction.
Code C/C++ :
#include <dirent.h>
#include <stdio.h>
#include <iostream>
#include <fstream>
#include <iomanip>
#include <map>

bool exists(const std::string& filename, const std::string& pattern)
{
  // entree se referme tout seul, lors de la desuction
  // de l'objet ifstream
  std::ifstream entree(filename.c_str());
  std::string s;
  while (entree >> s)
    if (s == pattern)
      return true;

  return false;
}

bool isValid(const std::string& path)
{
  return !path.empty() && path != "." && path != "..";
}

void fillMap(std::map<std::string, int>& map, const std::string& filename)
{
  std::ifstream entree(filename.c_str());
  std::string s;
  while (entree >> s)
    ++map[s];
}

void showTermFrequency(const std::string& filename)
{
  std::map<std::string, int> map;
  fillMap(map, filename);

  int som = 0;
  typedef std::map<std::string, int>::const_iterator iter;
  for (iter it = map.begin(); it != map.end(); ++it)
    som += it->second;

  std::cout << "\tLes tf du document " << filename << std::endl;
  for (iter it = map.begin(); it != map.end(); ++it)
    if (som !=0)
      std::cout << "\t\t* tf du mot " << it->first << " est " << (float)it->second / som << std::endl;
}

int main()
{
  static const std::string folder = "in";

  DIR* rep = opendir(folder.c_str());
  if (rep)
  {
    struct dirent* lecture;
    int nbFile = 0;
    int totalFile = 0;

    while ((lecture = readdir(rep)))
    {
      if (!isValid(lecture->d_name))
	continue;

      std::cout << std::left << std::setw(25) << lecture->d_name;
      ++totalFile;
      if (exists(folder + "/" + lecture->d_name, "118"))
      {
	std::cout << "existe" << std::endl;
	++nbFile;
      }
      else
	std::cout << "non" << std::endl;

      showTermFrequency(folder + "/" + lecture->d_name);
      std::cout << std::endl;
    }
    if (nbFile > 0)
      std::cout << "Le nombre de fichier contenant le terme est "
		<< nbFile << std::endl;
    closedir(rep);
    std::cout << "Le nombre de fichiers est : " << totalFile << std::endl;
  }

  return 0;
}


________________________________________________________________________
Historique de mes créations, et quelques articles:
http://0217021.free.fr/portfolio

Merci d'utiliser Réponse acceptée si un post répond à votre question
mercredi 28 juillet 2010 à 17:52:30 | Re : nombre de fichiers contenant le même terme dans un répertoire

mervat

tellement votre méthodologie est supère, lorsque j'ai lu le code, j'ai dit il est si simple, malgré que j'ai tant essayé et ça n'a pas marché.
j'ai juste une petite question, pourquoi vous avez mis le map en paramètre dans la fonction fillMap?

mercredi 28 juillet 2010 à 17:59:28 | Re : nombre de fichiers contenant le même terme dans un répertoire

CptPingu

Administrateur CodeS-SourceS
J'ai mis ceci pour éviter une copie couteuse inutile.
En effet, si j'avais retourné une std::map, il y aurait eu copie. Si j'avais retourné l'adresse d'une std::map, alors j'aurais pointé sur une zone qui aurait été libéré au sortir de la fonction et ça aurait planté.

J'aurais alors pu faire un "new std::map" et retourner le pointeur, puis le libérer. Mais j'ai préféré éviter cela.
Donc la map se fait remplir par la fonction, et se détruit toute seul.

________________________________________________________________________
Historique de mes créations, et quelques articles:
http://0217021.free.fr/portfolio

Merci d'utiliser Réponse acceptée si un post répond à votre question
mercredi 28 juillet 2010 à 18:08:22 | Re : nombre de fichiers contenant le même terme dans un répertoire

mervat

c'est vraiment super ce que vous dites, merci pour toutes ces explications.

1 2

Cette discussion est classée dans : nombre, fichiers, existe, contenant, terme


Répondre à ce message

Sujets en rapport avec ce message

aide sur les fichiers [ par dickymoe ] VinceExiste-t-il une fonction permettant de savoir si un fichier existe ?et une autre permettant de savoir si un fichier est vide ?merci Les fichiers *.ini et C++ comme en delphi [ par Le_neuveu ] J'aimerai savoir si quelqu'un sais si il existe une facon simple de gerer ses propres fichiers ini, il me semble qu'il existe un moyen en delphi et j' arborescence de fichiers [ par otofraise ] Bonjour,J'aimerais savoir s'il existe un composant qui permet d'obtenir l'arborescence des repertoires/fichiers d'une machine, qui possede en racine l fichiers partagés en cours d'utilisation [ par melkiorlenecrarque ] Bonjour,Existe-il une fonction qui recupere le contenu de la console msdos,ou alors existe-il une fonction qui est similaire à la commande dos "net fi nombre de documents où un terme apparaît [ par mervat ] le programme ci-dessous détermine le nombre de documents où le mot "terme" apparaît. il est exécutable et il donne comme résultat 2 car le mot "terme" Comparaison de fichiers en tant que nombre [ par vinceb666 ] bonjour,je cherche un moyen de comparer 2 fichiers en les considerant comme 2 nombres et savoir lequel des 2 est le plus grandpar exemple comparaison Algo de compression [ par PsyCaDi ] Bonjour,J'ai besoin de faire un petit prog qui me permettrait de compresser des répertoires contenant un maximum de 100 000 fichiers. J'ai des fichier trouver tous les fichiers d'un type d'un pc distant [ par laurent207 ] Bonjours,J'aimerai bien savoir comment récupérer tous les chemins de tous les fichiers d'un type particulier (*.lts) sur un pc distant sous windows . SOS manque d'inspiration [ par graall ] J'ai besoin de faire un petit programme (en mode console) qui demande à l'utilisateur de saisir le nom d'un fichier et ensuite, qui vérifie si ce fich private.h et private.rc [ par Scientophage ] J'ai un gros problème : à chaque compilation, mon compilateur (DEV Cpp 4.9.9.0) me crée deux fichiers : *private.h et *private.rc Cela a pour effet de


Nos sponsors


Sondage...

CalendriCode

Mai 2012
LMMJVSD
 123456
78910111213
14151617181920
21222324252627
28293031   

Consulter la suite du CalendriCode

A découvrir



 
Développement réalisé par Nicolas SOREL (Nix) avec l'aide de : Cyril DURAND et Emmanuel (EBArtSoft), Merci à Vincent pour ses précieux conseils.
CodeS-SourceS.com© Toute reproduction même partielle est interdite sauf accord écrit du Webmaster
CodeS-SourceS.com© est une marque déposée tous droits réservés

Google Coop CodeS-SourceS Google Coop CodeS-SourceS
Temps d'éxécution de la page : 4,883 sec (3)

Nous contacter | Annoncer sur CodeS-SourceS | Mentions légales