Salut tout le monde !
Je suis apprenti programmeur et je cherche a faire une analyse statistique sur des fichiers textes. Il s'agit en fait de programmer un module qui sera intégré dans un anti-spam.
On doit donc compter chaque mot et l'ajouter a un fichier de référence au cas ou ce serait des mots indésirables.
Bien évidemment on ne prend pas en compte les mots comme "de", "et", "le", "la". Il faut donc prendre en compte les mots qui ont plus de 3 caractères (mots significatifs).
J'ai juste besoin d'une idée algorithmique, plutot que tout le code.
Voilà, j'espère que vous pourrez m'aider.
Une réponse avant mercredi serait vivement souhaitée...
Merci de toute réponse ;)
@+