Accueil > > > DISTANCE DE JARO-WINKLER
DISTANCE DE JARO-WINKLER
Information sur la source
Description
La distance de Jaro-Winkler mesure la similarité entre deux chaînes de caractères. Cette fonction permet de renvoyer la valeur de la distance de Jaro-Winkler. Elle est comprise entre 0 et 1 . voir : http://fr.wikipedia.org/wiki/Distance_de_Jaro-Wi nkler
Source
- #include <stdio.h>
- #include <stdlib.h>
- #include <string.h>
-
- #define true 0
- #define false 1
- #define max(x,y) ((x)>(y)?(x):(y))
- #define min(x,y) ((x)<(y)?(x):(y))
-
- char *TrouverMatches(char * txt,int *bl)
- {
- int i,j;
- char *res=malloc(256*sizeof(char));
- char ctmp='a';
- for (i=0;i<256;i++)
- {res[i]=0;}
- i=0,j=0;
- while (ctmp!=0)
- {
- ctmp=txt[i];
- if (bl[i]==true)
- {
- res[j]=ctmp;
- j++;
- }
- i++;
- }
- return res;
- }
-
-
- double JaroWinkler(char *t1,char *t2)
- {
- int ecartMax,l1,l2,compteMatching,compteTransposition,longueurPrefix,i,j;
- char *t1Matche,*t2Matche;
- int *b1,*b2;
- double distanceJaro;
- if (t1[0]==0 || t2[0]==0)
- return 0.0;
- l1=strlen(t1);
- l2=strlen(t2);
- ecartMax=(max(l1,l2)/2)-1;
- compteMatching=0;
- b1=malloc((l1+2)*sizeof(int));
- b2=malloc((l2+2)*sizeof(int));
- for (i=0;i<l1;i++)
- b1[i]=false;
- for (i=0;i<l2;i++)
- b2[i]=false;
-
- for (i=0;i<l1;i++)
- {
- for (j=max(i-ecartMax,0);j<=min(i+ecartMax,l2);j++)
- {
- if (t1[i]==t2[j])
- {
- b1[i]=true; //Indique qu'on a bien trouvé ce caractère
- b2[j]=true;
- compteMatching++; //Incrémente le nombre de caractères correspondants
- break;
- }
-
- }
-
- }
-
- if (compteMatching==0)
- return 0.0;
-
- t1Matche=TrouverMatches(t1,b1); //Génére la liste des caractères communs dans l'ordre de t1
- t2Matche=TrouverMatches(t2,b2);
-
- compteTransposition=0;
- if (strcmp(t1Matche,t2Matche)!=0)
- {
- for (i=0;i<strlen(t1Matche);i++)
- if (t1Matche[i]!=t2Matche[i])
- compteTransposition++; //Calcul le nombre de transpositions
- }
- else
- compteTransposition=0;
-
- free(t1Matche);
- free(t2Matche);
-
- distanceJaro=(((double)compteMatching/l1)+((double)compteMatching/l2)+((compteMatching-compteTransposition/2.0)/compteMatching))/3.0;
-
- longueurPrefix=0;
- for (i=0;i<min(3,min(l1,l2))+1;i++) //longueur max : 4
- {
- if (t1[i]==t2[i])
- longueurPrefix++;
- else
- break;
-
- }
- return distanceJaro+(longueurPrefix*0.1*(1-distanceJaro));
- }
-
-
- int main ()
- {
- char *t1=malloc(256*sizeof(char));
- char *t2=malloc(256*sizeof(char));
- strcpy(t1,"MARTHA");
- strcpy(t2,"MARHTA");
- printf("distance %s %s : %f\n",t1,t2,JaroWinkler(t1,t2));
- strcpy(t1,"DWAYNE");
- strcpy(t2,"DUANE");
- printf("distance %s %s : %f\n",t1,t2,JaroWinkler(t1,t2));
- strcpy(t1,"DIXON");
- strcpy(t2,"DICKSONX");
- printf("distance %s %s : %f\n",t1,t2,JaroWinkler(t1,t2));
-
- return 0;
- }
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#define true 0
#define false 1
#define max(x,y) ((x)>(y)?(x):(y))
#define min(x,y) ((x)<(y)?(x):(y))
char *TrouverMatches(char * txt,int *bl)
{
int i,j;
char *res=malloc(256*sizeof(char));
char ctmp='a';
for (i=0;i<256;i++)
{res[i]=0;}
i=0,j=0;
while (ctmp!=0)
{
ctmp=txt[i];
if (bl[i]==true)
{
res[j]=ctmp;
j++;
}
i++;
}
return res;
}
double JaroWinkler(char *t1,char *t2)
{
int ecartMax,l1,l2,compteMatching,compteTransposition,longueurPrefix,i,j;
char *t1Matche,*t2Matche;
int *b1,*b2;
double distanceJaro;
if (t1[0]==0 || t2[0]==0)
return 0.0;
l1=strlen(t1);
l2=strlen(t2);
ecartMax=(max(l1,l2)/2)-1;
compteMatching=0;
b1=malloc((l1+2)*sizeof(int));
b2=malloc((l2+2)*sizeof(int));
for (i=0;i<l1;i++)
b1[i]=false;
for (i=0;i<l2;i++)
b2[i]=false;
for (i=0;i<l1;i++)
{
for (j=max(i-ecartMax,0);j<=min(i+ecartMax,l2);j++)
{
if (t1[i]==t2[j])
{
b1[i]=true; //Indique qu'on a bien trouvé ce caractère
b2[j]=true;
compteMatching++; //Incrémente le nombre de caractères correspondants
break;
}
}
}
if (compteMatching==0)
return 0.0;
t1Matche=TrouverMatches(t1,b1); //Génére la liste des caractères communs dans l'ordre de t1
t2Matche=TrouverMatches(t2,b2);
compteTransposition=0;
if (strcmp(t1Matche,t2Matche)!=0)
{
for (i=0;i<strlen(t1Matche);i++)
if (t1Matche[i]!=t2Matche[i])
compteTransposition++; //Calcul le nombre de transpositions
}
else
compteTransposition=0;
free(t1Matche);
free(t2Matche);
distanceJaro=(((double)compteMatching/l1)+((double)compteMatching/l2)+((compteMatching-compteTransposition/2.0)/compteMatching))/3.0;
longueurPrefix=0;
for (i=0;i<min(3,min(l1,l2))+1;i++) //longueur max : 4
{
if (t1[i]==t2[i])
longueurPrefix++;
else
break;
}
return distanceJaro+(longueurPrefix*0.1*(1-distanceJaro));
}
int main ()
{
char *t1=malloc(256*sizeof(char));
char *t2=malloc(256*sizeof(char));
strcpy(t1,"MARTHA");
strcpy(t2,"MARHTA");
printf("distance %s %s : %f\n",t1,t2,JaroWinkler(t1,t2));
strcpy(t1,"DWAYNE");
strcpy(t2,"DUANE");
printf("distance %s %s : %f\n",t1,t2,JaroWinkler(t1,t2));
strcpy(t1,"DIXON");
strcpy(t2,"DICKSONX");
printf("distance %s %s : %f\n",t1,t2,JaroWinkler(t1,t2));
return 0;
}
Historique
- 07 avril 2009 21:26:32 :
- -
- 07 avril 2009 21:29:01 :
- -
- 08 avril 2009 15:00:49 :
- Correction de l'algo.
- 08 avril 2009 15:09:43 :
- oublie d'un -1...
- 08 avril 2009 21:40:41 :
- rajout <=
Sources de la même categorie
Commentaires et avis
Discussions en rapport avec ce code source dans le forum
Récupere le contenu d'un txt à distance via http [ par noplay ]
Je veux ouvrir une url (style http://www.hello.com/world.txt) et récuperer le contenu de cette page, ce code doit être portable puisque il sera compil
administration a distance [ par roverkiller ]
je cherche deux prog ou pluto deux sources en C (1 serveur et un client) pour une administrationa distance, lire des fichiers, lé modifié et pouvoir
Controle à distance [ par Belt ]
Salut à tous, je suis en train de créer une appli permettant de controller un pc à distance, la souris c bon, le clavier aussi mé pour voir lécran j'u
eteindre ordi à distance [ par morgandetoi06 ]
voila j aimerait savoir comment faire un programme qui se lance au demarage et qui permet avec un client de donner l ordre a l ordi de s eteindre ( en
cin zapé .? [ par morgandetoi06 ]
je capte pas, y a des cin>> qui sont zapés quand j execute ????#include <stdlib.h>#include <iostream>using namespace std;int main(vo
Peut on ouvrir un fichier à distance ?!? [ par LiBe444 ]
Cette question est bête mais j'aimerais savoir si on peut affecter à un handle la valeur FILE* hFile=fopen("http://www.example.com/truc","r");ou si c'
Executer un programme a distance [ par Lord_Did ]
Bonjour, Est-ce que c'est possible ( en cpp ), d'executer un programme a distance sur un autre poste ? J'ai besoin d'executer un programme qui me se
algorithme vecteur à distance [ par dado1984 ]
j ai bezsoin d'une application c realise l'algo vecteur à distance
connecter a un serveur a distance (urgent!!!!!!) [ par elfiosi ]
salut a tous, j'utilise la fonction mysql_real_connect sur visual C++ 6.0 pour acceder a une base de donnee a distance. Est ce que ca requiert une in
OpenGl distance de vue [ par fireuo ]
Bonjour je vien de commencer l'openGL et que commence a importer des 'Mess' dans mes projets. J'ai aussi rencontré un problème que je ne sui
|
Derniers Blogs
TECHDAYS PARIS 2012 : COMMENT SHAREPOINT A SAUVé MES TECHDAYSTECHDAYS PARIS 2012 : COMMENT SHAREPOINT A SAUVé MES TECHDAYS par ROMELARD Fabrice
Speakers : Lionel Limozin et Alain Marty La session commence par une découverte de SharePoint à travers la mise en place d'un environnement SharePoint pour la gestion des Sessions animées par BeWise. Le besoin est très ba...
Cliquez pour lire la suite de l'article par ROMELARD Fabrice PERSPECTIVE 3.0 POUR SILVERLIGHT 5.0PERSPECTIVE 3.0 POUR SILVERLIGHT 5.0 par odewit
Je viens de publier la version 3.0 de Perspective pour Silverlight, qui regroupe un portage sous Silverlight 5.0 des fonctionnalités de Perspective 2.0, le framework 3D de haut-niveau introduit récemment et de nouveaux exemples de code. En voici la li...
Cliquez pour lire la suite de l'article par odewit TECHDAYS PARIS 2012 : TOP 10 DES BEST PRACTICES POUR SQL SERVERTECHDAYS PARIS 2012 : TOP 10 DES BEST PRACTICES POUR SQL SERVER par ROMELARD Fabrice
Speaker : Nadia Ben El Kadi Configuration machine La session commence par la toute première question à se poser lors de la mise en place d'environnement SQL Server, la configuration des machines : Type de mac...
Cliquez pour lire la suite de l'article par ROMELARD Fabrice TECHDAYS PARIS 2012 : KINECT + OFFICE 365 UN BON GESTE POUR VOTRE SITECHDAYS PARIS 2012 : KINECT + OFFICE 365 UN BON GESTE POUR VOTRE SI par ROMELARD Fabrice
Speakers : Fabrice Barbin, Samuel Blanchard, Julien Lo Presti Titre Prometteur et attractif invitant à voir comment lier le composant ludique Kinect dans le cadre d'une structure IT classique, notamment au travers de la plat...
Cliquez pour lire la suite de l'article par ROMELARD Fabrice TECHDAYS PARIS 2012 : PLEINIèRE DU PREMIER JOURTECHDAYS PARIS 2012 : PLEINIèRE DU PREMIER JOUR par ROMELARD Fabrice
KeyNotes du premier jour pour les développeurs. La session est principalement axée sur une des principales directions prise par Microsoft à travers tous ses nouveaux produits : Cloud privé ou public (Solution Azure) ...
Cliquez pour lire la suite de l'article par ROMELARD Fabrice
Forum
C++ C++ par yesoun1
Cliquez pour lire la suite par yesoun1 OPNETOPNET par hth21
Cliquez pour lire la suite par hth21 RE : ARBRE BINAIRERE : ARBRE BINAIRE par pacotheking
Cliquez pour lire la suite par pacotheking
Logiciels
Academy System (17.2.1.0)ACADEMY SYSTEM (17.2.1.0)Logiciel de gestion des établissements.
- élèves/étudiants (inscription, dossier, absence...)
-... Cliquez pour télécharger Academy System Easy-Planning (1.0.0.1)EASY-PLANNING (1.0.0.1)Basé sur les mêmes principes que MyPlanning, Easy-Planning permet de créer des plannings sous la ... Cliquez pour télécharger Easy-Planning COLLECTOR PLUS (3.00B)COLLECTOR PLUS (3.00B)COLLECTOR PLUS version 3.00B est un logiciel utilisant une base de données alimentée par :
- L... Cliquez pour télécharger COLLECTOR PLUS PONAMEDIA PREMIUM - HELLLOOO FLASH DEMO (V7.4)PONAMEDIA PREMIUM - HELLLOOO FLASH DEMO (V7.4)PONAMEDIA TV DEVIENS HELLLOOO FLASH
LA TV SUR VOTRE ORDINATEUR.
Toute une plateforme Multi... Cliquez pour télécharger PONAMEDIA PREMIUM - HELLLOOO FLASH DEMO LettresFaciles 2011 (8.0.0.1)LETTRESFACILES 2011 (8.0.0.1)LettresFaciles est un logiciel facilitant la création et la rédaction de lettres types.
Son inte... Cliquez pour télécharger LettresFaciles 2011
|