Accueil > > > DISTANCE DE JARO-WINKLER
DISTANCE DE JARO-WINKLER
Information sur la source
Description
La distance de Jaro-Winkler mesure la similarité entre deux chaînes de caractères. Cette fonction permet de renvoyer la valeur de la distance de Jaro-Winkler. Elle est comprise entre 0 et 1 . voir : http://fr.wikipedia.org/wiki/Distance_de_Jaro-Wi nkler
Source
- #include <stdio.h>
- #include <stdlib.h>
- #include <string.h>
-
- #define true 0
- #define false 1
- #define max(x,y) ((x)>(y)?(x):(y))
- #define min(x,y) ((x)<(y)?(x):(y))
-
- char *TrouverMatches(char * txt,int *bl)
- {
- int i,j;
- char *res=malloc(256*sizeof(char));
- char ctmp='a';
- for (i=0;i<256;i++)
- {res[i]=0;}
- i=0,j=0;
- while (ctmp!=0)
- {
- ctmp=txt[i];
- if (bl[i]==true)
- {
- res[j]=ctmp;
- j++;
- }
- i++;
- }
- return res;
- }
-
-
- double JaroWinkler(char *t1,char *t2)
- {
- int ecartMax,l1,l2,compteMatching,compteTransposition,longueurPrefix,i,j;
- char *t1Matche,*t2Matche;
- int *b1,*b2;
- double distanceJaro;
- if (t1[0]==0 || t2[0]==0)
- return 0.0;
- l1=strlen(t1);
- l2=strlen(t2);
- ecartMax=(max(l1,l2)/2)-1;
- compteMatching=0;
- b1=malloc((l1+2)*sizeof(int));
- b2=malloc((l2+2)*sizeof(int));
- for (i=0;i<l1;i++)
- b1[i]=false;
- for (i=0;i<l2;i++)
- b2[i]=false;
-
- for (i=0;i<l1;i++)
- {
- for (j=max(i-ecartMax,0);j<=min(i+ecartMax,l2);j++)
- {
- if (t1[i]==t2[j])
- {
- b1[i]=true; //Indique qu'on a bien trouvé ce caractère
- b2[j]=true;
- compteMatching++; //Incrémente le nombre de caractères correspondants
- break;
- }
-
- }
-
- }
-
- if (compteMatching==0)
- return 0.0;
-
- t1Matche=TrouverMatches(t1,b1); //Génére la liste des caractères communs dans l'ordre de t1
- t2Matche=TrouverMatches(t2,b2);
-
- compteTransposition=0;
- if (strcmp(t1Matche,t2Matche)!=0)
- {
- for (i=0;i<strlen(t1Matche);i++)
- if (t1Matche[i]!=t2Matche[i])
- compteTransposition++; //Calcul le nombre de transpositions
- }
- else
- compteTransposition=0;
-
- free(t1Matche);
- free(t2Matche);
-
- distanceJaro=(((double)compteMatching/l1)+((double)compteMatching/l2)+((compteMatching-compteTransposition/2.0)/compteMatching))/3.0;
-
- longueurPrefix=0;
- for (i=0;i<min(3,min(l1,l2))+1;i++) //longueur max : 4
- {
- if (t1[i]==t2[i])
- longueurPrefix++;
- else
- break;
-
- }
- return distanceJaro+(longueurPrefix*0.1*(1-distanceJaro));
- }
-
-
- int main ()
- {
- char *t1=malloc(256*sizeof(char));
- char *t2=malloc(256*sizeof(char));
- strcpy(t1,"MARTHA");
- strcpy(t2,"MARHTA");
- printf("distance %s %s : %f\n",t1,t2,JaroWinkler(t1,t2));
- strcpy(t1,"DWAYNE");
- strcpy(t2,"DUANE");
- printf("distance %s %s : %f\n",t1,t2,JaroWinkler(t1,t2));
- strcpy(t1,"DIXON");
- strcpy(t2,"DICKSONX");
- printf("distance %s %s : %f\n",t1,t2,JaroWinkler(t1,t2));
-
- return 0;
- }
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#define true 0
#define false 1
#define max(x,y) ((x)>(y)?(x):(y))
#define min(x,y) ((x)<(y)?(x):(y))
char *TrouverMatches(char * txt,int *bl)
{
int i,j;
char *res=malloc(256*sizeof(char));
char ctmp='a';
for (i=0;i<256;i++)
{res[i]=0;}
i=0,j=0;
while (ctmp!=0)
{
ctmp=txt[i];
if (bl[i]==true)
{
res[j]=ctmp;
j++;
}
i++;
}
return res;
}
double JaroWinkler(char *t1,char *t2)
{
int ecartMax,l1,l2,compteMatching,compteTransposition,longueurPrefix,i,j;
char *t1Matche,*t2Matche;
int *b1,*b2;
double distanceJaro;
if (t1[0]==0 || t2[0]==0)
return 0.0;
l1=strlen(t1);
l2=strlen(t2);
ecartMax=(max(l1,l2)/2)-1;
compteMatching=0;
b1=malloc((l1+2)*sizeof(int));
b2=malloc((l2+2)*sizeof(int));
for (i=0;i<l1;i++)
b1[i]=false;
for (i=0;i<l2;i++)
b2[i]=false;
for (i=0;i<l1;i++)
{
for (j=max(i-ecartMax,0);j<=min(i+ecartMax,l2);j++)
{
if (t1[i]==t2[j])
{
b1[i]=true; //Indique qu'on a bien trouvé ce caractère
b2[j]=true;
compteMatching++; //Incrémente le nombre de caractères correspondants
break;
}
}
}
if (compteMatching==0)
return 0.0;
t1Matche=TrouverMatches(t1,b1); //Génére la liste des caractères communs dans l'ordre de t1
t2Matche=TrouverMatches(t2,b2);
compteTransposition=0;
if (strcmp(t1Matche,t2Matche)!=0)
{
for (i=0;i<strlen(t1Matche);i++)
if (t1Matche[i]!=t2Matche[i])
compteTransposition++; //Calcul le nombre de transpositions
}
else
compteTransposition=0;
free(t1Matche);
free(t2Matche);
distanceJaro=(((double)compteMatching/l1)+((double)compteMatching/l2)+((compteMatching-compteTransposition/2.0)/compteMatching))/3.0;
longueurPrefix=0;
for (i=0;i<min(3,min(l1,l2))+1;i++) //longueur max : 4
{
if (t1[i]==t2[i])
longueurPrefix++;
else
break;
}
return distanceJaro+(longueurPrefix*0.1*(1-distanceJaro));
}
int main ()
{
char *t1=malloc(256*sizeof(char));
char *t2=malloc(256*sizeof(char));
strcpy(t1,"MARTHA");
strcpy(t2,"MARHTA");
printf("distance %s %s : %f\n",t1,t2,JaroWinkler(t1,t2));
strcpy(t1,"DWAYNE");
strcpy(t2,"DUANE");
printf("distance %s %s : %f\n",t1,t2,JaroWinkler(t1,t2));
strcpy(t1,"DIXON");
strcpy(t2,"DICKSONX");
printf("distance %s %s : %f\n",t1,t2,JaroWinkler(t1,t2));
return 0;
}
Historique
- 07 avril 2009 21:26:32 :
- -
- 07 avril 2009 21:29:01 :
- -
- 08 avril 2009 15:00:49 :
- Correction de l'algo.
- 08 avril 2009 15:09:43 :
- oublie d'un -1...
- 08 avril 2009 21:40:41 :
- rajout <=
Sources de la même categorie
Commentaires et avis
Discussions en rapport avec ce code source dans le forum
Récupere le contenu d'un txt à distance via http [ par noplay ]
Je veux ouvrir une url (style http://www.hello.com/world.txt) et récuperer le contenu de cette page, ce code doit être portable puisque il sera compil
administration a distance [ par roverkiller ]
je cherche deux prog ou pluto deux sources en C (1 serveur et un client) pour une administrationa distance, lire des fichiers, lé modifié et pouvoir
Controle à distance [ par Belt ]
Salut à tous, je suis en train de créer une appli permettant de controller un pc à distance, la souris c bon, le clavier aussi mé pour voir lécran j'u
eteindre ordi à distance [ par morgandetoi06 ]
voila j aimerait savoir comment faire un programme qui se lance au demarage et qui permet avec un client de donner l ordre a l ordi de s eteindre ( en
cin zapé .? [ par morgandetoi06 ]
je capte pas, y a des cin>> qui sont zapés quand j execute ????#include <stdlib.h>#include <iostream>using namespace std;int main(vo
Peut on ouvrir un fichier à distance ?!? [ par LiBe444 ]
Cette question est bête mais j'aimerais savoir si on peut affecter à un handle la valeur FILE* hFile=fopen("http://www.example.com/truc","r");ou si c'
Executer un programme a distance [ par Lord_Did ]
Bonjour, Est-ce que c'est possible ( en cpp ), d'executer un programme a distance sur un autre poste ? J'ai besoin d'executer un programme qui me se
algorithme vecteur à distance [ par dado1984 ]
j ai bezsoin d'une application c realise l'algo vecteur à distance
connecter a un serveur a distance (urgent!!!!!!) [ par elfiosi ]
salut a tous, j'utilise la fonction mysql_real_connect sur visual C++ 6.0 pour acceder a une base de donnee a distance. Est ce que ca requiert une in
OpenGl distance de vue [ par fireuo ]
Bonjour je vien de commencer l'openGL et que commence a importer des 'Mess' dans mes projets. J'ai aussi rencontré un problème que je ne sui
|
Derniers Blogs
UNE JOLIE-HORLOGE ET PAS QU'UN PEU !UNE JOLIE-HORLOGE ET PAS QU'UN PEU ! par neodante
Pour les possesseurs d'iPhone, ça y est Bijin Tokei - qui se traduit littéralement en Français par " Jolie Horloge " - est arrivé et GRATUITEMENT s'il vous plaît ! Après la version Tokyo, Hokkaido, night club, racing, Gal, "pour les mademoiselles'", . voi...
Cliquez pour lire la suite de l'article par neodante TECHDAYS PARIS 2010 : CONNECTEZ VOS DONNéES à SHAREPOINT 2010 AVEC LES BUSINESS CONNECTIVITY SERVICESTECHDAYS PARIS 2010 : CONNECTEZ VOS DONNéES à SHAREPOINT 2010 AVEC LES BUSINESS CONNECTIVITY SERVICES par ROMELARD Fabrice
Animé par: Gaetan Bouveret et Julien Chomarat Business Connectivity Services (BCS) est dans SharePoint 2010 la version 2 de Business Data Catalog (BDC dans SharePoint 2007). Il s'agit de la solution permettant de visualiser des données provenan...
Cliquez pour lire la suite de l'article par ROMELARD Fabrice [DIVERS] SUIVRE VOS SéRIES PRéFéRéS SUR LA TOILE[DIVERS] SUIVRE VOS SéRIES PRéFéRéS SUR LA TOILE par orion
Comme de nombreux geek, je suis un grand amateur de série TV et je rate régulièrement des épisodes de mes séries préférés. Une solution s'offre à vous avec ce merveilleux site : Tv Gorge - www.tvgorge.com Moteur de recherche à l'appui, vous pouvez ...
Cliquez pour lire la suite de l'article par orion TECHDAYS PARIS 2010 : LA BI DANS SHAREPOINT 2010TECHDAYS PARIS 2010 : LA BI DANS SHAREPOINT 2010 par ROMELARD Fabrice
Animé par: Vincent Bellet et Baptiste Giraudier La BI dans SharePoint 2010, Les nouveaux services d'application dans SP2010 et SQL Server Reporting services 2008 R2. La BI dans SharePoint est généralisée pour tous afin de permettre à tous les coll...
Cliquez pour lire la suite de l'article par ROMELARD Fabrice
Forum
RE : WIN APIRE : WIN API par racpp
Cliquez pour lire la suite par racpp
Logiciels
DB-MAIN (9.1.0)DB-MAIN (9.1.0)DB-MAIN is a data-modeling and data-architecture tool. It is designed to help developers and anal... Cliquez pour télécharger DB-MAIN Xilisoft DPG Convertisseur (5.1.37.0120)XILISOFT DPG CONVERTISSEUR (5.1.37.0120)Xilisoft DPG Convertisseur offre aux fans de Nintendo DS une bonne solution leur permettant de dé... Cliquez pour télécharger Xilisoft DPG Convertisseur GraphicsGale (2.01.01)GRAPHICSGALE (2.01.01)GraphicsGale est un logiciel de PixelArt avec de nombreuse fonctionnalités permettant de réalisé ... Cliquez pour télécharger GraphicsGale Architecte 3D (Platinum 2010)ARCHITECTE 3D (PLATINUM 2010)Architecte 3D Platinium vous permet de concevoir facilement les plans votre future maison, de l'é... Cliquez pour télécharger Architecte 3D TeamViewer 5 (TeamViewer 5)TEAMVIEWER 5 (TEAMVIEWER 5)Dépanner un ami,expliquer une manipulation devient un jeu d'enfant.
Prise en main d'un autre ord... Cliquez pour télécharger TeamViewer 5
|