Red de conocimiento informático - Aprendizaje de código fuente - Algoritmo de similitud de texto-distancia Jaro

Algoritmo de similitud de texto-distancia Jaro

Dadas dos cadenas de texto, , su distancia Joro se define como:

Encuentra el número de caracteres coincidentes:

Los caracteres de, respectivamente, cuando If son iguales o la distancia es menor, se considera que son una coincidencia.

Por ejemplo: ="DIXON", ="DICKSONX"

Cada carácter se comparará con los caracteres dentro de la distancia media. Divida el número total de cadenas coincidentes que deben invertirse para coincidir entre dos para obtener el tamaño de las transposiciones. Las dos cadenas que coinciden aquí son: "DION", "DION", entonces.

Además =4, =8,

Entonces:

Referencia:

https://rosettacode.org/wiki/ Jaro_distancia #Java