Consideramos la versión de k sustituciones de string matching aproximado (o
búsqueda aproximada de cadenas) para uno solo y múltiples patrones. El
problema básicamente consiste en encontrar todas las ocurrencias de uno o
más patrones con a lo sumo k sustituciones de caracteres en un texto.
Dada la gran popularidad de las extensiones de conjuntos de instrucciones
SIMD (Single Instruction Multiple Data) en las CPUs actuales, presentamos
nuevos algoritmos eficientes para este problema que las aprovechan. Medimos
el rendimiento de cada nuevo algoritmo mediante pruebas exhaustivas en
diferentes textos de la vida real comparándolo con los algoritmos más
competitivos conocidos hasta la fecha. Tomamos un enfoque práctico al
tratar de mejorar el tiempo promedio de cada algoritmo.
Palabras clave
algoritmos, strings, SIMD, distancia Hamming, string matching aproximado