String Matching Aproximado mejorado con SIMD
Fecha
2019-12
Autores
Título de la revista
ISSN de la revista
Título del volumen
Editor
Facultad de Ciencias Exactas, Ingeniería y Agrimensura. Universidad Nacional de Rosario
Resumen
Consideramos la versión de k sustituciones de String Matching Aproximado (o búsqueda aproximada de cadenas) para uno solo y múltiples patrones. El problema básicamente consiste en encontrar todas las ocurrencias de uno o más patrones con a lo sumo k sustituciones de caracteres en un texto. Dada la gran popularidad de las extensiones de conjuntos de instrucciones SIMD (Single Instruction Multiple Data) en las CPUs actuales, presentamos nuevos algoritmos eficientes para este problema que las aprovechan. Medimos el rendimiento de cada nuevo algoritmo mediante pruebas exhaustivas en
diferentes textos de la vida real comparándolo con los algoritmos más competitivos conocidos hasta la fecha. Tomamos un enfoque práctico al tratar de mejorar el tiempo promedio de cada algoritmo.
Descripción
Palabras clave
algoritmos, distancia de Hamming, cadena de caracteres, strings, string matching aproximado, SIMD