Mejora y actualización del paquete de R: CleanBSequences

Fecha

2022

Título de la revista

ISSN de la revista

Título del volumen

Editor

Facultad de Ciencias Agrarias. UNR
Resumen
Este trabajo presenta un nuevo método y herramienta mejorada y actualizada para resolver un problema común de los biólogos moleculares y genetistas que utilizan marcadores moleculares en sus investigaciones y desarrollos científicos: la curación de secuencias. Los estudios ómicos realizados por biólogos moleculares y genetistas suelen implicar el uso de marcadores moleculares. AFLP, cDNA-AFLP y MSAP son ejemplos de marcadores que brindan información a nivel de genómica, transcriptómica y epigenómica, respectivamente. Estos tres tipos de marcadores moleculares usan adaptadores que son la plantilla para la amplificación por PCR. Las secuencias de los adaptadores tienen que ser eliminadas para el análisis de los resultados. Dado que en estos estudios se suele obtener un gran número de secuencias, esta limpieza de los datos podría demandar mucho tiempo y trabajo. Para automatizar este trabajo, previamente se creó un paquete R, llamado CleanBSequences cuya versión inicial fue 0.4.0, que permitía curar las secuencias de forma masiva, rápida, sin errores y que se pueden usar sin conexión. La curación se realizaba alineando los primers forward y/o reverse o los extremos de los vectores de clonación con las secuencias a eliminar. Después del alineamiento, se generaban nuevas subsecuencias sin fragmentos biológicos no deseados por el usuario, es decir, secuencias necesarias para las técnicas. A partir del uso de dicha herramienta se detectaron ciertos errores y mejoras a ser incluidos en una nueva versión del paquete. Se planteó como objetivo de trabajo mejorar y actualizar el paquete CleanBSequences en CRAN, con lo cual, los errores fueron subsanados y las mejoras incluidas en una nueva versión del paquete, para ello se trabajó sobre las funciones preexistentes (OnePrimerRemove y TwoPrimersRemove) y se generaron nuevas funciones (DNAStringSetOPR y DNAStringSetTPR). La nueva versión del paquete pasó por todos los chequeos correspondientes y fue publicada en CRAN como CleanBSequences 1.4.0. En conclusión, se logró mejorar y actualizar el paquete CleanBSequences en CRAN.

Palabras clave

CRAN, Marcadores moleculares, Secuencias biológicas

Citación