Mejora y actualización del paquete de R: CleanBSequences
dc.contributor.advisor | Felitti, Silvina | |
dc.creator | Pozzi, Florencia I. | |
dc.date.accessioned | 2024-10-04T11:44:29Z | |
dc.date.available | 2024-10-04T11:44:29Z | |
dc.date.issued | 2022 | |
dc.description.abstract | Este trabajo presenta un nuevo método y herramienta mejorada y actualizada para resolver un problema común de los biólogos moleculares y genetistas que utilizan marcadores moleculares en sus investigaciones y desarrollos científicos: la curación de secuencias. Los estudios ómicos realizados por biólogos moleculares y genetistas suelen implicar el uso de marcadores moleculares. AFLP, cDNA-AFLP y MSAP son ejemplos de marcadores que brindan información a nivel de genómica, transcriptómica y epigenómica, respectivamente. Estos tres tipos de marcadores moleculares usan adaptadores que son la plantilla para la amplificación por PCR. Las secuencias de los adaptadores tienen que ser eliminadas para el análisis de los resultados. Dado que en estos estudios se suele obtener un gran número de secuencias, esta limpieza de los datos podría demandar mucho tiempo y trabajo. Para automatizar este trabajo, previamente se creó un paquete R, llamado CleanBSequences cuya versión inicial fue 0.4.0, que permitía curar las secuencias de forma masiva, rápida, sin errores y que se pueden usar sin conexión. La curación se realizaba alineando los primers forward y/o reverse o los extremos de los vectores de clonación con las secuencias a eliminar. Después del alineamiento, se generaban nuevas subsecuencias sin fragmentos biológicos no deseados por el usuario, es decir, secuencias necesarias para las técnicas. A partir del uso de dicha herramienta se detectaron ciertos errores y mejoras a ser incluidos en una nueva versión del paquete. Se planteó como objetivo de trabajo mejorar y actualizar el paquete CleanBSequences en CRAN, con lo cual, los errores fueron subsanados y las mejoras incluidas en una nueva versión del paquete, para ello se trabajó sobre las funciones preexistentes (OnePrimerRemove y TwoPrimersRemove) y se generaron nuevas funciones (DNAStringSetOPR y DNAStringSetTPR). La nueva versión del paquete pasó por todos los chequeos correspondientes y fue publicada en CRAN como CleanBSequences 1.4.0. En conclusión, se logró mejorar y actualizar el paquete CleanBSequences en CRAN. | |
dc.description.abstract | This work presents a new method and an improved and updated tool to solve a common problem of molecular biologists and geneticists who use molecular markers in their scientific research and development: sequence curation. Omic studies conducted by molecular biologists and geneticists usually involve the use of molecular markers. AFLP, cDNA-AFLP, and MSAP are examples of markers that render information at the genomics, transcriptomics, and epigenomics levels, respectively. These three types of molecular markers use adaptors that are the template for PCR amplification. The sequences of the adaptors must be eliminated for the analysis of the results. Since a large number of sequences are usually obtained in these studies, data cleaning is a time-consuming and labor-intensive step. To automate this work, an R package was previously created, called CleanBSequences whose initial version was 0.4.0, which allowed curating sequences massively, quickly, without errors and that can be used offline. Curing was performed by aligning the forward and/or reverse primers or ends of cloning vectors with the sequences to be removed. After the alignment, new subsequences were generated without biological fragments unwanted by the user, that is, sequences necessary for the techniques. By using this tool errors and improvement opportunities were detected. The objective of the work was to improve and update the CleanBSequences package in CRAN, Errors were fixed and the improvements were included in a new version of the package. The pre-existing functions (OnePrimerRemove and TwoPrimersRemove) were modified and new functions (DNAStringSetOPR and DNAStringSetTPR) were developed. The new version of the package passed all the corresponding checks and was published on CRAN as CleanBSequences 1.4.0. In conclusion, it was possible to improve and update the CleanBSequences package in CRAN. | |
dc.description.fil | Fil.: Pozzi, Florencia I.. Facultad de Ciencias Agrarias. Universidad Nacional de Rosario | |
dc.identifier.uri | https://hdl.handle.net/2133/27928 | |
dc.language.iso | es | |
dc.publisher | Facultad de Ciencias Agrarias. UNR | |
dc.rights | openAccess | |
dc.rights.holder | El autor | |
dc.rights.text | Attribution-NonCommercial-ShareAlike 4.0 International | en |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-sa/4.0/ | |
dc.subject | CRAN | |
dc.subject | Marcadores moleculares | |
dc.subject | Secuencias biológicas | |
dc.title | Mejora y actualización del paquete de R: CleanBSequences | |
dc.type | tesis | |
dc.type.collection | tesis | |
dc.type.other | tesis de doctorado | |
dc.type.version | acceptedVersion | |
lom.educational.context | superior_no_universitario | |
lom.educational.context | grado | |
lom.educational.context | posgrado | |
lom.educational.difficulty | dificil | |
lom.educational.interactivity | expositiva | |
lom.educational.typicalAgeRange | adultos |