Mejora y actualización del paquete de R: CleanBSequences

Pozzi, Florencia I.

Mejora y actualización del paquete de R: CleanBSequences

dc.contributor.advisor	Felitti, Silvina
dc.creator	Pozzi, Florencia I.
dc.date.accessioned	2024-10-04T11:44:29Z
dc.date.available	2024-10-04T11:44:29Z
dc.date.issued	2022
dc.description.abstract	Este trabajo presenta un nuevo método y herramienta mejorada y actualizada para resolver un problema común de los biólogos moleculares y genetistas que utilizan marcadores moleculares en sus investigaciones y desarrollos científicos: la curación de secuencias. Los estudios ómicos realizados por biólogos moleculares y genetistas suelen implicar el uso de marcadores moleculares. AFLP, cDNA-AFLP y MSAP son ejemplos de marcadores que brindan información a nivel de genómica, transcriptómica y epigenómica, respectivamente. Estos tres tipos de marcadores moleculares usan adaptadores que son la plantilla para la amplificación por PCR. Las secuencias de los adaptadores tienen que ser eliminadas para el análisis de los resultados. Dado que en estos estudios se suele obtener un gran número de secuencias, esta limpieza de los datos podría demandar mucho tiempo y trabajo. Para automatizar este trabajo, previamente se creó un paquete R, llamado CleanBSequences cuya versión inicial fue 0.4.0, que permitía curar las secuencias de forma masiva, rápida, sin errores y que se pueden usar sin conexión. La curación se realizaba alineando los primers forward y/o reverse o los extremos de los vectores de clonación con las secuencias a eliminar. Después del alineamiento, se generaban nuevas subsecuencias sin fragmentos biológicos no deseados por el usuario, es decir, secuencias necesarias para las técnicas. A partir del uso de dicha herramienta se detectaron ciertos errores y mejoras a ser incluidos en una nueva versión del paquete. Se planteó como objetivo de trabajo mejorar y actualizar el paquete CleanBSequences en CRAN, con lo cual, los errores fueron subsanados y las mejoras incluidas en una nueva versión del paquete, para ello se trabajó sobre las funciones preexistentes (OnePrimerRemove y TwoPrimersRemove) y se generaron nuevas funciones (DNAStringSetOPR y DNAStringSetTPR). La nueva versión del paquete pasó por todos los chequeos correspondientes y fue publicada en CRAN como CleanBSequences 1.4.0. En conclusión, se logró mejorar y actualizar el paquete CleanBSequences en CRAN.
dc.description.abstract	This work presents a new method and an improved and updated tool to solve a common problem of molecular biologists and geneticists who use molecular markers in their scientific research and development: sequence curation. Omic studies conducted by molecular biologists and geneticists usually involve the use of molecular markers. AFLP, cDNA-AFLP, and MSAP are examples of markers that render information at the genomics, transcriptomics, and epigenomics levels, respectively. These three types of molecular markers use adaptors that are the template for PCR amplification. The sequences of the adaptors must be eliminated for the analysis of the results. Since a large number of sequences are usually obtained in these studies, data cleaning is a time-consuming and labor-intensive step. To automate this work, an R package was previously created, called CleanBSequences whose initial version was 0.4.0, which allowed curating sequences massively, quickly, without errors and that can be used offline. Curing was performed by aligning the forward and/or reverse primers or ends of cloning vectors with the sequences to be removed. After the alignment, new subsequences were generated without biological fragments unwanted by the user, that is, sequences necessary for the techniques. By using this tool errors and improvement opportunities were detected. The objective of the work was to improve and update the CleanBSequences package in CRAN, Errors were fixed and the improvements were included in a new version of the package. The pre-existing functions (OnePrimerRemove and TwoPrimersRemove) were modified and new functions (DNAStringSetOPR and DNAStringSetTPR) were developed. The new version of the package passed all the corresponding checks and was published on CRAN as CleanBSequences 1.4.0. In conclusion, it was possible to improve and update the CleanBSequences package in CRAN.
dc.description.fil	Fil.: Pozzi, Florencia I.. Facultad de Ciencias Agrarias. Universidad Nacional de Rosario
dc.identifier.uri	https://hdl.handle.net/2133/27928
dc.language.iso	es
dc.publisher	Facultad de Ciencias Agrarias. UNR
dc.rights	openAccess
dc.rights.holder	El autor
dc.rights.text	Attribution-NonCommercial-ShareAlike 4.0 International	en
dc.rights.uri	http://creativecommons.org/licenses/by-nc-sa/4.0/
dc.subject	CRAN
dc.subject	Marcadores moleculares
dc.subject	Secuencias biológicas
dc.title	Mejora y actualización del paquete de R: CleanBSequences
dc.type	tesis
dc.type.collection	tesis
dc.type.other	tesis de doctorado
dc.type.version	acceptedVersion
lom.educational.context	superior_no_universitario
lom.educational.context	grado
lom.educational.context	posgrado
lom.educational.difficulty	dificil
lom.educational.interactivity	expositiva
lom.educational.typicalAgeRange	adultos

Archivos

Bloque original

Mostrando 1 - 1 de 1

Nombre:: POZZI, Florencia -Trabajo Final Bioinformática.pdf
Tamaño:: 2.22 MB
Formato:: Adobe Portable Document Format

Descargar

Bloque de licencias

Mostrando 1 - 1 de 1

Nombre:: license.txt
Tamaño:: 3.87 KB
Formato:: Item-specific license agreed upon to submission
Descripción:

Descargar

Colecciones

FCA - Especialización en Bioinformática - Trabajos Finales