Mejoramiento biotecnológico de la calidad del durazno, mapeo por asociación de caracteres de interés agronómico
dc.contributor.advisor | Sánchez, Gerardo | |
dc.contributor.coadvisor | Cervigni, Gerardo Domingo Lucio | |
dc.creator | Aballay, Maximiliano Martín | |
dc.date.accessioned | 2024-07-01T13:17:13Z | |
dc.date.available | 2024-07-01T13:17:13Z | |
dc.date.issued | 2023 | |
dc.description.abstract | El duraznero es una especie que pertenece a la familia Rosaceae, el cual presenta un periodo juvenil que requiere entre 3 a 4 años para desarrollarse completamente. Debido al carácter auto-compatible y los extensos periodos de generación, esta especie posee una reducida variabilidad genética en comparación con otras. Estas características dificultan el mejoramiento del duraznero, por lo cual es de vital importancia implementar herramientas que modernicen los programas de mejora con el fin de escalar el desarrollo de nuevas variedades. Durante los últimos años se han producido grandes avances en las tecnologías de secuenciación, que han impulsado los estudios genómicos de duraznero. Esto permitió la implementación de la metodología GenomeWide Association Study (GWAS), para identificar variantes genéticas vinculadas a caracteres fenotípicos. Sin embargo, la complejidad de los caracteres poligénicos y la dificultad para diferenciar las variantes causales de otras altamente correlacionadas son las principales limitaciones de GWAS. Una alternativa de interés para este tipo de análisis, es el algoritmo de aprendizaje automático Random Forest (RF), el cual puede analizar grandes conjuntos de datos genómicos, y definir la influencia que tienen las variantes genéticas sobre los caracteres fenotípicos, siendo capaz de generar predicciones para dichos caracteres. Estas propiedades hacen de RF un método prometedor para ser aplicado en duraznero, ya que el entrenamiento de este tipo de modelos podría ayudar a identificar variantes genéticas asociadas a caracteres fenotípicos complejos, y predecir su comportamiento según la presencia/ausencia de estas variantes. En este trabajo se realizó la puesta a punto de la plataforma de genotipado de alto rendimiento conocida como double digest Restriction-site Associated DNA sequencing (ddRAD-seq) en duraznero, la cual no había sido aplicada en esta especie hasta el momento. Esta plataforma fue utilizada para caracterizar en profundidad la variabilidad genética contenida en la colección de germoplasma de la Estación Experimental Agropecuaria (EEA) San Pedro. Como resultado de este proceso se genotiparon 237 accesiones de duraznero (en donde se incluyen 3 portainjertos) y 2 ciruelos japoneses. Los datos de secuenciación presentan en promedio 1 M de lecturas de extremos apareados(2 × 250 pb) por genotipo. A partir del alineamiento de las lecturas al genoma de referencia se observó que las mismas se distribuyen de manera uniforme a lo largo de los 8 cromosomas. En la búsqueda de variantes se identificaron un total de 197.906 Single Nucleotide Polymorphisms (SNP), 16.338 Insertions/Deletions (InDel) y 2.712 Simple Sequence Repeats (SSR). Estas variantes luego de ser filtradas utilizando un porcentaje de datos faltantes menor al 10 % y un valor de Minor allele Frequency (MAF) mayor al 1 % se redujeron a 11.871 SNP, 1.214 InDel y 499 SSR (sumando un total de 13.584 variantes). Mediante una combinación de análisis multivariados se describió la relación que existe entre los genotipos de duraznero. Además, con la inclusión de los datos de 48 genotipos de duraznero recientemente secuenciados fue posible describir por primera vez fuentes de variabilidad de germoplasmas naturalizado en el país. Elset de 13.584 variantes genéticas de las 237 accesiones de duraznero fue utilizado para analizar la asociación con caracteres de interés agronómico mediante las metodologías de GWAS y RF. Estos métodos tienen la capacidad de identificar variantes asociadas con un carácter en particular, pero utilizan enfoques diferentes. Al utilizar ambas metodologías se busca comprobar si RF se puede desempeñar de igual manera o mejor que GWAS en duraznero, además de validar la metodología RF como método de predicción para ser aplicado en el programa de mejoramiento de duraznero. Con estos métodos se analizaron los caracteres color de pulpa, tipo de pulpa, vellosidad del fruto, capacidad antioxidante, contenido de fenoles, firmeza, peso, contenido de sólidos solubles, fecha de floración y fecha de cosecha. Como resultado de este análisis se observó asociación con los dos métodos para los caracteres color de pulpa, tipo de pulpa, vellosidad del fruto, fecha de floración y fecha de cosecha. Los dos métodos apuntan a regiones genómicas similares en cada carácter que presentó asociación. Para cada una de estas regiones se identificaron las principales variantes asociadas con cada carácter, así como también los haplobloques que contienen a dichas variantes. Los datos de las 13.584 variantes genéticas también fueron utilizados para realizar la simulación de cruzamientos entre genotipos y analizar las características de la progenie artificial obtenida. Con el objetivo de evaluar la capacidad de estas simulaciones, primero se generaron una serie de cruzamientos de prueba para comparar con cruzamientos reales que se encuentran junto a los parentales dentro de los 237 genotipos analizados. A partir del análisis de estos datos se observó que con las simulaciones de cruzamientos es posible generar genotipos artificiales con perfiles genómicos cercanos a los originados por cruzamientos reales. Una vez realizada esta validación se procedió a simular todos los cruzamientos posibles entre los 237 genotipos, con una progenie de 100 genotipos artificiales por cruzamiento. Para estos nuevos genotipos se realizaron predicciones utilizando los modelos de RF previamente entrenados con datos de caracteres de vellosidad del fruto, color de pulpa, tipo de pulpa, fecha de floración y fecha de cosecha. Como resultado de esta serie de simulaciones se obtuvo un total de 2.820.300 genotipos artificiales, para los cuales se predijo el comportamiento de cada uno de los caracteres mencionados. Con estas predicciones es posible identificar aquellos genotipos artificiales que presentan las características de mayor interés y reconocer la combinación de parentales de la cual provienen. De esta manera se puede realizar una selección más rigurosa de parentales a cruzar, ayudando a desarrollar un programa de mejoramiento de duraznero más eficiente | |
dc.description.fil | Fil: Aballay, Maxiliano Martín. Universidad Nacional de Rosario. Facultad de Ciencias Bioquímicas y Farmacéuticas. Consejo Nacional de Investigaciones Científicas y Técnicas. Instituto Nacional de Tecnología Agropecuaria; Argentina. | |
dc.identifier.uri | https://hdl.handle.net/2133/27383 | |
dc.language.iso | es | |
dc.rights | embargoedAccess | |
dc.rights.holder | Aballay, Maximiliano Martín | |
dc.rights.holder | Universidad Nacional de Rosario. Facultad de Ciencias Bioquímicas y Farmacéuticas | |
dc.rights.text | Attribution-NonCommercial-NoDerivs 2.5 Argentina | en |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/2.5/ar/ | |
dc.subject | Duraznero | |
dc.subject | Mejoramiento | |
dc.subject | Genotipado | |
dc.subject | ddRAD-seq | |
dc.title | Mejoramiento biotecnológico de la calidad del durazno, mapeo por asociación de caracteres de interés agronómico | |
dc.type | tesis | |
dc.type.collection | tesis | |
dc.type.other | tesis de doctorado | |
dc.type.version | acceptedVersion |