La sélection génomique est une approche récente en sélection variétale qui utilise conjointement et un grand nombre de marqueurs moléculaires répartis sur l’ensemble du génome afin de prédire les performances de génotypes non phénotypés. Dans un contexte de croissance de son schéma de sélection colza d’hiver, Euralis semences s’interroge quant à l’applicabilité et l’intérêt d’une telle méthode sur son pool lignées mâles élite.
Dans cette étude, nous étudions le potentiel de la sélection génomique à prédire les performances en combinaison sur testeur (test-cross), entre testeur et sur différentes années dans un programme de sélection colza d’hiver hybride pour plusieurs caractères d’intérêts. De même, nous avons adressé la question de la prédiction en population structurée. Enfin, une[...]
La sélection génomique est une approche récente en sélection variétale qui utilise conjointement et un grand nombre de marqueurs moléculaires répartis sur l’ensemble du génome afin de prédire les performances de génotypes non phénotypés. Dans un contexte de croissance de son schéma de sélection colza d’hiver, Euralis semences s’interroge quant à l’applicabilité et l’intérêt d’une telle méthode sur son pool lignées mâles élite.
Dans cette étude, nous étudions le potentiel de la sélection génomique à prédire les performances en combinaison sur testeur (test-cross), entre testeur et sur différentes années dans un programme de sélection colza d’hiver hybride pour plusieurs caractères d’intérêts. De même, nous avons adressé la question de la prédiction en population structurée. Enfin, une méthode prenant en compte l’architecture génétique du caractère a été proposée afin d’optimiser le modèle de prédiction.
Dans cette étude, une population de 281 lignées haploïdes-doublées du pool mâle élite en colza d’hiver (Brassica napus) issues de 11 départs biparentaux interconnectés a été génotypée sur 10 284 SNP répartis sur l’ensemble du génome. En parallèle, les hybrides de combinaison entre les polinisateurs élites et un ou deux testeurs femelles élites sont évalués pour des caractères agronomique (précocité de floraison), de qualité (huile, glucosinolates, protéines) et rendement grain dans 4 lieux en 2014 et 2015 selon la disponibilité des lignées.
Nous avons utilisé le modèle G-BLUP single-step en validation croisée afin d’évaluer la sensibilité de la précision de prédiction (accuracy) vis-à-vis de différents facteurs.
Une première étude montre qu’un échantillonnage du jeu d’entrainement par clusters respectant la structuration de la population est à privilégier dans ce type de population. De plus, les résultats montrent que pour les caractères complexes, il est préférable de travailler avec un jeu d’entrainement évaluée sur un minimum de deux années en combinaison sur deux testeurs. La prédiction des performances entre années est envisageable pour Euralis semences mais nécessite une optimisation de la calibration du modèle au regard du caractère d’intérêt.
En population structurée, nos résultats montrent que la variance entre départs contribue grandement à la précision des prédictions et abouti à une surestimation de la précision des prédictions sur l’ensemble de la population. Nous avons de même montré que la prédiction entre départs abouti à des précisions plus faibles mais néanmoins intéressantes pour les caractères hautement polygéniques (rendement grain : 0,20 ; taux d’huile : 0,20).
Enfin, l’utilisation d’une matrice d’apparentement caractère-spécifique calculée à partir de posterior d’un modèle BayesCπ traduisant l’architecture génétique du caractère dans la population d’entrainement apporte un gain significatif d’accuracy + 14,97% (+/− 8%) pour la précocité de floraison gouvernée par un nombre réduit de QTL à effet majeur. Néanmoins dans notre étude, ce modèle n’apporte pas de gain positif significatif pour les autres caractères étudiés.
Ces résultats suggèrent que la sélection génomique peut être intéressante pour la prédiction des performances en test-cross en multi-départs pour les caractères de qualité de la graine (concentration en glucosinolates : 0,80) et agronomiques (précocité de floraison : 0,60) mais aussi pour des caractères économiquement plus intéressants tels que le rendement (0,45). Dans un contexte de développement et d’optimisation économique du programme de sélection colza d’hiver, l’implémentation de la sélection génomique nécessiterait (i) une sélection précoce sur des critères qui sont actuellement travaillés plus tard dans le schéma et/ou (ii) par une substitution du phénotypage par la prédiction génomique pour certains individus. Des évaluations pratiques ou par simulations restent cependant à mettre en oeuvre pour valider de telles propositions et évaluer le risque de perte de diversité et donc de gain génétique à long terme.
With the development of high-throughput sequencing technologies and commercial availability of genotyping bead-chip, large number of single nucleotides polymorphism can be obtained cheaply. In this context, genomic selection is a recent approach in plant breeding expected to increase genetic gains by increasing selection intensity and accelerating the breeding cycle. Genomic selection exploits dense genome-wide markers to predict breeding values of unphenotyped genotypes. For this purpose, a prediction equation is built using both genome-wide markers data and phenotypes of training individuals.
In the frame of rapeseed breeding scheme expansion at Euralis semences, genomic selection is examined on test-cross performances in the elite pollinator breeding pool to increase genetic gain per unit of cost. In this study we used a single step G-BLUP model and cross-validation to assess the performance of genome-based prediction within and across testers and years in a biparental population. The accuracy of predictions in structured breeding population is also addressed in this study. Then, we extended the G-BLUP approach to take into consideration genetic architecture and improve predictions by deriving a marker-based relationship matrix specifically for the trait of interest (Gpond-BLUP). A method for calculating this kinship is proposed using markers probabilities outcome of BayesC models.
Here, 281 rapeseed (Brassica napus L.) double-haploid lines are derived from 11 initial interconnected families and genotyped for 10,284 genome-wide single nucleotides polymorphism markers. Test-cross hybrids with one or two female testers are evaluated in four environments in 2014 and 2015 for agronomical traits (flowering time), grain quality traits (glucosinolates, oil and protein grain content) and grain yield.
In cross-validation process, predictive ability is maximized when the training set arise from a stratified sampling to represent the over-all population structuration. Moreover, for complex traits it seems more appropriate to train the model on at least two years and two representative testers, to predict performance across years.
Our results illustrate that among-family variance contribution to prediction accuracy depends on the trait considered, but always leads to an overestimation of the prospect of genomic selection within family. Therefore, a method to decompose total accuracy into its among and within family components is proposed in this study. Moreover in the limits of available data, our results show that performances of DH lines derived from a new interconnected cross can be predicted for complex traits such as grain yield and oil content with accuracies of 0.20.
The proposed Gpond-BLUP method leads to a gain of + 14,97% (+/− 8%) for flowering time in total predicting accuracy compared to the classical G-BLUP model. Nevertheless for more complex traits, this method does not raise accuracy.
This study illustrates that across year prediction is interesting regarding to the trait. Test-cross performance in a multi-family population is promising in rapeseed for seed quality traits such as glucosinolates content (0.80), flowering time (0.60) as well as for the most economically interesting traits: grain yield (0.45).
For Euralis semences, genomic selection is promising to increase volume of per se evaluation in nursery while keeping constant volume of costly multi-environment test-cross evaluation. Such implementation would go through: (i) early selection of lines during per se evaluation on traits usually worked later on and (ii) phenotyping substitution during test-cross performance evaluation. More practical and simulation studies are needed to confirm these preliminary results and assert the risk of diversity losses and consequently the ability of long term gains.
+
-