Articles

Épidémiologie génomique des Escherichia coli producteurs de carbapénémase (KPC) de Klebsiella pneumoniae au niveau mondial

Les souches mondiales de bla KPC-E. coli sont diverses, même au sein de la ST la plus prévalente, ST131, avec des preuves de transmission locale

45 isolats ont été obtenus dans 21 villes de 11 pays sur quatre continents (2010-2013 ; les résultats de typage de laboratoire précédents résumés dans le tableau S1). Un isolat était bla KPC négatif lors du séquençage du génome entier (WGS ; ecol_252), ayant potentiellement perdu bla KPC pendant le stockage ou la sous-culture dans l’intervalle de temps entre le moment où le typage original a été entrepris et l’extraction ultérieure d’ADN et la préparation pour le WGS. Pour un isolat, les données du WGS ne correspondaient pas aux résultats du typage en laboratoire (ecol_451), ce qui représente probablement une confusion dans le laboratoire ; ecol_252 et ecol_451 ont donc été exclus des analyses ultérieures. Les 43 autres isolats ont été séquencés avec succès (pour les mesures de qualité, voir le tableau S1). Parmi ces 43 isolats, vingt et un ST différents d’E. coli étaient représentés (Tableau 1 ; prédits in silico à partir du WGS), y compris : ST131 , ST410 , ST38 , ST10, ST69 (isolats restants singleton STs).

Tableau 1 Familles de réplicons plasmidiques présentes par ST, en utilisant la base de données PlasmidFinder58.

Sur les 16 053 cadres de lecture ouverts (ORF) annotés identifiés dans l’ensemble des isolats de KPC-E. coli, seuls 2 950 (18,4%) étaient partagés dans tous les isolats (« core »), et 222 autres (1,4%) dans 95- < 100% des isolats (« soft core « 27). Au niveau des nucléotides, il y avait 213 352 variants nucléotidiques simples (SNV) dans le génome central, ce qui correspond à la diversité des espèces observée précédemment28. Les profils des gènes de résistance variaient également de façon marquée entre les souches, certaines hébergeant plusieurs mécanismes de résistance aux bêta-lactamines, aux aminoglycosides, aux tétracyclines et aux fluoroquinolones (par exemple ecol_224) et d’autres ne contenant que bla KPC (par exemple ecol_584 ; Fig. 1). Pour les 16 souches KPC-ST131, 4 071/7 910 (51 %) ORF étaient centraux, avec 6 778 SNV dans le génome central de ces isolats, ce qui est à nouveau cohérent avec les études mondiales précédentes sur la diversité des ST13123, 24 (Figure S1). Les génomes accessoires étaient hautement concordants pour certains (par exemple ecol_356/ecol_276/ecol_875), mais pas tous (par exemple ecol_AZ159/ecol_244) isolats qui étaient étroitement liés dans leurs génomes centraux, ce qui soutient une dynamique évolutive très variable entre les génomes centraux et accessoires (Fig. 1). La distribution géographique des isolats étroitement liés à la fois dans le génome central et dans le génome accessoire soutient la transmission locale (par exemple, ecol_AZ166, ecol_AZ167) de souches particulières de KPC-E. coli. L’homologie des motifs génétiques flanquants autour des gènes bla KPC dans ces paires d’isolats étroitement apparentés serait également cohérente avec cette hypothèse, et moins cohérente avec de multiples événements d’acquisition de bla KPC dans le même fond génétique, en particulier compte tenu de la diversité des séquences flanquantes de bla KPC observées dans le reste de l’ensemble de données (voir ci-dessous).

Figure 1
figure1

Phylogénie des KPC-Escherichia coli identifiées à partir des schémas mondiaux de surveillance de la résistance aux carbapénèmes, 2008-2013. Les panneaux à droite de la phylogénie représentent les mécanismes de gènes de résistance communs (détails complets du typage des gènes de résistance dans le tableau S2), les composants du génome central et accessoire. Pour le panneau du génome accessoire, le bleu représente les régions annotées qui sont présentes, et le blanc celles qui sont absentes.

Les gènes bla KPC semblent limités aux contextes plasmidiques chez E. coli à l’heure actuelle, mais peuvent exister en copies multiples sur des structures plasmidiques uniques ou dans des plasmides à nombre de copies élevé

Trente-quatre isolats (80%) contenaient bla KPC-2, et neuf isolats (20%) bla KPC-3. L’intégration chromosomique de bla KPC a été décrite chez d’autres Enterobacteriaceae, Pseudomonas et Acinetobacter spp. mais reste rare5, 29, 30. Il n’y avait aucune preuve d’intégration chromosomique de bla KPC, que ce soit dans les 18 structures chromosomiques reconstruites à partir du séquençage à long terme ou d’après l’examen des annotations dans les contigs contenant bla KPC (dérivés des assemblages de novo d’Illumina) pour les 25 autres isolats. Les allèles bla KPC n’étaient pas ségrégués par ST.

Les estimations du nombre de copies de bla KPC par chromosome bactérien variaient entre <1 (ecol_879, ecol_881) et 55 (ecol_AZ152). Dans neuf cas, cette estimation était ≥10 copies de bla KPC par chromosome bactérien (ecol_276, ecol_356, ecol_867, ecol_869, ecol_870, ecol_875, ecol_AZ150, ecol_AZ152, ecol_AZ159, Tableau S2). Six de ces isolats contenaient bla KPC dans un contexte plasmidique de type col, dans deux cas le type de réplicon plasmidique était inconnu, et dans un cas il s’agissait d’un réplicon IncN. Le nombre de copies du plasmide est associé à des niveaux plus élevés de résistance aux antibiotiques si le gène concerné est situé sur une unité à nombre de copies élevé. Il est intéressant de noter que les plasmides à nombre de copies élevé sont supposés avoir plus de chances de se fixer dans les cellules descendantes, car ils se distribuent plus adéquatement par hasard et sans la nécessité de systèmes de partitionnement31, et d’être transférés dans tout événement de conjugaison, directement ou indirectement32,33,34.

Les populations plasmidiques bla KPC et non-bla KPC à travers les souches mondiales de KPC-E. coli sont extrêmement diverses

Le typage des plasmides Inc a révélé la présence d’une médiane de quatre types de réplicon plasmidique par isolat (plage : 1-6 ; IQR : 3-5), représentant une grande diversité (tableau 1). Cependant, les réplicons IncN, col, IncFIA et IncI1 étaient surreprésentés de manière disproportionnée dans certains ST (p < 0,05 ; Tableau 1). Parmi les 18 isolats qui ont subi un séquençage PacBio, nous avons identifié 53 plasmides KPC fermés, non-bla, allant de 1 459 pb à 289 903 pb (Tableau S1 ; au moins quatre structures plasmidiques supplémentaires, partiellement complètes, étaient présentes). Parmi ces plasmides KPC non-bla, 10 (taille : 2 571-150 994 pb) présentaient une similarité de <70 % (définie par le pourcentage d’identité de séquence multiplié par la proportion de longueur d’interrogation démontrant l’homologie) avec d’autres séquences disponibles dans la GenBank, soulignant qu’une partie du  » plasmidome  » de KPC-E. coli reste incomplètement caractérisée. Pour les 43 autres plasmides, la meilleure correspondance dans GenBank était un plasmide d’E. coli dans 35 cas, de K. pneumoniae dans 5 cas, et de Citrobacter freundii, Shigella sonnei, Salmonella enterica dans 1 cas chacun (Tableau S3).

Vingt-deux structures plasmidiques bla KPC ont été entièrement résolues (17 à partir des données Pacbio uniquement, quatre à partir des données Illumina uniquement, 1 à partir des données PacBio et Illumina), allant de 14 029 pb à 287 067 pb (médiane = 55 590 pb ; IQR : 23 499-82 765 pb). Ces plasmides contenant du bla KPC, et six autres cas où le bla KPC a été identifié sur un contigu contenant un réplicon, étaient très diversifiés en fonction du typage Inc (Tableau S1). L’IncN était le type le plus courant (n = 8/28 structures bla KPC typables ; 29 %), suivi des petits plasmides de type col (n = 6/28 ; 21 %). D’autres types moins fréquents étaient : A/C2, FII(k), U (tous n = 2) ; et L/M, P, Q1 et R (tous n = 1). Quatre (14 %) plasmides bla KPC étaient des constructions multiréplicon, à savoir : col/repA, FIB/FII, FIA/FII et FIA/FII/R.

Les squelettes plasmidiques IncN courants se sont dispersés dans le monde entier au sein d’E. coli

À partir de GenBank, nous avons sélectionné toutes les séquences plasmidiques uniques et entièrement séquencées IncN-bla KPC (tableau S4) pour comparaison, datant d’aussi tôt que 2005, à peu près au moment des premiers rapports d’E. coli producteurs de KPC. Les squelettes plasmidiques et les séquences flanquantes entourant bla KPC dans ces 16 références plasmidiques et dans un sous-ensemble de 12 séquences d’étude (voir « Méthodes ») étaient cohérents avec les acquisitions multiples de deux complexes connus IncN-Tn4401-bla KPC dans des ST d’E. coli divergents : premièrement, dans un fond de type Plasmid-9 (FJ223607, 2005, USA), et deuxièmement, dans un élément de type Tn2/3 dans un fond de type Plasmid-12 (FJ223605, 2005, USA).

Dans le premier cas, des similitudes génétiques ont été identifiées entre Plasmid-9, pKPC-FCF/3SP, pKPC-FCF13/05, pCF8698, pKP1433 (représentant un hybride IncN), et les plasmides bla KPC des isolats ecol_516, ecol_517, ecol_656, et ecol_736 (cette étude). Le plasmide-9 contient des éléments Tn4401b dupliqués en orientation inverse avec quatre séquences flanquantes différentes de 5 pb dans une disposition atypique à l’intérieur d’un intron du groupe II35. Les structures de l’épine dorsale des autres plasmides de ce groupe sont cohérentes avec un événement d’acquisition séparé d’un élément Tn4401b entre les régions pld et traG dans une version ancestrale de la structure du Plasmide-9, avec la génération d’une duplication de site cible (TSD) TTCAG flanquante (étiquetée comme Plasmide 9-like plasmid (hypothétique), Fig. 2). La propagation internationale suivie d’une évolution locale à l’intérieur des espèces et entre elles expliquerait les différences entre les plasmides, notamment (i) la variation au niveau des nucléotides (observée dans tous les plasmides) ; (ii) les petits événements d’insertion/délétion (observés dans tous les plasmides) ; (iii) les événements d’insertion/délétion plus importants médiés par des éléments transposables (par exemple, pCF8698_KPC_2) ; et (iv) la recombinaison homologue probable, entraînant une variation groupée au sein d’un squelette plasmidique similaire (par exemple. ecol_656/ecol_736), ainsi que des réarrangements plus distincts, y compris la formation de plasmides « hybrides » (par exemple, pKP1433)(Fig. 2).

Figure 2
figure2

Schéma comparatif des plasmides IncN de type FJ223607 (de type Plasmid 9) (disponibles publiquement ; cette étude), et leur origine géographique/date d’isolement. Les noms des séquences plasmidiques en rouge sont ceux de cette étude, dérivés des données PacBio et des structures plasmidiques fermées (ecol_517, ecol_656) ou incomplètes (ecol_516, ecol_736) dérivées des données Illumina. Les barres alignées adjacentes aux noms des plasmides représentent les séquences plasmidiques : le gris clair indique les régions dont la séquence est identique à 100 % ; le noir représente la diversité nucléotidique entre les séquences ; et les lignes fines représentent les indels. Les séquences codantes sont représentées par des flèches grasses sous les barres de séquences individuelles et sont codées par couleur selon la clé de couleur. Le schéma en médaillon décrivant la variation génétique entre les séquences présente des exemples d’événements évolutifs identifiés : (a) changement au niveau d’un seul nucléotide, (b) petits indels (≤100 bp), (c) grands indels (>100 bp), (d) événements de recombinaison.

Dans le plasmide-12 (FJ223605), Tn4401b s’est inséré dans un élément hybride de type Tn2-Tn3 (avec des gènes de résistance aux médicaments associés, notamment bla TEM-1, bla OXA-9, et plusieurs gènes de résistance aux aminoglycosides), bien qu’en l’absence de duplication de la séquence cible, peut-être à la suite d’un événement de transposition intramoléculaire et réplicatif générant des séquences de site cible mal appariées (L TSS = TATTA ; R TSS = GTTCT). Ce complexe est à son tour situé entre deux éléments de type IS15DIV (IS15Δ)/IS26 flanqués de répétitions inversées de 8 pb, et situé entre les loci traI (891 pb de l’extrémité 3′) et pld (~28 Kb ; Fig. 3A). Les composants de l’épine dorsale du plasmide IncN-12 sont conformes à ceux observés dans une épidémie des NIH5 et dans une version réarrangée dans une épidémie de l’Université de Virginie (CAV1043 ; 2008)6. D’après cette étude, les plasmides ecol_224, ecol_881, ecol_AZ159, ecol_422 et les échafaudages ecol_AZ151, ecol_744, ecol_AZ150 ont tous des structures presque identiques à celles du plasmide-12, avec une variation groupée au niveau des nucléotides dans les gènes traJ-traI, ce qui est cohérent avec un événement de recombinaison homologue affectant cette région, et des preuves d’événements d’insertion/délétion sporadiques (Fig. 3A). Cependant, les structures de bla KPC-Tn4401 dans ces isolats sont presque entièrement dégradées par la présence d’autres éléments génétiques mobiles (EGM), notamment les éléments de type Tn2/Tn3, ISKpn8/27 et Tn1721. Dans ecol_224, bla KPC-2 a été inséré dans le squelette IncN dans le cadre de deux structures répétées de type Tn3 inversé, flanquées d’un TSD TTGCT, et plus proches de traI (136 pb de l’extrémité 3′) que le complexe de type IS15DIV (IS15Δ)/IS26 susmentionné dans le plasmide-12 (Fig. 3B). Bien qu’il ne soit pas possible de retracer avec précision l’histoire évolutive de cette région génomique compte tenu des données disponibles, la présence de signatures partagées de cette structure dans ecol_422, ecol_744, ecol_881, ecol_AZ159, ecol_AZ150 et ecol_AZ151 suggère une acquisition commune, et de multiples réarrangements ultérieurs médiés par la présence du grand nombre de MGE flanquant bla KPC-2.

Figure 3
figure3

Schéma comparatif des plasmides IncN KPC de type FJ223605 (Plasmid-12-like) de cette étude. Panneau 3A. Origine géographique, dates d’isolement et alignement global des structures des plasmides/contigs. Les noms des séquences plasmidiques en rouge sont ceux de cette étude, dérivés des données PacBio et des structures plasmidiques fermées (ecol_224, ecol_422, ecol_881, ecol_AZ159) ou incomplètes (ecol_744, ecol_AZ151, ecol_AZ150) dérivées des données Illumina. Les barres alignées adjacentes aux noms des plasmides représentent les séquences plasmidiques : le gris clair indique les régions présentant une homologie de séquence de 100 % ; le noir représente la diversité nucléotidique entre les séquences ; et les lignes fines représentent les indels. Les séquences codantes sont représentées par des flèches grasses sous les barres de séquences individuelles et sont codées par couleur selon la clé de couleur. Le schéma en médaillon décrivant la variation génétique entre les séquences présente des exemples d’événements évolutifs identifiés : (a) changement au niveau d’un seul nucléotide, (b) petits indels (≤100 bp), (c) grands indels (>100 bp), (d) événements de recombinaison. Panneau 3B. Gros plan sur la région entre traI et pld contenant bla KPC-2 dans les isolats étudiés uniquement. Les séquences codantes sont codées en couleur comme dans la figure 3A ; les régions de séquence auxquelles il est fait référence dans le texte sont annotées.

Les plasmides de type col peuvent représenter un vecteur de transmission important pour bla KPC dans E. Coli

Les petits plasmides de type col étaient le deuxième type de plasmide le plus courant portant bla KPC chez E. coli (n = 5 ), mais trois d’entre eux étaient identiques (bla KPC-2, 16 559 pb), tous isolés à Pittsburgh, aux États-Unis, à partir d’isolats ST131 sur une période de deux ans (ecol_276 , ecol_356 , ecol_875 ). Ces trois isolats contenaient en outre des réplicons FIA, FIB, FII, X3 et X4, ce qui suggère la persistance stable d’une souche clonale + plasmides au fil du temps, ce qui est cohérent avec les analyses SNV/core et génome accessoire (Fig. 1, Figure S1).

Les deux autres plasmides de type col représentent effectivement de courts tronçons d’ADN codant pour différents gènes de mobilisation (mbeA/mbeC/mbeD) attelés aux modules KPC Tn4401/bla. Les séquences de 5 pb flanquant Tn4401 étaient cohérentes avec une transposition directe et intermoléculaire dans les deux cas (ecol_870 : TGTTT-TGTTT ; ecol_867 : TGTGA-TGTGA). Un plasmide co-intégré col/repA a également été observé dans cet ensemble de données (ecol_AZ161), dans lequel Tn4401b a été inséré entre les séquences de signature colE3 et un élément Tn3 (TSS de Tn4401 : AGATA-GTTCT). La formation de telles structures plasmidiques co-intégrées chez E. coli a également été décrit précédemment36, y compris celui d’une structure plasmidique fusionnée de type col/pKpQIL (pKpQIL étant historiquement associé à bla KPC)37.

Les plasmides de type col ont été associés aux producteurs de KPC dans d’autres études régionales plus petites21, 38. Il est préoccupant de constater que ces petits vecteurs sont responsables de la diffusion inter-espèces des gènes qnr médiant la résistance aux fluoroquinolones, même en l’absence de toute pression de sélection antimicrobienne évidente39. L’association significative de plasmides de type col avec des ST d’E. coli particuliers (principalement ST131) dans cette étude pourrait être une explication de la représentation disproportionnée de bla KPC dans cette lignée.

Diverses séquences de sites cibles (SCT) de 5 pb de Tn4401 soutiennent une grande mobilité du transposon

Des isoformes complètes de Tn4401 flanquant bla KPC-2 ou bla KPC-3 ont été observées dans seulement 24/43 (56%) isolats, y compris Tn4401a/a-like (n = 10 ; un isolat avec une rupture de contiguïté en amont de bla KPC), Tn4401b (n = 12) et Tn4401d (n = 2). Onze paires différentes de séquences de sites cibles (SCT) de 5 pb ont été identifiées, dont 7 (64 %) n’ont été observées dans aucun plasmide de comparaison téléchargé à partir de GenBank (tableau S5). Tn4401a avait trois SCT de 5 pb différentes, Tn4401b sept, et Tn4401d une. La plupart représentaient des TSD, mais dans trois cas, différentes TSS de 5 bp flanquaient Tn4401, ce qui est cohérent avec des événements de transposition intramoléculaires à la fois directs et réplicatifs.

Dans l’ensemble des plasmides de GenBank et des expériences de transposition in vitro réalisées par d’autres, 30 types différents de paires de TSS de 5 bp ont été caractérisés, dont sept dans le cadre expérimental uniquement40. Les plasmides téléchargés proviennent d’un éventail d’espèces et de points temporels (2005-2014), bien qu’ils puissent sous-représenter une plus grande diversité de sites d’insertion Tn4401 en raison de biais d’échantillonnage. Nos données seraient cependant cohérentes avec une mobilité significative de Tn4401 au sein de E. coli suite à l’acquisition de diverses isoformes de Tn4401 et/ou représenteraient des événements d’importation multiples dans E. coli à partir d’autres espèces.

L’association traditionnelle du bla KPC avec le Tn4401 s’est considérablement érodée dans les plasmides de KPC dans E. coli

Notamment, dans les autres 19/43 (44%) isolats, la structure du Tn4401 avait été dégradée par le remplacement par des MGE, dont seulement certaines ont été décrites précédemment41, 42. Deux isolats présentaient de nouvelles structures Tn4401Δb (troncatures en amont par IS26 ou IS26-ΔIS5075 ). Une structure de type Tn4401e (délétion de 255 pb en amont de bla KPC) était présente dans trois isolats (ecol_227, ecol_316, ecol_583) : elle a été caractérisée dans un assemblage complet de plasmide PacBio (ecol_316) et représentait un réarrangement au site du SCT L de l’élément ISKpn7. Dans ce plasmide, un deuxième élément Tn4401 partiel était présent sans bla KPC, ce qui serait cohérent avec un événement de transposition intramoléculaire incomplet et réplicatif (GGGAA = SCT L et SCT R sur les deux éléments Tn4401b, en orientation inverse). Les autres motifs flanquant le bla KPC comprenaient : éléments hybrides Tn2/Tn3-ISKpn8/27-bla KPC (n = 1 ; ecol_224) ; IS26-ΔtnpR(Tn3)-ISKpn8/27- bla KPC-ΔTn1721-IS26 (n = 5 ; ecol_AZ153-AZ155, ecol_AZ166, ecol_AZ167) ; ISApu2-tnpR(Tn3)-ΔblaTEM -bla KPC- korC-klcA-ΔTn1721-IS26 (n = 1 ; ecol_542) ; IS26-tnpR(Tn3)-ΔblaTEM -bla KPC-korC-IS26 (n = 1 ; ecol_545) ; éléments hybrides Tn2/Tn3 + ΔblaTEM-bla KPC-ΔTn1721 (n = 2 ; ecol_744, ecol_422), éléments Tn3-Δbla TEM-bla KPC- ΔTn1721 (n = 4 ; ecol_881, ecol_AZ151, ecol_AZ159, ecol_AZ150) et ΔTn3-Δ -ΔIS3000 (Tn3-like) (n = 1 ; ecol_AZ152). Nous n’avons pas été en mesure d’évaluer le contexte flanquant de bla KPC dans ecol_452 en raison des limitations de l’assemblage.

Cette diversité apparente des MGE acquises indépendamment autour du gène bla KPC étend les moyens par lesquels bla KPC peut être mobilisé. Il est intéressant de noter que, comme observé précédemment43, toutes les séquences dégradées de Tn4401 dans cet ensemble de données étaient associées à des tronçons variables de séquences flanquantes de type Tn2/3, ce qui suggère que l’insertion de Tn4401 dans un contexte de type Tn2/Tn3 peut avoir permis à ce dernier d’agir comme un point chaud pour l’insertion d’autres MGE6. Une découverte particulière à noter est l’association avec IS26, qui a été liée à la dissémination de plusieurs autres gènes de résistance dans E. coli, y compris les BLSE CTX-M24, 44 ; est capable d’augmenter l’expression de gènes de résistance étroitement co-localisés45 ; participe à la formation de co-intégrations et donc au réarrangement des plasmides46 ; et améliore l’occurrence d’autres événements de transfert médiés par IS26 dans les plasmides hébergeant IS26 46.