Comment concevoir des amorces PCR?

La réaction en chaîne par polymérase (PCR) est une technique qui a diverses applications dans les domaines de la recherche, de la médecine et de la médecine légale. Il amplifie le fragment d'ADN d'intérêt. C'est également un test sensible pour le diagnostic et le génotypage des maladies. Les ingrédients de base d'un système de réaction comprennent une matrice d'ADN, une solution tampon, le désoxyribonucléoside triphosphate (dNTP), la Taq polymérase et une paire d'amorces (l'avant et l'inverse). Des amorces bien conçues réduisent le coût et le temps consacrés à l'expérimentation. Primer-BLAST est un outil puissant pour trouver les amorces spécifiques à un modèle. Cet outil est gratuit et ne nécessite pas d'installation de logiciel ou de compétences en programmation. Cet article montre comment concevoir des amorces PCR avec un exemple de Primer-BLAST.

Partie 1 sur 4: préparation

1
Accédez au site Web de primer-blast ( https://ncbi.nlm.nih.gov/tools/primer-blast/). Notez qu'une accession RefSeq est le format de modèle préféré. La collection Reference Sequence (RefSeq) est une base de données secondaire avec les informations non redondantes sélectionnées dans la base de données principale GenBank.
- Primer-BLAST est un outil de conception d'amorces développé par le National Center for Biotechnology Information (NCBI).
- Le NCBI, en tant que ressource nationale d'informations sur la biologie moléculaire, maintient des bases de données biologiques et facilite l'utilisation de ces bases de données.
- Étant donné que toutes les informations génétiques obtenues par les recherches biologiques sont finalement déposées dans les bases de données maintenues par le NCBI, Primer-BLAST convient à tout organisme tant que les bons paramètres sont sélectionnés.
2
Décidez du but des amorces. Le but affecte la conception de l'amorce. Des paramètres tels que la longueur du produit PCR et les emplacements des amorces dépendent en grande partie de l'objectif. Que ce soit pour amplifier le gène entier, ou pour vérifier la présence du gène, ou pour détecter son niveau d'expression, ou à d'autres fins?
- Prenons un exemple. Soit le gène d'intérêt le gène suppresseur de tumeur p53 dans l'organisme modèle Drosophila melanogaster (mouche commune des fruits).
- Que le but soit de détecter le niveau d'expression de ce gène.
- Dans ce cas, les amorces se lient à l' ADN complémentaire transcrit en inverse (ADNc) de l'ARN messager (ARNm), au lieu du génome. La matrice se réduit ainsi à la séquence codante (CDS) de p53.
3
Connaître le modèle PCR. La source des séquences nucléotidiques varie en fonction des différentes situations de la recherche. Il peut être généré via un résultat de séquençage ou obtenu à partir d'une base de données. S'il s'agit d'un résultat de séquençage brut, passez directement à la partie «Exécution de BLAST pour une séquence brute». S'il provient d'une base de données, jouez avec cette base de données pendant un certain temps.
- Dans le cas du gène p53 de Drosophila melanogaster, la séquence annotée est disponible dans la base de données NCBI.
- Accédez à la page d'accueil du NCBI (https://ncbi.nlm.nih.gov/).
- Tapez les mots-clés dans la barre de recherche. Les opérateurs logiques tels que AND, OR, NOT sont applicables dans cette barre.
- Cliquez sur Rechercher et explorez les informations sur le gène p53 de Drosophila melanogaster.
4
Obtenez l'accession pour les séquences trouvées dans une base de données. Primer-BLAST identifie mieux la matrice par adhésion RefSeq que par séquence d'ADN brute. Un autre avantage de l'adhésion RefSeq est que les fonctions liées à l'exon / intron ne sont disponibles que lors de la saisie de la séquence d'ARNm RefSeq comme matrice PCR.
- Si la séquence est obtenue à partir d'une base de données en ligne, recherchez simplement les mots-clés sur la page d'accueil du NCBI pour obtenir son accession RefSeq.
- Sautez ensuite la partie «Exécution de BLAST pour une séquence brute» et passez directement à la partie «Réglage des paramètres».

Les emplacements des amorces dépendent en grande partie de l'objectif — Des paramètres tels que la longueur du produit PCR et les emplacements des amorces dépendent en grande partie de l'objectif.

Partie 2 sur 4: exécuter BLAST pour la séquence brute

1
Accédez à la base de données refseq pour l'accession de séquence brute. L'accession RefSeq associée est accessible via l' outil de recherche d'alignement local de base (BLAST). Trouver l'accession RefSeq d'une séquence brute signifie rechercher dans la base de données NCBI la séquence identique à cette séquence brute.
- Continuez avec l'exemple. Pour la démonstration, supposons que le gène p53 de Drosophila melanogaster ne soit pas annoté. Pour obtenir sa séquence brute, accédez à la base de données Drosophila (http://flybase.org). Tapez "p53" dans la barre Jump to Gene. Il naviguera vers ce gène. Trouvez le CDS du gène p53 de Drosophila melanogaster.
- Ouvrez le site Web de BLAST (https://blast.ncbi.nlm.nih.gov/Blast.cgi).
- Puisqu'il s'agit d'aligner une séquence d'ADN avec une autre séquence d'ADN dans ce cas, cliquez sur le bouton BLAST nucléotidique.
2

Copiez la séquence ou téléchargez FASTA depuis flybase. FASTA est un format standard pour stocker les codes nucléotidiques en bioinformatique. Presque tous les outils de traitement de texte peuvent ouvrir et modifier ce type de fichier.
3

Exécutez BLAST. Collez le CDS dans la zone de séquence de requête. Faites défiler vers le bas et cliquez sur BLAST pour exécuter l'alignement local.
4
Sélectionnez l'adhésion refseq qui correspond au modèle cible. Faites attention aux informations répertoriées dans le résultat BLAST. Déterminer l'accession appropriée.
- Apparemment, l'identité d'alignement doit être de 100% pour garantir que l'accession RefSeq représente le modèle cible.
- S'il n'y a pas de hit avec une identité à 100%, cela signifie que la séquence de requête est mal étudiée. Utilisez la séquence brute pour Primer-BLAST dans ce cas. Déposez cette nouvelle séquence à GenBank pour contribuer à la base de données de biologie.
- Un autre point clé est de faire correspondre la description, qui parle de l'organisme et du nom de la séquence.
- Dans l'exemple, le RefSeq NM_001170223,1 et celui en dessous sont des accessions appropriées. C'est bien de choisir l'un ou l'autre.
5
Exécutez un alignement par paire pour la séquence de référence sélectionnée et le modèle cible. Gardez à l'esprit que la séquence de référence avec l'accession correspondante n'a généralement pas la même longueur que le modèle cible. Un alignement par paire peut trouver exactement la même région.
- Accédez au site Web de l'outil d'alignement de séquences par paires sur EMBL-EBI (https://ebi.ac.uk/Tools/psa/).
- Choisissez un algorithme d'alignement local.
- Dans l'exemple de détection du niveau d'expression du gène p53 de Drosophila melanogaster, copiez et collez la séquence NM_001170223,1 dans l'une des cases; p53-RC CDS l'autre boîte.
- Cliquez sur le bouton Soumettre pour exécuter le programme.
6
Enregistrez les positions sur la séquence de référence où les deux fragments s'alignent. Le premier et le dernier nombre de l'alignement représentent le point de départ et d'arrivée où les deux fragments s'alignent.
- Dans l'exemple, le résultat indique que le CDS de p53-RC commence au 630e et se termine au 1787e nucléotide de la séquence NM_001170223,1.
- La raison d'effectuer un alignement local réside ici. L'outil d'alignement sur EMBI-EBI renvoie le résultat au format texte. Il est difficile de compter les positions sans grille. De manière pratique, le résultat d'alignement local renvoyé par celui-ci omet les régions non alignées et affiche directement les positions alignées.

Les amorces se lient à l'ADN complémentaire transcrit en inverse (ADNc) de l'ARN messager (ARNm) — Dans ce cas, les amorces se lient à l'ADN complémentaire transcrit en inverse (ADNc) de l'ARN messager (ARNm), au lieu du génome.

Partie 3 sur 4: ajuster les paramètres

1
Entrez les informations du modèle PCR dans l'amorce-blast.
- Dans l'exemple, l'accession RefSeq est NM_001170223,1.
- L'amorce directe de la position est 630.
- L'amorce inverse à la position est 1787.
- Les deux paramètres ci-dessus limitent la plage dans la région CDS de p53-RC. Ils sont inutiles si la matrice n'est pas une accession RefSeq obtenue à partir de la séquence brute BLAST.
2
Ajustez les paramètres de l'amorce. Dans Primer-BLAST, les valeurs des paramètres qui diffèrent de la valeur par défaut sont automatiquement surlignées en jaune par le système.
- Aux fins de la détection du niveau d'expression génique dans l'exemple, un produit PCR relativement court est suffisant.
- Ainsi, les tailles minimale et maximale des produits PCR sont respectivement de 100 et 250.
3
Ajustez la sélection exon/intron. Cette étape n'est pas nécessaire pour la conception d'amorces d'ADN génomique. Mais c'est important pour la conception des amorces d'ADNc, car cela permet au chercheur de vérifier s'il y a une contamination par l'ADN génomique dans l'échantillon d'ADNc lors d'expériences futures.
- Dans l'exemple, puisque le modèle est un ADNc, activez l'option d'inclusion d'intron.
- L'ADN génomique aurait un produit PCR plus long que la matrice d'ADNc.
4
Ajustez les paramètres de vérification de la spécificité de la paire d'amorces. Saisissez le nom de l'organisme afin que le programme puisse rechercher la base de données correspondante. Pour la stringence, plus il y a de mésappariements et plus le nombre de mésappariements requis pour ignorer les cibles non voulues est grand, plus la spécificité de l'amorce est stricte.
- Dans l'exemple, l'organisme est Drosophila melanogaster
- 6 est le nombre le plus élevé de non-concordance autorisé par Primer-BLAST
- Le mésappariement à l'extrémité 3' d'une amorce est sensible. Il interrompt efficacement la liaison à des cibles non souhaitées.
- La limite de ce programme pour détecter une cible involontaire est jusqu'à 35% de mésappariements, ce qui signifie 7 mésappariements pour une amorce avec 20 nucléotides.
5

Développez le menu des paramètres avancés.
6

Optimisez les paramètres de l'amorce. la teneur en GC entre 40-60% donne une température de fusion juste. La valeur poly-X maximale acceptable est 4. Les nucléotides consécutifs de la même base doivent généralement être évités. Réglez Max Poly-X sur 3 pour réduire les risques d'erreur d'amorçage.
7

Réduisez la complémentarité maximale de soi et de paire pour éviter les dimères d'amorces. Parce que dans les premiers cycles d'une réaction PCR, la concentration de matrice est beaucoup plus faible que celle des amorces, si les amorces se lient facilement à elles-mêmes, peu d'amorces se lieront à la matrice pour initier l'allongement de la chaîne nucléotidique. Limiter le nombre de nucléotides complémentaires dans les amorces améliore l'efficacité.

Partie 4 sur 4: obtenir des amorces

1

Générez les amorces conçues. Faites défiler vers le bas et cliquez sur le bouton Obtenir des amorces pour obtenir des candidats d'amorce. Habituellement, le programme prend moins de 2 minutes pour s'exécuter. Parfois, surtout pendant les heures de travail, le serveur est à pleine capacité. Cela mettra les demandes sur une liste d'attente et peut prendre plus d'une demi-heure pour obtenir le résultat. Le conseil est d'éviter ces heures de pointe.
2
Sélectionnez 2-3 paires parmi ces candidats. Une paire est synthétisée en premier. Les paires restantes servent de sauvegardes. Lors de la sélection des amorces de sauvegarde parmi les candidats, il est préférable de choisir des paires distinctes que des paires similaires. Si l'une des paires d'amorces a une faible efficacité ou spécificité dans le test expérimental. Les similaires sont susceptibles d'avoir le même problème.
- Dans l'exemple de la détection du niveau d'expression du gène p53 de Drosophila melanogaster, le nombre de paires d'amorces à renvoyer est défini sur la valeur par défaut de 10. Le programme donne 10 paires d'amorces candidates.
- Les amorces candidates sont regroupées en différentes couleurs à des fins d'explication. Le résultat original généré par Primer-BLAST n'a qu'une seule couleur.
- Si les amorces en rouge sont synthétisées en premier, mais que l'expérience échoue, alors les amorces en vert, jaune ou noir peuvent être les sauvegardes.
- Mais il vaut mieux ne pas sélectionner les paires d'amorces en bleu comme sauvegarde, car il y a chevauchement entre les amorces rouges et les bleues.
3
Vérifiez la qualité des amorces synthétisées expérimentalement. Exécutez une PCR en utilisant les paires d'amorces synthétisées. Testez son efficacité et sa spécificité en analysant un résultat d'électrophorèse sur gel ou une analyse de fusion à haute résolution (HRMA). Si les amorces ne réussissent pas le test, synthétisez la paire de sauvegarde et répétez l'étape de vérification jusqu'à ce qu'une paire appropriée soit trouvée.
- La haute luminosité de la liaison d'électrophorèse ou la fluorescence de l'HRMA indique l'efficacité des amorces testées.
- La liaison unique en électrophorèse ou le pic de fusion unique en HRMA indique la spécificité des amorces testées.
- Dans l'exemple, les amorces sont conçues pour la PCR quantitative (qPCR). Il est important de suivre un protocole de détermination de l'efficacité qPCR pour vérifier la qualité des amorces.

Peu d'amorces se lieront à la matrice pour initier l'allongement de la chaîne nucléotidique — Parce que dans les premiers cycles d'une réaction PCR, la concentration de matrice est beaucoup plus faible que celle des amorces, si les amorces se lient facilement à elles-mêmes, peu d'amorces se lieront à la matrice pour initier l'allongement de la chaîne nucléotidique.

Conseils

Vocabulaire (ordre alphabétique)
- identité d'alignement: le pourcentage de codes identiques dans deux séquences alignées
- séquence annotée: une séquence dont les informations, telles que les fonctions et les emplacements, sont identifiées
- complémentarité: une propriété entre la liaison des bases nucléotidiques, telle que la guanine (G) s'apparie avec la cytosine (C) et l'adénine (A) s'apparie avec la thymine (T) ou l'uracile (U)
- ADN: acide désoxyribonucléique, une molécule polymère de nucléotides qui porte l'information génétique dans presque tous les organismes. La plupart des molécules d'ADN sont bicaténaires. Chaque brin a une extrémité 5' et 3'. Deux brins complémentaires s'alignent de manière antiparallèle et s'enroulent pour former une hélice
- dNTP: le substrat de la synthèse de l'ADN. Une molécule de dNTP contient une base azotée, un désoxyribose et trois groupes phosphate
- électrophorèse: une technique pour séparer différentes molécules en fonction de leur taille et de leur charge
- exon: toute partie d'un gène qui s'exprime dans le produit génique final
- Teneur en GC: le pourcentage de guanine (G) plus cytosine (C) dans une séquence
- génome: l'ensemble du matériel génétique d'un organisme
- intron: toute partie d'un gène qui n'est pas exprimée dans le produit génique final
- alignement local: déterminer des segments similaires de deux séquences en bioinformatique. L'alignement local se rapporte à l'alignement global, qui tente d'aligner toute la longueur de deux séquences
- analyse de fusion: un processus qui trace la courbe générée par la dissociation de l'ADN double brin sous gradient de température, puis évalue la courbe pour connaître les caractéristiques de l'ADN
- ARNm: famille d'ARN qui sert d'acteur intermédiaire dans l'expression des gènes. L'ARNm transmet les informations de l'ADN au produit protéique
- nucléotide: l'unité monomère du polymère d'acide nucléique. Un nucléotide contient une base azotée, un sucre à cinq carbones et un groupe phosphate
- polymérase: une enzyme qui catalyse la synthèse des polymères d'acide nucléique
- amorce: un court brin d'acide nucléique qui sert de point de départ à l'élongation du polymère d'ADN. Le fragment synthétisé se situe entre l'amorce directe et l'amorce inverse, car la direction d'allongement de la chaîne est toujours de l'extrémité 5' à l'extrémité 3'.
- ARN: acide ribonucléique, une molécule polymère qui joue divers rôles dans le codage, la régulation et l'expression des gènes. La plupart des molécules d'ARN sont monocaténaires. Chaque brin a une extrémité 5' et 3'
- matrice: un brin d'ADN qui fournit la séquence originale à répliquer.
- transcrire: copier une séquence d'ADN vers son ARN complémentaire
Il est très utile de sauvegarder les paramètres de recherche une fois que les valeurs sont optimisées pour un certain type de modèle. Cela permet d'éviter le travail répétitif la prochaine fois.

Lisez aussi: Comment agir contre la déforestation?