|
BCM-2003-B
|
Envoyée par : Jean-Philippe Laverdure
Répondue par : Jean-Philippe Laverdure
|
2005-02-26
|
Question #222
|
Un étudiant a demande plus de details sur la structure du chip Affymetrix. La voici...
(les questions sont en italique) |
|
Réponse
|
Voici une explication qui sera, je l'espère, assez detaillée:
1. On a parlé de 3 matrices différentes dont la première a la dimension 5 x 5, la deuxième est 1054 x 1054 et la troisième contient a peu près de 95 000 cellules. Cette troisième est une puce fait de verre. Chacune de ses cellules (ou deuxième matrice) est un carré contenant plus d’un million copies (1054 x 1054) d'une même oligonucléotide dont la longueur de chacun est 25 bases azotées. Le socle de verre n’est pas absolument fin et, pour éviter l’influence de cela sur les résultats, quelques carrés portent le même oligonucléotide. (On analyse, puis, le moyen des résultats pour l‘oligonucléotide en question). Donc, notre puce de 97 000 est un ensemble des différents oligonucléotides. Certaines parmi eux représentent les parties d’un gène, certaines représentent un autre gène e. t. c.
Pas tout a fait...
En fait je préfères reformuler certaines notions dont tu fais mention:
1- La puce en tant que tel est une lamelle de verre sur laquelle Affymetrix fait adherer des oligos nucléotides d'une longueur de 25 bases
2- Chaque oligonucléotide est spécifique à une portion unique d'un ARN messager donné (qui est en fait le vecteur d'expression d'un gène dans une cellule... Rappelez-vous : Lorsque l'expression d'un gène est activée, l'ADN génomique est transcrite en ARN, puis cet ARN est modifié par la machinerie enzymatique présente dans le noyau de la cellule pour devenir l'ARNm (messager). Cet ARNm sort alors du noyau et est traduite par les ribosomes du réticulum endoplasmique en une chaîne d'acides aminés correspondant à la protéine).
3- Un ARN étant une molécule pouvant être assez longue (plusieurs kBp) Il est possible, dans certains cas, de dessiner plus d'un oligo pour détecter la présence d'un même ARN. Les deux oligos ne s'hybrideront tout simplement pas sur la même portion de l'ARN ie: un premier oligo s'hybride aux positions 157@182 et un second aux positions 1178@1203 par exemple. (En théorie, ceci permet même de comparer la présence d'epissats alternatifs d'un gène donné... Mais ceci sort un peu du cadre de cette explication...)
4- A chaque oligo correspond un identifiant Affymetrix, le fameux "probeset"
5- Comme la surface de verre de la puce est imparfaite et que ces imperfections (bosses, creux ou autre anfractuosités) peuvent influencer l'efficacité de l'hybridation, Affymetrix dépose un meme probeset en plusieurs endroits sur le surface de verre. La totalite de ces "spots" correspond à la fameuse matrice de 1164 x 1164 (1 354 896 spots) (NB: plusieurs de ces spots ne servent qu'à des contrôles techniques et ne ramassent pas de l'information sur l'expression génique. Ce n'est donc pas toute la matrice (les 1 354 896 spots) qui sert a l'analyse du transcriptome)
6- Chaque spot de cette matrice associée a un probeset est en fait une région délimitée de forme plus ou moins carrée comprenant plusieurs milliers de copies de l'oligo
7- Lorsque le scanner "lit" l'intensité de chacun de ces spots, le laser permet de découper cette region carrée en 25 pixels (5 x 5). Ceci est du à la résolution du scanner.
8- Parfois, le spot n'est pas parfaitement carré, le logiciel élimine donc les données d'intensité associées aux mauvais pixels (c'est cette information que l'on peut voir dans le fichier .cel sous l'entête "NBPIXELS").
9- La valeur brute d'intensité de fluorescence associée à chaque spot ("MEAN" et "STDV") est donc la moyenne et l'écart type de l'intensité des X pixels lus.
10- RMAExpress se sert des valeurs brutes contenues dans le fichier .CEL et le "mapping" des spots representé par le fichier .CDF (Chip Definition File) pour calculer la moyenne de l'intensité de tous les spots associés à un même probeset et exporte ces valeurs sous forme d'une matrice des probesets (en y) Vs. les échantillons (en x)
11- Le chip HG U133 plus 2.0 est l'un des plus gros d'Affymetrix et possède un peu plus de 55 000 probesets distincts.
2. On a 24 puces, cela veut dire 24 génomes différents. Chaque puce porte le même ensemble des oligonucléotides pour puis comparer la valeur de tel oligonucléotide dans différentes puces (génomes).
Il serait préférable de parler de "transcriptome" plutôt que de génome. Nous ne détectons que la portion transcrite du génome (les ARN).
3. Notre fichier ‘normalisées.txt’ obtenu à la fin d’RMAExpress comporte un tableau dont les colonnes représentent les génomes testés (ou puces), et chacun range indique le nom d’un oligonucléotide (mais pas d’un gène en entier). Donc, chaque cellule de cette matrice c’est une expression de tel oligonucléotide dans tel génome.
Plus précisément: chaque colonne représente le transcriptome d'un des tissus testés (12 échantillons de tissus cardiaque sain et 12 échantillons de tissus cardiaque de patients souffrant d'ischémie) à raison d'une colonne par échantillon. Chaque cellule de la matrice représente donc une mesure indirecte de la quantité d'un ARN particulier se trouvant dans l'échantillon de tissus (celui pour lequel l'oligo ou "probeset" est spécifique)
4. Monsieur est-ce que vous est disponible pendant la semaine de relâche ?
Oui, je serai disponible toute la semaine !
|
| Informations |
Question consultée 5875 fois. | 4399 votes, Moyenne 3/5.0 | À vous de voter => min     max |
|