PLOS ONE: Arrays Expressão Exon como uma ferramenta para identificar novas Cancer Genes

Abstract

Fundo

A identificação de genes que são causalmente implicados na oncogênese é uma meta importante na pesquisa do câncer. Estima-se que 10-20% das mutações do gene relacionados com o cancro resultará no salto de um ou mais exões em as transcrições codificadas. Aqui nós relatamos sobre uma estratégia para a tela de uma forma global para tais eventos-salto de exon utilizando a correlação baseada em padrões (PAC). O algoritmo de PAC foi usado anteriormente para identificar variantes de splicing diferencialmente expressos entre os dois subgrupos pré-definidos. Como alterações genéticas em câncer são amostra específica, foi testada a capacidade do PAC para identificar exons expressos de maneira aberrante em amostras individuais.

principais conclusões

Como prova de princípio, testamos a PAC estratégia em amostras cancerosas humanas das quais a sequência de codificação completa de oito genes do cancro tinham sido selecionados para mutações. PAC detectado todos os sete mutantes salto de exon entre linhas de células de câncer 12. PAC também identificaram mutantes salto de exon em espécimes clínicos cancro embora detecção foi comprometido devido à heterogeneidade (de tipo selvagem) expressão transcrição. PAC reduziu o número de genes /exões para posterior análise mutacional candidatos por duas a três ordens de grandeza e que teve uma taxa positiva verdadeira substancial. Importante, de 112 exons outlier selecionados aleatoriamente, a análise da sequência identificou duas novas salto de exon eventos, duas novas mudanças de base e 21 alterações de bases previamente relatados (SNPs).

Conclusões

A capacidade da PAC para enriquecer transcrições mutantes e identificar as alterações genéticas conhecidas e novas confirma a sua adequação como uma estratégia para identificar genes do cancro candidato

Citation:. Schutte M, Elstrodt F, Bralten LBC, Nagel JAI, Duijm e, Hollestelle a, et ai. (2008) Arrays Expressão Exon como uma ferramenta para identificar genes de câncer Novo. PLoS ONE 3 (8): e3007. doi: 10.1371 /journal.pone.0003007

editor: Christopher Arendt, Sanofi-Aventis, Estados Unidos da América

Recebido: 10 de junho de 2008; Aceito: 31 de julho de 2008; Publicação: 20 de agosto de 2008

Direitos de autor: © 2008 Schutte et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este trabalho foi apoiada pela Fundação Susan G. Komen Cancer (BCTR0601309), o holandês Cancer Society Koningin Wilhelmina Fonds, DDHK 2002-2687 e Erasmus MC Mrace 2005.

Conflito de interesses: os autores declararam que não há interesses concorrentes existir.

Introdução

cancro é impulsionado por mutações nos genes que controlam a proliferação de células, a sua sobrevivência e a sua integridade. Telas destinadas a identificar tais genes de câncer muitas vezes usar a localização cromossômica e /ou propriedades funcionais para selecionar genes candidatos para a análise de mutações subsequente [1] – [4]. Embora muitos loci de genes de cancro do candidato ter sido identificado, a análise de mutações de trabalho intensivo severamente dificulta encontrar o gene correspondente cancro. Outras estratégias de busca gene têm-se centrado sobre os padrões de expressão de genes aberrantes para identificar candidatos. Por exemplo, os mutantes de genes que resultam em codões de terminação prematuros foram identificados por rastreio de genes que foram expressos especificamente a inibição química de nonsense mediada por ARN de decaimento [5]. Além disso, os genes de fusão em cancro da próstata foram identificados por rastreio para valores extremos em um grande grupo de perfis de expressão genética [6].

mutações de genes de cancro humano resultam frequentemente no salto de um ou vários exões a partir dos transcritos codificados [7] – [9]. Exon-pular mutações podem ser causadas por substituições de nucleótidos dentro dos locais de união de consenso ou por deleções que abrangem exões inteiras. Além disso, as mutações-exon pode ser causada por relativamente pequenas intragênicos inserções, deleções ou duplicações. Mesmo que mutações Exon-pular representam uma estimativa de 10-20% de todas as mutações genéticas relacionadas ao câncer [4], [9] – [12], nenhum método de alto rendimento tem estado disponível para a tela para tais mutações. Aqui, descrevemos padrão de correlação Baseado (PAC) como uma abordagem para identificar genes do cancro candidato pela triagem para eventos de salto de exon de uma forma global. análise de mutação detalhada é então restrito apenas aos exons outlier PAC-identificados. Como prova de princípio, que demonstram a eficácia da estratégia de PAC em mutações-exon previamente identificados em linhas celulares de cancro da mama e em amostras de tumores do cérebro clínicos. Também demonstramos que o PAC pode identificar romance salto de exon eventos com alterações genéticas subjacentes em genes de câncer conhecidos e em exons outlier PAC-identificados selecionados aleatoriamente.

Resultados

Correlação identificação de aberrações, exão pelo padrão baseado (PAC)

neste estudo, desenvolvemos uma nova abordagem para rastrear eventos de salto de exon em amostras cancerosas humanas. Por causa mutações no câncer muitas vezes são altamente heterogênea com respeito à sua localização intragenic, tumores individuais muitas vezes expressam espécies de RNA únicas. Rastreio de mutações que resultam em saltar de um ou mais exões na transcrição codificado exige, por conseguinte, para o rastreio exclusivos, Exon-saltado, transcritos dentro de uma coorte de amostra específica. Resumidamente, os perfis de expressão de nível exão são gerados usando Affymetrix Human Exon matrizes, que determinam o nível de praticamente todos os exões presentes no genoma humano expressão. O algoritmo de padrão de correlação base (PAC) é então utilizada para calcular o nível de expressão previsto de cada exão (ou conjunto de sonda). Em seguida, identificar exões outlier subtraindo-se o nível de expressão de exões previstos a partir do seu nível de expressão de medição, com valores igual a zero quando o nível de expressão de um exão medido foi semelhante ao seu nível de expressão previsto (formulado em pormenor sob Métodos). O algoritmo de PAC foi usado para identificar o splicing diferencial entre os grupos predefinidos [13]. Neste estudo, nós testamos o algoritmo PAC para a sua capacidade para identificar exons expressos de maneira aberrante em amostras únicas de uma coorte bem definida de linhas de células ou tumores. PAC normaliza efectivamente a variabilidade nos níveis de expressão do gene entre as amostras e, em uma única amostra, normaliza a variabilidade na intensidade do sinal entre conjuntos de sondas do mesmo transcrito (Fig. 1).

(a) os dados de expressão de normalizadas todos os exons no gene

PTEN

. Cada conjunto de sonda exão está representada por um ponto na linha sólida; múltiplos conjuntos de sondas podem ser dirigidos contra o mesmo exão. (B) PAC normaliza a variabilidade nos níveis de expressão do gene entre as amostras e, em uma única amostra, a variabilidade da intensidade do sinal entre conjuntos de sondas do mesmo transcrito. portanto, o cálculo PAC permite a detecção rápida de pular de

PTEN

exão 4 em linha de células de cancro da mama MDA-MB-468 devido a um

PTEN

c.253 + 1G T local de splicing mutação que nós anteriormente havia identificado [17].

PAC detecta eventos de salto de exon em linhas celulares de cancro da mama

Foi testada a viabilidade da estratégia PAC em um painel de 12 células de câncer de mama humano linhas que haviam sido selecionados para mutações em genes supressores de tumor de sete:

BRCA1

,

CDH1

,

MAP2K4

,

PTEN

,

p16

,

p53

e

RB1 ​​

[14] – [18], e os resultados não publicados). A análise da mutação foi realizada por sequenciação das sequências codificantes completas de genes e análise de todas as mutações em ambos os fragmentos de genes genómicas e transcrições. Em conjunto, as 12 linhas de células continha sete mutantes de genes que devem ser detectáveis ​​por PAC, visto que resultaram na exclusão de oito exões de entre os quatro genes supressores de tumor (as mutações estão detalhadas na Tabela 1). Nós exploramos a estratégia PAC em diferentes níveis de corte, identificando exons outlier que foram expressas menos do que 16 vezes, 8 vezes, 4 vezes, 2,8 vezes e 2,5 vezes do que o seu nível de expressão previsto (ou seja, os valores do PAC de -4,0, -3,0, -2,0, -1,5 e -1,3, respectivamente). exons discrepantes foram identificadas sem conhecimento prévio dos dados de mutação.

Do total de 3,4 milhões de conjuntos de sondas núcleo que nós ensaiado para as linhas 12 celulares (290.000 conjuntos de núcleo de sonda por amostra), PAC identificou 21.151 (0,6%) conjuntos de sondas outlier no PAC -4.0 valor e 94.590 (2,8%) conjuntos de sondas outlier no PAC valor -1.3 (Fig. 2A). Todos os conjuntos de sondas em valores -2.0 (conjuntos de 34.137 sondas correspondentes a 31,357 exons e 10,247 genes) estão listadas na Tabela complementar dados S1. Quando todos os valores de PAC são representados num histograma de frequência, uma cauda para a extremidade negativa é observada (Fig. 2A). Esta distribuição assimétrica dá uma estimativa aproximada da taxa de falsos positivos nos vários níveis do PAC. PAC dos sete genes de supressão tumoral totalmente caracterizado por as 12 linhas celulares envolvidos análise de 1.200 exões (1,752 conjuntos de sondas). PAC correctamente detectados seis dos oito exões ignorados quando se utiliza valor PAC -4,0, sete saltou a exões foram detectados no PAC -2,0 valor e todos os oito ignorado exões foram detectados no PAC valor -1,3 (Fig. 2C). Mais importante, o número de falsos positivos exões outlier foi substancialmente reduzida a PAC valor -4,0 comparadas com o valor PAC -1,3, resultando num aumento da taxa positiva verdadeira de 9% a 24% dos exões identificados outlier (Fig. 2D) . Para efeito de comparação, a amostragem aleatória de 24/1200 exons tem um 85% de probabilidade de não encontrar qualquer verdadeira mutação positiva e só a 10

-8 chance de encontrar 6 ou mais. Para os genes do cancro conhecidos usados ​​em nosso estudo, a verdadeira taxa positiva de nossa abordagem, assim, de longe excede a seleção exão aleatória. A este respeito, a redução do número de genes candidatos falsos positivos podem, inicialmente, ser muito mais benéfico para um projecto de pesquisa de genes do que a identificação precisa de todos os verdadeiros positivos outlier exões. Juntos, nossos resultados mostram que a estratégia PAC é confiável na detecção de mutantes salto de exon em linhas celulares de cancro.

(A) e (B) o número total de conjuntos de sondas outlier PAC-detectados de entre 290.000 conjuntos de sondas núcleo em 12 linhas celulares de cancro da mama e em 14 glioblastomas, respectivamente. (C) Número de exões ignorados detectados pelo PAC como uma percentagem de todos os oito ignorado exões presentes nas linhas celulares de cancro da mama, ou como uma percentagem da 36 ignorada

EGFR

exões presentes nos glioblastomas (ver Tabela 1 ). (D) Número total de exons outlier (verdadeiros além de falsos positivos) e número de verdadeiros exons discrepantes positivos detectados pelo PAC entre os sete genes supressores de tumor e o

EGFR

oncogene. Verdadeiros exons discrepantes positivos incluem todos PAC detectado exons ignorados e duas mutações missense (

PTEN

c.274G C em CAMA1,

MAP2K4

c.551C G em MDA-MB-134VI).

desempenho PAC em amostras com expressão transcrição heterogéneo

Semelhante a outros métodos de rastreio genético, PAC é mais adequado para detectar alterações genéticas homozigotos. Por exemplo, o valor mais baixo quando PAC 50% transcritos de tipo selvagem estão presentes (como pode ser o caso de uma alteração genética heterozigótico) é -1,0. A detecção de um tanto comprometido de exões saltarão PAC -4,0 valor, em comparação com PAC valor -1,3 (isto é, seis versus todos os oito exões saltado) em nosso painel de linhas celulares de cancro de mama, por conseguinte, pode ter sido causada pela expressão de um segundo transcrito aberrante que ainda inclui (parte) do exão. Com efeito, uma segunda

CDH1

comprimento transcrição de intensidade menor foi detectada em CAMA-1 (Fig. 3A), o mutante de local de splicing que tinha sido detectada apenas no PAC valor -1.3.

Skipping de

CDH1

exão 11 em células de cancro da mama CAMA linha-1 foi detectada apenas no valor PAC -1,3, provavelmente devido a expressão de uma segunda variante de transcrição aberrante (*) que foi detectada por RT-PCR convencional. (B) A expressão de

EGFR

transcrições foi detectada em amostras de glioblastoma por Real-Time RT-PCR, utilizando primers desenhados para anelar dentro da região exclusão do exon 2-7 do

EGFRvIII

isoforma ( barras cinzentas) ou fora da região de deleção (barras pretas). Diferenças nos valores Ct entre os dois fragmentos de transcrição são indicativos para

EGFRvIII

níveis de expressão de isoformas. Todas as cinco amostras com a

EGFRvIII

isoforma também expressou quantidades significativas de tipo selvagem

EGFR

transcrições, provavelmente comprometendo detecção de outlier pelo PAC (indicado por “detectado” e “não detectado”). De tipo selvagem, as amostras com transcritos normais; Controles, amostras cerebrais não-malignas.

Para mais burros o desempenho do PAC em amostras com heterogênea (do tipo selvagem e mutante) expressão transcrição, realizamos PAC em 14 amostras de glioblastoma clínicos (selecionado para conter 70% núcleos tumor) que tinha ampliações genómicas do

EGFR

oncogene. Glioblastomas com

EGFR

amplificações frequentemente carregam uma eliminação intragenic dos exons 2 a 7, resultando na expressão do constitutivamente activa

EGFRvIII

isoforma [8], [19]. No entanto, glioblastomas expressando o

EGFRvIII

isoforma também frequentemente expressar o tipo selvagem

EGFR

transcrições. Esta heterogeneidade

EGFR

expressão está relacionada com a amplificação do

EGFR

lugar antes da exclusão de exons [20], embora as células não malignas nas amostras de glioblastoma pode também exprimir

EGFR

. Dos catorze amostras de glioblastoma utilizados neste estudo, seis expresso

EGFRvIII

(um total de 36 exões ignorado), dos quais cinco também expressaram níveis significativos de tipo selvagem

EGFR

transcritos como determinado por quantitativa real-Time PCR (qPCR) (Fig. 3B) (RNA insuficientes permaneceu da sexta amostra com

EGFRvIII

expressão para executar qPCR).

do total de 4,1 milhões de conjuntos de núcleo sonda que temos ensaiado para estas 14 amostras (290.000 conjuntos de núcleo de sonda por amostra), PAC identificou 1.646 (0,04%) conjuntos de sondas outlier no PAC -4.0 valor e 39.936 (1,0%) conjuntos de sondas outlier no PAC valor -1.3 (Fig. 2B). PAC assim identificados três a dez vezes menos exões outlier nos glioblastomas, em comparação com as linhas celulares de cancro da mama (Fig. 2a). Todos os conjuntos de sondas em valores -2.0 (11.287 conjuntos de sondas, correspondentes a 10,903 exons e 6.264 genes) estão listadas na Tabela complementar dados S1. Este menor número de exões outlier nos glioblastomas pode estar relacionada com a sua histopatologia homogénea e os seus perfis de expressão de genes altamente similares [13], [21], para a presença de células não neoplásicas nas amostras de tumor, ou pode reflectir enviesamentos de amostragem devido aos tamanhos pequenos coorte.

PAC da

gene EGFR

nos 14 glioblastomas envolveu a análise de 392 exons (434 conjuntos de sondas). PAC detectados dois dos seis

EGFRvIII

expressando tumores (12 dos 36 ignorada exons) a PAC valoriza -2,0 e inferior (Tabela 1 e Fig. 2C). Dos dois glioblastomas com

EGFRvIII

que tinha sido detectado pelo PAC, um tinha significativamente (ou seja, 5 vezes) mais mutante do tipo selvagem

EGFR

transcrições. Neste tumor, a diferença do valor Ct foi 2 entre fragmentos qPCR no interior (medindo apenas do tipo selvagem

EGFR

transcrições) e fora (medição tanto do tipo selvagem e

EGFRvIII

transcrições) a

EGFR

exão 2-7 exclusão região (Fig. 3B). A outra glioblastoma tinha uma diferença de nível de expressão semelhante entre o tipo selvagem e

EGFRvIII

transcrições (Ct diferença do valor de -1,5) como os três glioblastomas que não tinham sido detectados pela PAC, mas tinham menor geral

EGFR níveis de transcrição

. Parece que a detecção PAC da

EGFRvIII

isoforma é determinado pelo nível de expressão global do

EGFR

transcrições em combinação com a proporção de

EGFRvIII

e selvagem do tipo

EGFR

transcrições, onde as amostras com muito alto

EGFR

níveis de transcrição pode escapar da detecção PAC devido à saturação dos conjuntos de sondas envolvidos. Estes resultados mostram que a estratégia de PAC pode detectar-exon mutantes em amostras clínicas de cancro, se o nível do índice mutante /tipo selvagem transcrição é elevada e, quando conjuntos de sondas estão dentro do intervalo linear de detecção de micro-arranjo.

PAC desempenho na detecção de exons outlier recorrentes

desempenho PAC também podem ser desafiados por exons outlier recorrentes. Tais exons frequentemente ignorados irá resultar em uma subestimação do rácio de exão /transcrito no algoritmo PAC e assim aumentar os valores do PAC. Por isso, avaliou o desempenho do PAC na detecção exons outlier recorrentes pela substituição reiterado de

EGFRvIII

expressar amostras com amostras que expressavam somente de tipo selvagem

EGFR

(Fig. 4A). Quando seis das 14 amostras de expressar

EGFRvIII

, a exclusão de exons 2-7 em GBM67 não é detectado pelo PAC. valores do PAC, na verdade diminuiu com a redução de índices de tipo selvagem contra amostras mutantes. No entanto, a diminuição foi relativamente pequena e resultou na identificação de apenas uma das seis exões eliminados uma vez que a proporção tinha caído para uma amostra de mutante de entre 14 amostras. Nós também simulado detecção PAC de mutações recorrentes com linhas celulares de cancro da mama dois, dos quais HCC1937 tinha pulado

RB1 ​​

exão 22, e já foram capazes de identificar o mutante entre duas amostras até mesmo cinco mutantes de entre seis amostras (Fig. 4B). Estes experimentos de simulação indicam que a PAC tem um bom desempenho na identificação de mutações-salto de exon recorrentes.

(A) experiência de simulação para determinar o desempenho do PAC na detecção de eventos de salto de exon recorrentes entre as amostras de glioblastoma clínicos, onde as amostras mutantes expressam o

EGFRvIII

isoforma com exclusão de exons 2 a 7. a coorte de 14 glioblastomas incluiu seis amostras mutantes que foram substituídas por amostras do tipo selvagem através de reiteração, com base em sua posição da esquerda para a direita na Fig. 3B. Supressão de

EGFR

exão 6 na amostra GBM67 foi detectada apenas amostra mutante como único. (B) experimento de simulação para determinar o desempenho do PAC na detecção de eventos de salto de exon recorrentes entre linhas celulares de cancro da mama, utilizando a linha de células do tipo selvagem CAMA-1 e

RB1 ​​

exão 22 eliminação HCC1937 mutante. As duas linhas de células foram analisados ​​em vários tamanhos de coorte, quer com o tipo selvagem ou a linha de células mutante como única amostra. A amostra mutante foi ainda detectada no PAC valor -2.0 com cinco mutantes recorrentes entre seis amostras. O nível de expressão média de

RB1 ​​

exão 22 caiu abaixo PLIER 50, quando mais de cinco mutantes foram simulados, impossibilitando a análise PAC (ver Materiais e Métodos).

Detecção de substituições de nucleotídeos e novas mudanças genéticas por PAC

O desempenho do PAC foi ainda avaliados por análise de exons outlier seleccionados entre todos os candidatos ao valor PAC ≤-2.0 em linhas celulares de cancro da mama e amostras de glioblastoma clínicos. No total, 44 e 68 exons outlier foram selecionados em linhas celulares de cancro da mama e amostras de glioblastoma, respectivamente. A análise de sequência de PCR amplificado exões outlier identificados dois novos salto de exon eventos e duas mudanças de bases genética novos em amostras de glioblastoma, bem como uma série de alterações de bases previamente relatados (SNPs homozigótica) em linhas celulares de cancro da mama (n = 5) e glioblastomas ( n = 16). RT-PCR resultados da experiência estão detalhados na tabela complementar dados S2.

A maioria das mudanças genéticas identificadas pelo PAC foram as mudanças de nucleotídeo único, tanto em linhas celulares de cancro da mama (cinco conhecidos SNPs) e nos glioblastomas (dois novela de base alterações e 16 SNPs conhecidos). Além disso, dois em cada dez mutações pontuais oncogênicos previamente identificadas que não resultou em eventos salto de exon foram também PAC detectado em nossa coorte de linhas celulares de cancro da mama:

MAP2K4

c.551C G em MDA-MB-134VI e

PTEN

c.274G C em CAMA-1; [16], [17] (Fig. 5). descasamentos de nucleotídeo único foram utilizados para definir a especificidade de hibridação em outras plataformas de microarray Affymetrix. Por analogia, as substituições de nucleotídeo único no câncer também pode causar hibridação reduzida às sondas no microarray e, assim, ser detectado como exons outlier por PAC. Com efeito, todo o PAC detectadas alterações de bases e SNPs foram localizada centralmente dentro da região selecção do conjunto de sonda e se sobrepõem com várias das suas sondas individuais (Fig. 5).

(A) PAC prediz saltando de 5 ‘ final de

PTEN

exão 5 na linha celular CAMA-1 do cancro da mama. Esta linha de células contém uma substituição de nucleótidos no exão identificado. Esta mudança de base não induz salto de exon, mas está centralmente localizado a todas as três sondas do conjunto de sonda (B). A localização central sugere que esta mutação causa uma afinidade reduzida às sondas sobre a matriz-exão.

Um dos PAC identificou novas exão eventos ignorando foi previsto para resultar numa deleção de quatro extremidade 3 ‘ exons de

EGFR

(Fig. 6A). Este evento de salto de exon era devido a uma deleção genómica, tal como determinado utilizando PCR semiquantitativa em ADN genómico de tumor. Comparado ao “fim do

EGFR

locus GBM157, a 3 ‘da extremidade 5 mostraram menos amplificação (ΔCt -2,5) enquanto que outras amostras apresentaram igual amplificação entre o 5’ e 3 ‘do gene (ΔCt 0,3 ± 1,9). Similar ‘eliminações 3 em

EGFR

têm sido observados anteriormente em gliomas [19]. O segundo evento de salto de exon previsto pelo PAC resultaria em uma deleção do exão 30

FCGBP

ADNc (Fig. 6B). Esta supressão irá causar um desvio de enquadramento que é previsto para resultar numa proteína truncada. A ausência do exão 30 foi confirmada por análise da sequência de RT-PCR e (Fig. 6C). Novos identificadas alterações de uma única base incluem uma única mudança de base 1934C G (S645C) no

EGFR

gene, (Fig 6A e D.), E uma única mudança de base 946G A (G316R) no

TLE2

gene (Fig. 6E). O G316R (946G A) mutação no

TLE2

é traduzida como “patológico” por PMUT (mmb2.pcb.ub.es:8080/PMut/) e “não tolerada” pelo SIFT Blink (blocks.fhcrc. org /peneirar /SIFT_BLink_submit.html). Em resumo, o romance salto de exon eventos e mudanças de base identificados pela análise de um conjunto seleccionado de exons outlier confirma a adequação do PAC para identificar genes do cancro candidato.

(A) PAC detecção de novas alterações genéticas em

EGFR

. PAC previsto pular dos últimos quatro exons de GBM157 e a extremidade 5 ‘do exão 17 em GBM172. PCR semi-quantitativa em ADN genómico confirmou a supressão na GBM157 (não mostrado). (B) PAC prediz salto do exon 30 no

gene FCGBP

em GBM60. (C) RT-PCR confirmou a

FCGBP

salto de exon evento em GBM60; outros tumores não mostraram este salto de exon. (D) A sequenciação directa identificada uma única mudança de base no

EGFR

em GBM172 (como previsto pelo PAC, ver Fig. 6A). (E) A confirmação de um PAC previsto mudança no

gene TLE2

em GBM60. A substituição de nucleotídeos sobrepõe-se com sondas individuais do conjunto de sonda.

Discussão

Nós desenvolvemos uma abordagem que utiliza padrão de correlação com base (PAC) para triagem de mutações do gene do cancro que causam exão pular nos transcritos codificados. Nós demonstramos que a PAC detectada corretamente todos os sete mutantes salto de exon previamente identificados em linhas celulares de cancro da mama e dois dos seis mutantes em amostras de glioblastoma clínicos. Os verdadeiros e falsos taxas positivas foram determinados em vários níveis de exigência. Importante, PAC identificou uma série de novas alterações genéticas, incluindo as que afetam splicing, que anteriormente tinha sido detectado. Estas novas alterações genéticas são marcas nos genes do câncer conhecido (

EGFR

), resultará em um frameshift (

FCGBP

) ou são prestados “não tolerada” pela previsão gene algoritmos PMUT e peneirar Blink (

TLE2

). Experimentos adicionais são necessários para determinar se as mudanças nos genes do cancro candidato novos (

FCGBP

e

TLE2

) são, de facto oncogênico. Um número significativo de substituições de nucleotídeos que estão localizados dentro da região de seleção do conjunto de sonda também estão PAC detectada (Fig. 5). Nossos resultados, assim, classificar PAC como uma abordagem confiável para triagem de genes do cancro candidato de uma forma global.

perfil de expressão gênica ao nível dos exons individuais só recentemente se tornou viável através da liberação de matrizes de exão. Aqui, temos explorado a eficácia do PAC para identificar mutantes-exon, mas a estratégia também pode ser utilizada para deduzir a estrutura primária de transcritos de genes [13], [22]. É importante notar que o algoritmo PAC, detalhado em Materiais e Métodos, é na sua essência uma fórmula simples, que prediz exões outlier com base nas diferenças de mudança de dobragem entre os níveis de expressão de exão medidos e previstos. Outras abordagens podem ser utilizadas para identificar valores aberrantes (por exemplo, N-padrão desvios do nível médio de expressão), mas precisa de ter em conta a não-linearidade nos níveis de expressão do gene entre as amostras (em especial para os genes do cancro) e a dimensão limitada da amostra. Por causa das altas taxas de verdadeiros positivos obtidos pelo PAC, nós não explorar abordagens estatísticas alternativas.

O algoritmo PAC é independente da plataforma de matriz ou organismo, permitindo a aplicação da estratégia PAC em uma ampla variedade de sistemas biológicos . Vários algoritmos para de nível exão perfil de expressão estão comercialmente disponíveis, incluindo Stratagene ArrayAssist (www.stratagene.com), Partek Genomics Suite (www.partek.com) e Genomatix Suite (www.genomatix.de). Embora cada um destes pacotes de software é relativamente simples, vantagens importantes de PAC é que ela permite a detecção de exões outlier únicas sem qualquer conhecimento prévio do gene que codifica ou a sua estrutura de transcrição e que ele não necessita de subgrupos predefinidos de amostras com expressão diferencial dos exons outlier.

Tal como acontece com qualquer estratégia de rastreio global, PAC tem as suas pré-condições para a detecção de exons outlier. Em primeiro lugar, a identificação de exões outlier requer o seu nível de expressão de transcrição para estar dentro da gama linear de detecção da matriz de exão, que é determinada pelo seu nível de expressão de transcrição, bem como a eficiência de hibridação e especificidade dos conjuntos de sondas envolvidos. O constituinte das amostras de ensaio é outra consideração, particularmente quando ambos os transcritos de tipo selvagem e mutante podem ser expressos. Por exemplo, a linha celular de cancro da mama coorte incluiu dois mutantes de locais de splice que escapado à detecção pelo PAC porque cada um tinha um segundo comprimento transcrição de maior intensidade que resultou de splicing críptico (

BRCA1

c.5396 + 1G A na MDA-MB-436 [14] e

p16

c.150 + 2T . C em MDA-MB-436 (. Nagel

et al

, submetido para publicação) Além disso, a detecção PAC do

EGFRvIII

isoforma transcrição em glioblastomas clínicos foi determinada pelo nível de expressão global do

EGFR

transcrições, que estava perto dos limites de detecção linear em todos os cinco

EGFRvIII

glioblastomas , mas também por a razão entre o

EGFRvIII

isoforma versus tipo selvagem

EGFR

transcritos (Fig. 3B). por consequência, para que o desempenho de APA pode ser comprometida na detecção de um exão outlier quando selvagem transcrições -tipo representam mais de um quarto de todos os transcritos de gene em particular que, o que poderia ser o caso em amostras de tumores e as células neoplásicas menos do que 75%. no entanto, os níveis de alelos mutantes e de tipo selvagem de expressão são tipicamente desproporcional ao seu alelo e frequência de detecção pelo PAC, assim, mais uma vez é determinado pelo nível de expressão (relativa) da transcrição aberrante. Por conseguinte, tem um melhor desempenho do PAC na ausência de expressão de transcrição de tipo selvagem. transcrições homozigotos são encontrados predominantemente entre os genes supressores tumorais, onde muitas vezes um alelo é mutado acompanhada de perda do outro alelo

A influência dos rácios de alelos foi ainda reforçada em nossas simulações de detecção de outlier recorrente pelo PAC:. O

EGFRvIII

isoforma em GBM67 foi detectada apenas uma vez que estava presente como um outlier única entre as 14 amostras, considerando que não havia sido detectado em nossa tela PAC original, que incluiu outros cinco

EGFRvIII

expressar glioblastomas (Fig . 4A). No entanto, este sub desempenho ideal PAC não apareceu relacionado à recorrência de casos anómalos, como valores extremos recorrentes foram facilmente identificados entre linhas celulares – mesmo quando presente em cinco das seis linhas celulares (Fig 4B.). As experiências de simulação também revelou que duas linhas de células foram suficientes para detectar com fiabilidade exões outlier e que mais do que oito linhas de células não melhorar ainda mais o desempenho do PAC, enquanto que para as amostras de tumor clínicos dez apareceu o mínimo mas vinte seria preferida (Fig. 4).

Como eficiente pode PAC seja na detecção de mutações nos genomas do câncer? De nossa seleção de exons outlier, identificamos ~ 20% (21/112) SNPs, ~ 2% (2/112) mudanças novela de base e de ~ 2% eventos de salto (2/112) exão. Quando incluindo todas as substituições de nucleótidos, a taxa de falso positivo nestas experiências é ~76%. Por extensão, a amplificação e sequenciação 1,763 reacções numa única amostra (todos os valores extremos valores -4,0 PAC) pode ser esperado para produzir tanto como 34 novas alterações de bases e 34 eventos salto de exon. Portanto, a nossa abordagem pode ser classificado como um método de rastreio é altamente eficiente para genes do cancro candidato, especialmente quando comparado com selecção aleatória de exões. Estudos adicionais devem, então, ser realizados para determinar se as alterações identificadas são causal para a formação de tumores e /ou progressão, por exemplo por rastreio de mutações adicionais (por exemplo, deleções, mutações missense) em outras amostras de tumor ou por análise funcional dos mutantes identificados.

Materiais e Métodos

Amostras

a nossa colecção de 41 linhas humanos disponíveis publicamente de células de cancro da mama tinha sido submetido a telas de mutação de genes supressores de tumor de sete:

BRCA1

(Breast Cancer Gene Susceptibilidade 1; OMIM 113705),

CDH1

(E-caderina; OMIM 192090),

MAP2K4

(MAP Kinase Kinase 4, também conhecido como

MKK4

; OMIM 601335),

PTEN

(fosfatase e homólogo Tensin; OMIM 601728),

p16

(CDK4-inibidor, também conhecido como

INK4A

,

CDKN2A

; OMIM 600160),

p53

(p53 Proteína Tumor; OMIM 191170) e

RB1 ​​

(Retinoblastoma Susceptibilidade Gene 1; OMIM 180200) [14] – [18] (Nagel

et al.

submetido para publicação). A análise mutacional envolvido sequenciação de toda a região de codificação desses genes no ADN genómico, assim como a análise da transcrição codificado. As linhas celulares de cancro da mama doze utilizados para este estudo foram: CAMA-1, EVSA-T, HCC1937, MDA-MB-134VI, MDA-MB-157, MDA-MB-435S, MDA-MB-436, MDA-MB- 453, MDA-MB-468, MPE600, OCUB-F e SK-BR-5. espécimes de glioblastoma clínicos foram congeladas em nitrogênio líquido imediatamente após a ressecção cirúrgica de pacientes na Universidade Erasmus Medical Center, conforme descrito em outro lugar [13]. avaliação patológica revelou pelo menos 70% núcleos de tumor para cada espécime.

Deixe uma resposta