PLOS ONE: A reprodutibilidade ea concordância de Diferencial DNA metilação e expressão gênica em Cancer

Abstract

Fundo

Centenas de genes com a metilação do DNA diferencial de promotores foram identificados para vários tipos de câncer. No entanto, a reprodutibilidade das descobertas de metilação do DNA diferenciais para o câncer e a relação entre a metilação do DNA e expressão gênica aberrante não têm sido sistematicamente analisados.

Metodologia /Principais Achados

Usando dados da matriz para sete tipos de cancros, primeiro avaliou os efeitos de lotes experimentais sobre a detecção de DNA de metilação diferencial. Em segundo lugar, nós comparamos as direções das mudanças de metilação do DNA detectados a partir de diferentes conjuntos de dados para o mesmo câncer. Em terceiro lugar, foi avaliada a concordância entre metilação e de expressão gênica mudanças. Finalmente, comparamos as mudanças de metilação de DNA em diferentes tipos de câncer. Para um determinado câncer, as direções das mudanças de metilação e de expressão detectadas a partir de diferentes conjuntos de dados, excluindo os efeitos potenciais em lote, eram altamente consistentes. Em diferentes tipos de cancro, a hipermetilação do ADN foi altamente correlacionada inversamente com a infra-regulação da expressão do gene, enquanto que a hipometilação foi apenas fracamente correlacionadas com a sobre-regulação de genes. Finalmente, descobrimos que genes comumente hypomethylated em diferentes tipos de câncer funções associadas com a inflamação crônica realizados principalmente, como ‘queratinização “,” quimiotaxia “e” resposta imune “.

Conclusões

efeitos lote poderia afectar grandemente a descoberta de biomarcadores de metilação do DNA. Para um cancro particular, tanto a metilação do DNA e a expressão diferencial de genes pode ser detectada de forma reprodutível a partir de estudos diferentes, sem efeitos lote. Enquanto hipermetilação DNA é significativamente ligado ao gene da sub-regulação, hipometilação é apenas fracamente correlacionada com gene-regulação e é susceptível de ser ligada à inflamação crônica

Citation:. Yao C, Li H, Shen X, Ele Z, Ele L, Guo Z (2012) Reprodutibilidade e Concordância Diferencial DNA metilação e expressão gênica em Câncer. PLoS ONE 7 (1): e29686. doi: 10.1371 /journal.pone.0029686

editor: Abdelilah Aboussekhra, King Faisal Specialist Hospital Research Center, Arábia Saudita

Recebido: 22 de Agosto de 2011; Aceito: 01 de dezembro de 2011; Publicação: 03 de janeiro de 2012

Direitos de autor: © 2012 Yao et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este trabalho foi apoiada pela National Science Foundation Natural da China (Grant no: 30370388, 81071646, 91029717, URL: https://www.nsfc.gov.cn/Portal0/default152.htm), Excelente Fundação da Juventude da Província de Heilongjiang (Grant Não . JC200808, URL: https://jj.hljkj.cn/qn/) e Natural Science Foundation da Província de Heilongjiang da China (subvenção: QC2010012, URL: https://jj.hljkj.cn/zr/). Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

matrizes de metilação têm sido utilizados para identificar centenas de genes com a metilação do DNA diferencial dos seus promotores em vários tipos de cancros [1], [2], [3], [4], daqui em diante referidos como genes DM , fornecendo insights sobre biologia do câncer e biomarcadores úteis para prever resultados de câncer e alvos de drogas [5]. No entanto, vários factores biológicos e técnicos podem afetar a descoberta de biomarcadores para os cânceres humanos. Em particular, efeitos de lotes, que podem ser introduzidos utilizando amostras a partir de diferentes lotes experimentais (tais como a preparação das amostras em momentos diferentes, com diferentes protocolos, em diferentes lotes chip ou diferentes plataformas de microarray), pode produzir diferenças não biológicos sistemáticas entre diferentes grupos de amostras de [6], [7], [8], [9]. Assim, uma tarefa desafiadora de fundamental importância para a validação de biomarcadores é avaliar a reprodutibilidade da descoberta do gene DM através de diferentes estudos para um determinado câncer [10], [11], [12]. Este problema não foi totalmente resolvido até agora. Uma vez que os genes DM são reprodutível identificados para um câncer em particular, uma tarefa importante é definir seus papéis no desenvolvimento do câncer. É amplamente aceito que aberrantes de metilação do promotor é uma causa significativa da expressão do gene alterado no câncer [13]. No entanto, vários estudos recentes têm desafiado a correlação inversa entre a metilação e expressão alterações [14], [15]. Assim, a relação entre as alterações na metilação do DNA e expressão gênica em câncer ainda precisa ser avaliado sistematicamente.

O banco de dados Cancer Genome Atlas (TCGA) [16] fornece centenas de perfis de metilação para vários tipos de câncer. Para um câncer em particular, as amostras foram muitas vezes coletados de diferentes laboratórios e tratados em diferentes lotes experimentais devido a complicações práticas, tais como a limitação da tecnologia. Neste trabalho, com base em perfis de metilação por nove tipos de câncer coletadas no banco de dados TCGA [16], nós mostramos que a integração indevidamente dados de diferentes lotes experimentais para extrair genes DM pode ser enganador. Após a exclusão de conjuntos de dados com efeitos potenciais do lote, foi demonstrado que a alteração de estados de metilação (hipermetilação) ou hipometilação de genes DM em amostras de cancro em comparação com amostras normais podem ser altamente reprodutível detectado a partir de diferentes conjuntos de dados de um determinado cancro. Uma tendência semelhante foi observado para as alterações de expressão de genes em tipos de cancro com base em conjuntos de dados disponíveis na base de dados Gene Expression Omnibus [17]. Em seguida, com base nas reprodutíveis genes DM e DE para cada tipo de cancro, determinou-se que a hipermetilação do promotor é altamente inversamente correlacionada com o gene para baixo-expressão, enquanto que a hipometilação é apenas fracamente correlacionados com o up-expressão de genes com grandes alterações de expressão. Finalmente, descobrimos que genes hypomethylated perturbar principalmente funções directamente ligadas à inflamação crônica, como “quimiotaxia” e funções “resposta imune.

Materiais e Métodos

As fontes de dados

os conjuntos de dados de expressão de metilação e descritas na Tabela 1 e na Tabela 2 foram carregados a partir do GEO [17] e [16] TCGA bases de dados, respectivamente. Os perfis de expressão de genes em bruto foram normalizados utilizando o algoritmo de análise de multi-matriz sólida (RMA) [18]. Foram utilizados os 2 dados de nível definidos no banco de dados TCGA, que oferece U (não metilado) e valores de M (metilados) para cada sonda. Os valores beta das sondas foram calculados por M /(L + M + 100) [19]. Os IDs de sonda foram mapeados para IDs de genes com o quadro de anotação para cada plataforma.

Análise dos efeitos de lote

Os efeitos lote poderia ser gerado para amostras de diferentes lotes experimentais ou centros de recolha no banco de dados TCGA [16]. Para os dados de metilação de TCGA, calculamos uma estatística F para testar a correlação entre os níveis das sondas de metilação (valores Beta) e de seus lotes experimentais ou laboratórios de coleta.

P valores

foram ajustados pelo procedimento de Bonferroni-Hochberg com a taxa de descoberta de falsas (FDR) 0,05 [20] e sondas significativas foram consideradas suscetíveis aos efeitos em lote [9]. Para avaliar o efeito de lotes experimentais de detecção do gene DM, também em comparação genes DM seleccionados a partir de conjuntos de dados comprometedores amostras de tumores de diferentes lotes e um determinado grupo de amostras normais de um lote para um tipo de câncer em particular.

Seleção de genes DM e genes dE

para cada conjunto de dados, foram selecionados genes DM com t-teste [19] e utilizado o procedimento Benjamini-Hochberg para controlar o FDR em um determinado nível [20]. Os genes DM com maiores meios de níveis de metilação nas amostras de câncer do que nas amostras normais foram definidos como genes hypermethylated; de outro modo, os genes de MS foram definidos como genes hypomethylated.

genes diferencialmente expressos (DE) foram seleccionados usando o SAM (análise de significância de microarray) algoritmo [21]. Genes com valores P ajustado inferior a 0,05 foram definidos como genes diferencialmente expressos (DE).

análise Reprodutibilidade dos genes DM e genes DE

Em seguida, foi avaliada a reprodutibilidade da detecção do gene DM, analisando a sobreposição das listas de genes DM selecionada a partir de dois conjuntos de dados para cada câncer. Se genes k são compartilhados por lista 1, com comprimento L

1 e da lista 2 com o comprimento L

2, então o POG (percentagem de genes sobrepostos) pontuação da lista 1 (ou lista 2) para listar 2 (ou lista 1) é POG

12 = K /L

1 (ou POG

21 = K /L

2). Em seguida, foi avaliada a consistência das direções de metilação (hipermetilação ou hipometilação) dos genes k partilhados por listas 1 e 2 através dos dois conjuntos de dados. A mesma análise foi realizada nas listas de genes DE selecionados a partir de dois conjuntos de dados de expressão para cada câncer.

A concordância entre a metilação do DNA e expressão gênica muda

Se a expressão de um hypermethylated (ou hypomethylated) gene foi significativamente regulada para baixo (ou sobre-regulada), considerou-se a mudança de metilação a ser concordante com a alteração da expressão do gene. Nós definimos a taxa de concordância entre a hipermetilação do DNA e gene para baixo-regulação como a percentagem de genes regulados por baixo entre os genes hypermethylated com expressão diferencial. O

P valor

foi calculado pelo modelo hypergeometric [10], [11], [12]. Da mesma forma, a taxa de concordância entre hipometilação do ADN e gene-regulação foi definido como a percentagem de sobre-regulada genes entre os genes hypomethylated com expressão diferencial.

enriquecimento função dos genes DM

Usando Elim software, detectamos termos enriquecidos com genes DM [22] Gene Ontology (GO).

P valores

foram ajustados pelo procedimento de Bonferroni-Hochberg com um FDR. 0,05 [20]

Resultados

efeitos de lote para a detecção do gene DM

o primeiro avaliou os efeitos de lotes experimentais sobre o nível de metilação para cada sonda nas amostras de tumores de dois lotes separadamente para nove tipos de cânceres coletadas no banco de dados TCGA (ver Tabela 1) com a estatística F com uma taxa de descoberta falso ( FDR) 0,05 [20] (ver

Métodos

). Como mostrado na Fig. 1a, cerca de 30% das sondas, em média, eram significativamente susceptíveis aos efeitos de lote para os tipos de cancro quando nove amostras vieram de diferentes laboratórios e diferentes lotes. E cerca de 20% sondas foram ainda significativamente sensíveis quando restrito amostras do mesmo laboratório, mas tratado em lotes diferentes (Fig. 1b). No entanto, apenas cerca de 7,7% sondas foram significativamente sensíveis quando as amostras veio dos mesmos lotes (Fig. 1C). Especialmente, como mostrado na Fig. 1d, as amostras de tumores de dois lotes (lote 9 e lote 12) para cystadenocarcinoma seroso do ovário poderiam ser agrupados perfeitamente de acordo com o lote pelo algoritmo de agrupamento hierárquico utilizando as distâncias euclidianas dos valores Beta entre as amostras.

( a) diferentes lotes e laboratórios diferentes; (B) no mesmo laboratório, mas diferentes lotes; (C) o mesmo lote, mas os laboratórios diferentes; (D) hierárquica aglomerando as amostras de tumor de cistoadenocarcinoma seroso do ovário em lote 9 e 12. Para um lote tipo de cancro indicado no eixo dos x do gráfico a, b ou c, um gráfico de caixa no eixo dos Y representa a percentagem de sondas significativamente susceptíveis a diferentes condições de lote. A percentagem toma o valor que varia de 0 (nenhuma sonda susceptível) para 1 (100% sondas sensíveis). Cada caixa se estende desde a dobradiça inferior (definida como o percentil 25) para a dobradiça superior (percentil 75) e a mediana é mostrada como uma linha em toda a caixa.

Os resultados acima indicaram que a integração amostras de tumores de diferentes lotes para detectar genes DM pode ser enganosa. De fato, como resultado dos efeitos de lote, a alteração de estados de metilação de genes DM em amostras de cancro em comparação com amostras normais podem ser altamente inconsistente quando se comparam as amostras de tumor de diferentes lotes com o mesmo grupo de voluntários normais (ver Fig. 2) . Por exemplo, ao comparar as amostras de tumor de lote 9 e 15 para lote cistadenocarcinoma seroso do ovário com o mesmo grupo de amostras normais (Lote 27), respectivamente, a consistência da mudança de estados de metilação de genes comuns DM foi de apenas 23,5%. Portanto, a maior parte da metilação diferencial foi observada entre lotes em vez de através dos grupos biológicos, levando a resultados altamente reprodutíveis

.

para cada tipo de cancro indicado no eixo dos x, um gráfico de caixa no eixo dos y representa o consistência pontuação definida como a proporção de genes DM com os estados de metilação consistentes entre todos gene DM sobreposição comumente detectada em ambos os dois grupos (ver secção ‘métodos’). A pontuação consistência toma o valor que varia de 0 (nenhum estado consistente) a 1 (100% estados consistentes). Cada caixa se estende desde a dobradiça inferior (definida como o percentil 25) para a dobradiça superior (percentil 75) e a mediana é mostrada como uma linha em toda a caixa.

A reprodutibilidade da detecção do gene DM

para evitar efeitos de lote e polarização que podem ser introduzidos por diferentes idades dos pacientes em potencial, analisamos apenas os perfis dos cinco tipos de câncer para cada um dos quais tumor de correspondência par e amostras normais dos mesmos pacientes recolhidos pela mesmo laboratório e medido no mesmo lote experimental estavam disponíveis (ver Tabela 2). Para cada câncer, usamos as duas maiores lotes como conjuntos de dados independentes e detectados genes DM com t-teste no FDR 0,05 [20]. Em seguida, foi avaliada a consistência das duas listas de genes DM detectados separadamente dos dois conjuntos de dados (lotes), calculando a percentagem de genes sobrepostos (POG) entre as duas listas de genes DM [10] (ver

Métodos

). Para cada cancro, a maioria dos genes DM na lista mais curta foram incluídos na lista mais longa, tal como reflectido pelas POG

12 pontuações apresentadas na Tabela 3. Mais de 99% dos genes DM detectados em ambos os conjuntos de dados foram consistentes nas a mudança de metilação estados ao longo dos dois conjuntos de dados. Por exemplo, 3778 e 3966 genes DM foram identificados separadamente nos dois conjuntos de dados (K78 e K100, respectivamente) para carcinoma de células claras renal rim (cancro do rim), com uma sobreposição de 3443 genes. Surpreendentemente, todos os 3443 genes mostrou a mesma alteração de estados de metilação entre os dois conjuntos de dados, significativamente mais do que o esperado por acaso (modelo de Bernoulli

P Art 2,2 × 10

-16)

.

Uma grande fração de genes DM detectados em um conjunto de dados não estavam determinados a ser significativas em outro conjunto de dados para cada câncer, como refletido pelos POG

21 pontuação apresentados na Tabela 3. no entanto, nossa análise mostrou que a maioria dos genes de DM que eram unicamente detectados em um conjunto de dados também mostraram a mesma alteração de estados de metilação num outro conjunto de dados para o mesmo cancro, revelando que os sinais biológicos eficazes destes genes DM também existia no outro conjunto de dados. Por exemplo, para o cancro do rim, 514 (98,2%) dos 523 genes detectados para ser significativo apenas no conjunto de dados maior (K100) mostrou a mesma alteração de estados de metilação no conjunto de dados mais pequena (K78), que era altamente improvável de acontecer por Chance (Bernoulli

P Art 2,2 × 10

-16). Assim, as relativamente baixas POG

21 contagens pode refletir um poder estatístico reduzida para detectar genes DM no conjunto de dados menor, juntamente com um controle rigoroso FDR [10], [23].

Analisamos também um conjunto de dados independente para o câncer de cólon disponível a partir do banco de dados GEO [17]. Com FDR 0,05, 2601 e 4001 foram identificados genes DM no conjunto de dados C22 (de TCGA) e o conjunto de dados C44 (de GEO), respectivamente. Estas duas listas de genes DM compartilhada 2421 genes, entre os quais 2.419 (99,9%) apresentavam a mesma alteração de estados de metilação em todo os dois conjuntos de dados (modelo de Bernoulli

P Art 2,2 × 10

-16). Entre os outros 1582 genes que foram significativas na maior conjunto de dados de C44, mas não no menor conjunto de dados C22, 1,502 (94,9%) apresentaram a mesma alteração de estados de metilação no conjunto de dados menores, significativamente mais do que o esperado por acaso (modelo de Bernoulli

P Art 2,2 × 10

-16). A alta consistência da mudança de estados de metilação para genes DM em diferentes conjuntos de dados para o mesmo câncer indicaram que os genes em cancro DM poderia ser reprodutivelmente detectada em dados de metilação de alto rendimento.

A reprodutibilidade da detecção do gene DE

os dados TCGA também são problemáticos para a expressão de dados, porque só uma amostra normal foram medidos em expressão para cada cancro, o que torna a comparação entre amostras normais e tumorais não confiável. Portanto, foram selecionados os dados de tipo de câncer combinados de expressão a partir do banco de dados GEO [17]. Durante nove cancros analisados ​​acima, fomos capazes de encontrar conjuntos de dados de expressão de dois genes para três tipos de câncer (ver Tabela 2). Para cada um destes três tipos de cancro, utilizando o SAM [21] com FDR 0,01, seleccionámos duas listas de (des) genes diferencialmente expressos a partir dos dois conjuntos de dados e descobriu que a maioria dos genes de in a lista mais curta foram incluídos na lista mais , tal como reflectido pelas POG

12 pontuações apresentadas na Tabela 4. Além disso, mais de 94,5% dos genes dE detectados em ambos os conjuntos de dados para cada cancro eram consistentes na direcção regulação (para cima ou para baixo) entre os dois conjuntos de dados , que era altamente improvável que isso aconteça por acaso (Tabela 4, o modelo de Bernoulli

P Art 2,2 × 10

-16). Além disso, a maioria dos genes DE unicamente detectados em um conjunto de dados mostrou as mesmas instruções de regulação num outro conjunto de dados para o mesmo cancro, revelando que os sinais biológicos eficazes destes genes DE existia no conjunto de dados mais tarde. Por exemplo, para o câncer de cólon, 6056 (94,5%) dos 6420 genes detectados a ser significativo apenas no conjunto de dados maior (c64) mostrou a mesma direção regulação no conjunto de dados menor (C23), que é altamente improvável que isso aconteça por acaso ( modelo de Bernoulli

P Art 2,2 × 10

-16)

as análises anteriores foram baseadas em dados normalizados pelo algoritmo de RMA, que assume que a maioria dos genes. não são expressos diferencialmente em uma doença [24]. Realizamos as mesmas análises usando o conjunto de menos-variant (LVS) algoritmo [25], que se baseia menos em este pressuposto, e os resultados foram semelhantes.

A concordância entre metilação diferencial e expressão diferencial

os resultados acima indicam que a metilação e expressão mudanças poderiam ser reprodutível detectado através de diferentes conjuntos de dados para um tipo específico de câncer. Notavelmente, embora a expressão de dados de diferentes fontes de microarray, em vez de os dados TCGA si, a consistência da mudança altamente expressão através de dois conjuntos de dados a partir do mesmo cancro indicado as instruções regulação de genes foram reprodutível e de confiança para o tipo específico de cancro. Portanto, com base nos genes de DM reprodutíveis e DE do mesmo tipo de cancro, foi examinada a influência do gene de metilação do promotor na expressão do gene. Resumidamente, se um gene hipermetilado (ou hypomethylated) encontrados por dados de metilação foi significativamente regulada para baixo (ou sobre-regulada) nos dados de expressão, considerou-se que a sua metilação do DNA foi concordante com a sua mudança de expressão. A taxa de concordância foi medida pela percentagem de genes hypermethylated (ou hypomethylated) concordantes com gene down-regulação (ou sobre-regulação).

Foi avaliada a concordância entre metilação diferencial e de expressão em dois níveis. Em primeiro lugar, foi avaliada a concordância entre metilação diferencial e expressão diferencial de genes. Como mostrado na Tabela 5, 91,6%, 86,6% e 88,2% dos genes hipermetilado foram regulados negativamente nos cancros do cólon, dos rins e dos pulmões, respectivamente, indicando que a hipermetilação é significativamente correlacionada com a infra-regulação de genes (teste hipergeométrico

P Art 1,0 × 10

-5 para todos os três tipos de câncer). Por exemplo, no cancro do cólon, 98 dos 107 genes hypermethylated foram regulados negativamente em amostras de câncer em comparação com controles normais (teste hypergeometric

P

= 7,8 × 10

-9). Então, nós nos concentramos na concordância entre a metilação com grande alteração do nível de metilação e de expressão com a mudança vezes grande (FC) entre tumor e amostras normais. Quando focado na DM genes com, pelo menos, 0,15 Δβ (diferença dos níveis médios de metilação entre o tumor e amostras normais), as taxas de concordância aumentou para 96,1%, 96,2% e 91,3% para cancros do cólon, pulmão e rim, respectivamente. Da mesma forma, quando nos concentramos em genes DE reprodutíveis com pelo menos uma mudança de 2 vezes (FC), os índices de concordância para os três tipos de câncer foram todos acima de 90%. No entanto, a relação entre a hipometilação de genes e a sobre-regulação da expressão do gene é um pouco evasivo. As taxas de concordância foram 50,3%, 39,4% e 62,5% para os cancros do cólon, rim e pulmão, respectivamente. Para o câncer de pulmão única, a hipometilação mostrou uma correlação inversa significativa com gene-regulação (teste hypergeometric

P

= 4,2 × 10

-6). Quando nós nos concentramos em genes DM com pelo menos 0,15 ou 0,3 Δβ, a hipometilação foi significativamente correlacionada com o aumento da regulação da expressão do gene apenas no câncer de pulmão. Quando examinamos os genes de With, pelo menos, uma mudança de 2 vezes, os índices de concordância aumentou para 58,5% e 61,7% para o cólon e rins cancros, respectivamente, e tornou-se significativa (teste hypergeometric

P

= 2,7 × 10

-7 e 5,4 × 10

-4, respectivamente). Notavelmente, os índices de concordância foram de aproximadamente 60%, mesmo após o corte FC para os três tipos de câncer. Estes resultados sugerem que hipometilação pode afetar parcialmente up-regulação da expressão gênica com grandes mudanças dobra

Funções de genes hypermethylated e genes hypomethylated

Usando o software Elim com FDR. 0,05 [22 ], nós detectamos termos GO significativamente enriquecida com genes hypermethylated reproducibly identificados nos dois conjuntos de dados para cada câncer. Para o câncer de cólon, encontramos 58 termos significativos, que foram associados com processos biológicos básicos, tais como a transcrição, adesão celular e sinalização (S1 Tabela suplementar para termos detalhados). Para o câncer de rim, encontramos 14 termos significativos, entre os quais 11 foram incluídos nos termos significativos para o cancro do cólon, o que sugere que os genes hypermethylated nestes dois tipos de câncer tendem a ser envolvido em funções similares. No entanto, nenhum termo GO significativa foi encontrada para o câncer pulmonar com FDR 0,05. Ao comparar os 10 melhores termos com o menor

valores P

para os três tipos de câncer, descobrimos que 4 termos foram compartilhados por cólon e rins cancros, e nem câncer compartilhado um termo com câncer de pulmão. Estes resultados indicaram que o padrão de hipermetilação de câncer de pulmão podem ser diferentes dos de cólon e rins cancros

Com FDR. 0,05, encontramos 14, 29 e 2 GO termos enriquecida com genes hypomethylated para cólon, rim e cancros do pulmão, respectivamente (Tabela suplementar S2). A maioria desses termos significativos foram relacionados à resposta imune. Uma comparação das listas dos 10 melhores termos com o menor

valores P

para os três tipos de câncer mostraram que eles compartilhavam três termos: ‘queratinização “,” resposta de defesa a bactéria “, e” a resposta de defesa celular’. Nós ainda analisada a função dos genes hypomethylated de carcinoma de células escamosas do pulmão e os dados de estômago adenocarcinoma. Estes genes também foram enriquecidos em ‘queratinização “e” resposta de defesa a bactéria’ (Supplemental S3 Tabela). Especificamente, in’keratinization ‘, descobrimos que 12 genes que codificam KAP queratina proteínas associadas (Tabela 6) foram hypomethylated em todos os cinco tipos de cânceres. Notavelmente, estes 12 genes KAP também foram incluídos nos 16 genes KAP encontrados para mostrar hipometilação diferencial pronunciado no cancro da bexiga [26]. Estas evidências sugerem que os genes juntos KAP poderia ser usado como biomarcadores para vários cancros. Finalmente, uma comparação de dois dos três tipos de câncer revelaram que os genes DM detectados apenas em um tipo específico de câncer eram mais propensos a ser hipermetilado do que os genes DM detectados em dois cânceres (teste do qui-quadrado

P Art 0,001 para a comparação das proporções de genes hipermetilado). Por exemplo, 635 (43,5%) dos genes de 1411 DM detectados no cancro do cólon, mas não no cancro do pulmão foram hipermetilado, enquanto apenas 42 (16,5%) dos 254 genes DM detectados em ambos os cancros foram hipermetilado. Por outro lado, 168 dos 189 genes DM compartilhados pelos três tipos de câncer foram hypomethylated e enriquecido em ‘queratinização’, ‘quimiotaxia’, e as funções de ‘resposta imune (veja

Discussão

).

Discussão

A detecção de metilação do DNA aberrante em câncer pode render importantes biomarcadores para prever os resultados do câncer e alvos de drogas. No entanto, armadilhas em modelos experimentais e dados defeituosos análises, como a integração indevidamente lotes de dados TCGA, podem produzir biomarcadores confiáveis ​​[9]. Notavelmente, a maioria dos estudos utilizando os dados TCGA, incluindo muitos publicados em revistas de alto nível [16], [27], [28], [29], não considerou os efeitos de lote potenciais, o que seria susceptível de produzir resultados enganosos associados com os lotes em vez de os resultados biológicos. Por exemplo, Houtan et ai. [27] As amostras de tumor de glioblastoma integrados a partir de vários lotes e identificado um subconjunto distinto das amostras que exibem hipermetilação concertada, o que pode ter sido correlacionada com as suas lotes experimentais de forma semelhante para os dados mostrados no mapa do agrupamento na Fig. 1d. Portanto, sugerimos que as conclusões com base em amostras integradas deve ser reavaliado, considerando os efeitos potenciais de lote. Nossos resultados sugerem fortemente que, um experimento devem ser projetados para evitar o efeito de lote, distribuindo igualmente possíveis substitutos experimentais entre grupos biológicos e utilizando amostras suficientes para cada grupo [9].

Nossos resultados mostraram que os genes DM detectada a partir de diferentes conjuntos de dados para o mesmo cancro, excluindo os efeitos de lote, foram consistentes na metilação entre os conjuntos de dados, semelhante à observação de que os genes dE detectado a partir de vários estudos de microarranjos mostram uma consistente para cima ou para baixo padrão de expressão de [10], [30], [31] . Assim, os sinais dos estados de metilação dos genes DM no cancro pode ser detectado de forma confiável em matrizes de metilação. Notavelmente, 36 dos 47 genes hipermetilação do cancro do cólon documentados na base de dados Methycancer [32] foram encontrados para ser genes DM em nossos dados de câncer de cólon, entre os quais 34 também foram hypermethylated (Recurso S4 tabela). Os biomarcadores de metilação reprodutíveis em diferentes coortes de pacientes poderia fornecer informações valiosas para encontrar biomarcadores prognósticos e alvos de drogas para câncer.

Por outro lado, verificou-se que, para um cancro particular, muitos genes DM detectada em um conjunto de dados pode não ser significativo em outro conjunto de dados devido à alimentação insuficiente de detectar genes DM em pequenas amostras, juntamente com o controle rigoroso FDR [10], [30], [33]. A redução da potência poderia levar à selecção dos genes mais importantes como biomarcadores para um cancro a ser altamente instável em todos os estudos diferentes [34]. Para avaliar a reprodutibilidade dos genes DM mais significativas descobertas de diferentes estudos para um cancro particular, poderíamos ter em conta a relação funcional ao invés de simplesmente contar as sobreposições [11], [35].

Para a função de genes DM, os nossos resultados mostraram hipermetilação dos promotores de genes foi significativamente relacionada com a infra-regulação da expressão de genes em cancro e afecta os processos biológicos fundamentais, como o crescimento de sinalização e de células, semelhante ao que foi observado para o envelhecimento humano [36]. Em contraste, a hipometilação foi apenas fracamente correlacionadas com a sobre-regulação do gene, indicando que outros factores tais como a hipermetilação do gene corpo [37] e copiar amplificação [38] pode contribuir mais para o aumento da regulação da expressão do gene. Descobrimos que genes hypomethylated para diferentes tipos de câncer foram semelhantes em funções directamente ligadas à inflamação crônica, como “quimiotaxia” e “resposta imune”. As quimiocinas desempenham um papel importante na regulação da inflamação progresso [39], e deficiência imunitária pode resultar em inflamação crónica [39]. Esta inflamação crónica pode induzir hipometilação global, o que pode causar instabilidade no cromossoma e aumentam as mutações do genoma e, em seguida, aumentam o risco de cancro [40].

Além disso, os nossos resultados mostraram que os genes DM detectada num tipo específico de câncer eram mais propensos a ser hipermetilado de genes DM detectados em vários tipos de câncer. No entanto, a definição de biomarcadores específicos do tipo de câncer é difícil porque diferentes estudos para um tipo específico de câncer freqüentemente descobrem genes diferentes DM. Utilizando os genes específicos de tecidos recolhidos por Xiong et ai. [41], verificou-se que os genes expressos preferencialmente em tecidos específicos foram enriquecidos com genes diferencialmente metilados no tipo de cancro correspondente (teste hipergeométrico

P

0,001 para todos os três tipos de cancro), mas estes genes não DM mostrar qualquer preferência em direção hipermetilação ou hipometilação. Considerando-se que a exactidão de genes específicos de tecido “” depende fortemente do nível do respectivo transcrito [42] expressão, ele pode ser mais fiável para definir os genes “específicos de tecido” pelos seus padrões de metilação [43]. Em trabalhos futuros, pretendemos estudar genes DM de tipo específico de cancro, tendo em conta as indicações de metilação opostos de genes DM detectados por diferentes tipos de câncer.

Informações de Apoio

Tabela S1.

GO termos significativamente enriquecida com genes hipermetilação separadamente para Colon, rim e pulmão

doi:. 10.1371 /journal.pone.0029686.s001

(XLS)

Tabela S2.

GO termos significativamente enriquecida com genes hipometilação separadamente para Colon, rim e pulmão

doi:. 10.1371 /journal.pone.0029686.s002

(XLS)

Tabela S3.

GO termos significativamente enriquecida com genes hipometilação separadamente para carcinoma de células escamosas do pulmão e adenocarcinoma de estômago

doi:. 10.1371 /journal.pone.0029686.s003

(XLS)

Tabela S4.

metilação e expressão alterações de genes no banco de dados MethyCancer

doi: 10.1371. /journal.pone.0029686.s004

(XLS)

Reconhecimentos

Agradecemos Jinfeng Zou e Guini Hong para disscussions votos, eo consórcio TCGA por fornecer os conjuntos de dados.

Deixe uma resposta