PLOS ONE: Corrupção da Intra-Gene DNA metilação Architecture é uma característica marcante do Câncer

Abstract

processos epigenéticos – incluindo a metilação do DNA – são cada vez mais vistos como tendo um papel fundamental nas doenças crônicas como o câncer. É sabido que os níveis de metilação em determinados genes ou loci diferem entre o tecido normal e doente. Aqui nós investigamos se a arquitectura metilação intra-gene é corrompida no cancro e se a variabilidade de níveis de metilação de CpG individuais dentro de um gene definido é capaz de discriminar canceroso de tecido normal, e está associada com o fenótipo tumoral heterogéneo, tal como definido pelo gene expressão. Analisamos 270985 CpGs anotados para 18272 genes, em 3284 canceroso e 681 amostras normais, correspondendo a 14 tipos diferentes de câncer. Ao fazê-lo, encontramos novas diferenças no padrão de metilação intra-gene em todo fenótipos, em particular nos genes que são cruciais para a biologia de células-tronco; nossas medidas de arquitetura metilação intra-gene são uma melhor determinante do fenótipo do que as medidas com base no nível de metilação média sozinho (teste K-S em todas as 14 doenças testadas). Estas medidas por-gene de metilação também representam uma redução considerável em termos de complexidade, em comparação com convencional per-CpG-beta valores. Nossos resultados apoiar firmemente a opinião de que a arquitetura metilação intra-gene tem um grande potencial clínico para o desenvolvimento de biomarcadores de câncer baseados em DNA

Citation:. Bartlett TE, Zaikin A, Olhede SC, West J, Teschendorff AE, Widschwendter M (2013) Corrupção da intra-Gene DNA metilação Architecture é uma marca do Câncer. PLoS ONE 8 (7): e68285. doi: 10.1371 /journal.pone.0068285

editor: Zoran Culig, Innsbruck Medical University, Áustria

Recebido: 11 de abril de 2013; Aceito: 26 de maio de 2013; Publicação: 16 de julho de 2013

Direitos de autor: © 2013 Bartlett et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este trabalho foi financiado pela Engenharia e Ciências físicas Research Council (complexo /ESPRC), a Comissão Europeia (FP7, EpiFemCare, número do projeto 305.428) e uma subvenção do Comprehensive Centro de Investigação UCLH /UCL Biomédica (projeto nº 152). As análises epigenéticas foram efetuadas pelas UCLH /UCL, que recebeu uma proporção do seu financiamento do Departamento de Centros de Pesquisa Biomédica NIHR Saúde (BRC) regime de financiamento. AZ reconhece o apoio financeiro do projeto PROMESSA-2016 CR-UK. AET é apoiado por uma Heller Research Fellowship. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

informação epigenética é armazenado no genoma na forma de modificações hereditárias para a estrutura química do ADN, tais como a metilação de bases de particulares, bem como uma variedade de modificações químicas das proteínas histona qual pacote do ADN. informação epigenética pode ser modulada durante a vida de um organismo por estímulos ambientais [1] – [3]. e essas mudanças persistem em mitoses posteriores, levando a uma mudança adquiriu do fenótipo

metilação do DNA é uma marca epigenética consistindo quase inteiramente da metilação dos dinucleótidos CpG [4], e é possível que um, ambos ou nenhum alelos no locus genómico particular a ser metilado [5]. A hipermetilação de CpG no promotor do gene (a região perto do local de início da transcrição, TSS) são indiscutivelmente associado ao silenciamento do gene correspondente, e este efeito é particularmente importante no cancro, em que o silenciamento do gene aberrante está associada a alterações funcionais importantes em todos fase de progressão tumoral [6].

verificou-se anteriormente que a variabilidade de metilação em locais genómicos específicos é importante no desenvolvimento do cancro [7]. Tem-se observado, em particular, que haja um aumento na estocástica variabilidade metilação em regiões que já são conhecidos por terem níveis de metilação em cancros alterada, levando a expressão génica aberrante e variando, e fornecendo um mecanismo epigenético para heterogeneidade tumoral [8]. Também tem sido demonstrado recentemente que as estatísticas baseadas na variabilidade diferencial de metilação pode conduzir a uma melhor detecção de marcadores de risco em tumores pré-cancerosos [9], [10].

proteínas grupo Polycomb (PCG) desempenham um fundamentais papel em processos de desenvolvimento, manutenção de uma classe de genes conhecidos como alvos grupo Polycomb (PCGTs) num estado reprimido em ES (estaminais embrionárias) células, para manter pluripotência, e ‘pronta para activação’ durante a diferenciação [11]. A ligação entre PCGTs e câncer tem sido discutida por muitos autores [12] – [14]; Recentemente, foi demonstrado que a hipermetilação do ADN em cancros preferencialmente alvos PCGTs que são reguladores de desenvolvimento [15], aqueles autores hipotetizando que este pode contribuir para as características de haste semelhante a de cancro; com mais apoio a essas idéias que se verifique que os tumores que são particularmente pouco diferenciados tendem a apresentar padrões de expressão que são semelhantes às células-tronco embrionárias, incluindo a repressão de PCGTs [16].

proteínas grupo Polycomb manter o estado reprimido de genes através da cromatina (o empacotamento do ADN); ADN no seu estado compacto é envolvida em torno de proteínas histona (um componente principal da cromatina), e PRC2 (Polycomb complexo repressor 2) é responsável pela trimethylation de lisina 27 de histona 3 (levando à marca epigenética H3K27me3), que está associada com neste estado compacto [17]. Genes ocupados por PRC2 em células ES principalmente carregam marcas de cromatina bivalentes [15]; bivalência inclui a modificação da histona H3K4me3 (trimethylation de lisina na histona 4 3), uma marca que está associada com a activação do gene correspondente, para além da marca H3K27me3 repressivo. Pensa-se que é esse estado bivalente que mantém stemness, mantendo o gene reprimido, mas pronto para a activação na diferenciação. Tal como a metilação do DNA também está associada com a repressão e a activação de genes, é de interesse se os padrões de metilação de genes que transportam as marcações de cromatina H3K27me3 e /ou H3K4me3 em células estaminais sejam alterados de cancro, como tal alteração aberrante de regulação de genes por meio de DNA metilação pode ser associado com um retorno de ou acentuação das características de células estaminais semelhante.

o papel das alterações epigenética precoces na transformação oncogénica, incluindo perturbações do epigenotype saudável de células progenitoras, a criação de um ambiente epigeneticamente admissível em que as aberrações genéticas podem ter efeitos tumorigénicas, e plasticidade fenotípica que conduz à adaptação do tumor e associado com a heterogeneidade intra-tumoral, foi originalmente proposto por Feinberg e colegas [1]. hipótese-se que uma maneira em que a desregulação estocástica de genes de células-tronco e a heterogeneidade fenotipica associado pode manifestar, é em termos de célula para célula variabilidade de metilação; isto por sua vez se espera que se correlacionam com uma variabilidade intra-gene de metilação, tal como medido, utilizando misturas de agregados de células heterogéneas em um experimento de microarray.

intra-variabilidade gene de metilação é considerada uma interrupção do normal de metilação perfil ou arquitetura, de um gene particular, e tal mudança pode ser uma forma mais geral ligada à criação de um ambiente epigenetically admissível para a transformação oncogénica, e tumorigénese. Tais modificações seriam esperados para acompanhar as fases iniciais ou mesmo preceder o aparecimento da doença, e identificando, portanto, indicadores de confiança de tais alterações podem proporcionar uma vantagem valiosa para o desenvolvimento de biomarcadores de cancro à base de ADN em fluidos corporais, especialmente no que tem sido mostrado recentemente que os biomarcadores de metilação do DNA relacionados para conter genes celulares estão associados com o resultado clínico em cancros das mulheres [18].

estudos anteriores [7], [9], [10] centraram-se sobre os efeitos da amostra para variabilidade amostra de metilação; aqui, pela primeira vez, analisamos a associação do fenótipo com a variabilidade intra-gene de metilação. Fazendo uso de dados obtidos a partir da plataforma Illumina Infinium HumanMethylation450, que interroga CpGs em todo o genoma, incluindo com anotações de genes conhecidos (correspondente a, em média, 17 CpGs por gene), investigamos medidas de arquitectura metilação intra-gene, e sua capacidade de diferenciar entre os fenótipos saudáveis ​​e doentes. Para isso, desenvolvemos novas medidas, e adaptado padrão uns

Resultados

Para investigar arquitetura metilação intra-gene, são consideradas quatro medidas de genes-centric, como segue:.

o desvio médio de o perfil da amostra de metilação do perfil de metilação significativo de amostras de controlo fenótipo saudáveis, para cada gene. Este perfil de metilação significativo pode flutuar muito dentro de cada gene, e por isso não é o mesmo que o nível de metilação significativo de um gene. Porque este desvio médio é normalizado em cada sonda dividindo pelo desvio padrão sonda através das amostras de controlo fenótipo saudáveis, ele é chamado de “dizer-Score ‘medida; Isto é ilustrado na Figura 1 (a). Um exemplo de um dos genes que se verificou serem mais importante de acordo com esta medida é mostrado na Figura 1 (b) e (c).

O derivado de média das medidas de metilação para cada gene. O derivado do perfil de metilação para um dado gene e a amostra é aproximada por as diferenças entre os valores medidos de metilação no mapeamento sondas consecutivo para esse gene. A média dos valores absolutos dessas diferenças é então calculada como a “significa derivado de ‘medida; esta é a mesma que a soma total de todos os aumentos e diminuições em níveis de metilação de uma sonda para a próxima do outro lado do gene; Isto é ilustrado na Figura 1 (d). Esta é uma auto-calibração de medida da pressão intra-gene variabilidade metilação, porque ele é calculado para uma determinada amostra das diferenças dentro desse exemplo, e sem referência a qualquer outra amostra.

A média das medidas de metilação para uma região genómica particular, para cada gene; Isto é ilustrado na Figura 1 (e). níveis de metilação médios típicos variam muito de uma região genômica para outro; daí o nível de metilação significativo para uma região genómica particular, foi usado como o ‘significa medida metilação’ para um gene, e da mesma região foi utilizada para cada gene.

A variância para cada gene das medições de metilação para uma particular a região genômica; Isto é ilustrado na Figura 1 (f). Porque variância é calculado em relação à média, esta medida foi calculado de forma semelhante para cada gene usando apenas o mapeamento de sondas a uma região genómica particular, de novo usando a mesma região genómica para cada gene. Isso é chamado a medida ‘metilação variância’; é outra medida de auto-calibração.

(a) A medida-Score média é calculada para a amostra de tumor (mostrada em vermelho) para o gene (a que investiga mapa), a partir da média, e desvio padrão, as amostras de controlo saudáveis ​​em cada sonda (b) os perfis de metilação de 586 cancro (vermelho) e 98 (azul) amostras saudáveis ​​através de um gene encontrado tão significativa de acordo com a medida-Score média, com sondas espaçadas (desigualmente ) de acordo com o seu locus genómico. regiões genómicas são indicados sob o gene com o código da cor apresentada na parte inferior da figura. (C) Um mapa de calor que ilustra o mesmo gene, com sondas uniformemente espaçados; Os valores para cada amostra e cada sonda são indicados pelo código de cor apresentada na parte superior da figura. As amostras são representados graficamente na ordem de média-Score, de tal modo que a amostra de tumor com a menor média-Score e a amostra saudável com a menor média-Score são adjacentes. regiões genómicas são indicados sob o gene com o código da cor apresentada na parte inferior da figura. N.B., este gene tem dois sítios de início da transcrição (TSSs) em diferentes locais. (D) O derivado de medida média é calculada, por exemplo, como a média das diferenças absolutas nos valores correspondentes entre sondas consecutivos, através do conjunto de genes. (E) A medida média metilação é calculada, por exemplo, como a média dos valores correspondentes das sondas anotados para uma região genómica particular de. (F) A medida da variância metilação é calculada, por exemplo, como a variância dos valores correspondentes das sondas anotados para uma região genómica particular de. NB, (d) – (f) são calculados sem referência a amostras saudáveis, enquanto que (a) é calculado com referência às amostras saudáveis ​​

Estas quatro medidas cada procurará analisar uma característica diferente de intra. Arquitectura metilação -Gene, e todos são capazes de classificar as amostras de um-por-um, isto é, eles são medidas intra-gene ou intra-amostra, em vez de amostra para amostra de medidas como foi anteriormente investigado no contexto da variabilidade metilação.

como a média-Score é calculado como uma medida de diferença significativo metilação do perfil de metilação saudável, estritamente falando, é uma medida da instabilidade metilação. As medidas médias de variância de derivativos e de metilação são as duas medidas de intra-gene variabilidade metilação; no entanto, o derivado média é calculada com referência à ordenação das sondas (ou seja, esta medida iria retornar um número diferente se o fim das sondas foi randomizado), enquanto que a variação de metilação não o faria; o derivado média adicionalmente considera todas mapeamento sondas para o gene, enquanto a medida da variância metilação considera apenas o mapeamento de sondas a uma região genômica específica. A medida média metilação é único aqui na medida em que não mede diferença no nível de metilação e, em vez mede o nível de metilação absoluta; ele é incluído aqui principalmente para comparação.

As propriedades destas quatro medidas foram inicialmente investigados no contexto de catorze Illumina Infinium metilação Humano 450 conjuntos de dados, que foram baixados da Cancer Genome Atlas (TCGA) [19] . Nós aplicamos estes quatro medidas em relação aos catorze conjuntos de dados TCGA; Ao todo, foram analisados ​​450 de dados K ​​DNAM de 3284 tumor e 681 amostras saudáveis; pormenores sobre o número de amostras de cada fenótipo e em cada conjunto de dados são mostrados na Tabela 1 (dados para definir as abreviaturas, ver “Métodos e Modelos ‘). Também foi realizada uma meta-análise desses dados, que é a nosso conhecimento o maior meta-análise realizada em qualquer estudo de metilação do DNA.

Comparação das medidas de metilação Intra-gene

como uma avaliação preliminar dos méritos relativos dessas quatro medidas, olhamos para a sua capacidade de distinguir entre tumores e tecidos saudáveis. A correlação do fenótipo amostra de tecido para as quatro medidas de metilação foi considerada em termos de distribuição de AUC por-gene (área sob a curva, o que é uma medida da precisão da previsão, ver ” métodos e modelos para detalhes). Essas distribuições são mostradas na caixa-parcelas na Figura 2. Para cada conjunto de dados, a medida-Score média é significativamente melhor em discriminar tumor do tecido saudável usando esses dados de metilação, que a medida derivada dizer, a medida da variância metilação, ea média medida metilação (comparação visual da Figura 2 foi confirmado por testes de Kolmogorov-Smirnov, dados não mostrados); isto é porque a medida-Score significativo é definido em relação ao perfil de metilação média saudável. Excluindo a medida-Score significativo, a medida metilação média é significativamente melhor em discriminar tumor do tecido saudável do que as restantes duas medidas em cada dez dos conjuntos de dados restantes, com o derivado significativo discriminação significativamente melhor em dois conjuntos de dados (leitura e THCA), e resultados inconclusivos para os conjuntos de dados restantes (KIRC e PAAD, que tem resultados instáveis ​​devido ao pequeno tamanho da amostra). Figura mostra S3, em gráficos de dispersão, comparações de pares de cada uma das quatro medidas de metilação de um gene que estava entre os top 1000 genes com maior AUC de acordo com cada uma dessas medidas.

Cada caixa apresenta os valores de as AUC para os 1000 genes mais importantes para um tipo de tumor particular e medida metilação intra-gene. A média-Score prevê fenótipo melhor do que as outras três medidas em todos os tipos de tumores 14. Tipo de tumor abreviaturas são as seguintes: urotelial de bexiga Carcinoma (BLCA), mama invasivo Carcinoma (BRCA), Colon Adenocarcinoma (COAD), cabeça e pescoço carcinoma espinocelular (HNSC), Rim Renal Limpar Cell Carcinoma (KIRC), rim renal papilar celular carcinoma (Kirp), fígado (LIHC), Lung Adenocarcinoma (LUAD), Lung carcinoma de células escamosas (LUSC), pâncreas Adenocarcinoma (PAAD), próstata Adenocarcinoma (PRAD), reto Adenocarcinoma (LER), tiróide carcinoma (THCA) e uterina Corpus endometrioid Carcinoma (UCEC).

para comparar diretamente a eficácia da medida-Score média em predizer o fenótipo (câncer /saudável) independente do nível de metilação média, um modelo de regressão logística foi ajustada a cada gene usando média metilação-Score e média como co-variáveis, levando a -Valores para cada gene para cada uma média de metilação-Score e médio. Em cada conjunto de dados, excepto dois, para a grande maioria (80-100%) desses genes com, pelo menos, um dos dois co-variáveis ​​significativas, a média-Score covariável -valor foi mais significativa do que o correspondente significativo metilação -valor covariável. Nos restantes dois conjuntos de dados, a média-Score -valor covariável foi mais significativa para a maioria (50-80%) de genes com pelo menos um co-variáveis ​​significativas (resultados detalhados não mostrado). Assim, a média-Score é um melhor indicador de fenótipo do que a metilação média, mesmo após o ajuste para o nível de metilação média.

Meta-análise e definir Gene-Análise de Enriquecimento

Uma meta-análise dos catorze conjuntos de dados foi realizada. Os genes foram distribuídos de acordo com a sua significação AUC média (com base na medida significativo-Score) em todos os conjuntos de dados por um método de permuta (ver ” métodos e modelos para detalhes); este identificados mais de 4000 genes importantes que foram associados com uma diferença consistente entre câncer e fenótipos saudáveis ​​em todos os tipos de tecido (FDR). Estes genes mostram consistentemente as maiores diferenças entre os fenótipos saudáveis ​​e cancerosas (como a medida-Score significativo é definido relativamente a amostras de controlo saudáveis), e como a média-Score é uma medida da instabilidade metilação, que são denominados a meta-análise mais instável genes. Os -scores médios de tumor individual e amostras saudáveis ​​para o 50 mais significativo destes genes de meta-análise mais instáveis ​​são apresentados na Figura 3, e detalhes sobre o 100 mais significativo destes genes são mostrados na Tabela S1. Em particular, a Figura 3 mostra a extensão em que a instabilidade é consistente (alta dizer-Score, vermelho) em pacientes com câncer, em comparação com pacientes saudáveis ​​(baixa média-Score, azul). Genes com uma AUC perto média de 0,5 na maioria dos tipos de tumor também foram encontrados; estes são genes que tendem a ter as menores diferenças entre fenótipos saudáveis ​​e cancerosas em todos os tipos de tecido e, portanto, são marcadas genes meta-análise como menos instáveis. Mais de 2800 genes de meta-análise menos instáveis ​​foram consideradas significativas por este método permutação (FDR) e a 100 mais significativo destes são apresentados na Tabela S2. Há, porém, uma menor coerência entre os genes menos meta-análise instável em todos os tipos de tumor, por exemplo, o gene significativa colocados 100 menos instável meta-análise tem uma AUC de menos de 0,6 para apenas 10 dos 14 tipos de tumores.

Média -scores de tumor (T) e as amostras saudáveis ​​(H) são exibidas em um mapa de calor de acordo com o código de cor para os 50 genes meta-análise (top 50 genes mais consistentemente instáveis). O mapa de calor mostra a extensão em que a instabilidade é consistente (alta dizer-Score, vermelho) em pacientes com câncer, em comparação com pacientes saudáveis ​​(baixa média-Score, azul). Para cada tipo de tecido amostras saudáveis ​​aparecem à direita de amostras de tumores; onde não há espaço disponível a etiqueta (H) é omitido. Abreviaturas: R (LER), B (BLCA), K (Kirp), P (PAAD)

Para confirmar a importância biológica dos resultados desta meta-análise com referência aos genes que são. bem conhecida por ser importante na biologia do cancro, os genes de meta-análise mais instáveis ​​e menos instáveis ​​foram testados para o enriquecimento por genes que em células ES carregam o repressor /activação da cromatina marca H3K27me3 (genes H3K27 ES), (genes H3K4 ES) H3K4me3 e bivalentes (marcas ou seja, tanto H3K27me3 e H3K4me3, genes Biv ES) e de enriquecimento através PCGTs (alvos do grupo Polycomb célula ES). Os genes meta-análise mais instáveis ​​são altamente enriquecido por genes e PCGTs Biv e H3K27 ES, e os genes de meta-análise menos instáveis ​​são altamente enriquecido por genes H3K4 ES (Tabela 2).

A mais análise de enriquecimento de set-gene geral (GSEA) também foi realizado, testes de enriquecimento dos genes meta-análise mais instáveis ​​e menos instáveis ​​por membros de mais de 6000 conjuntos de genes (ver secção “Métodos e Modelos” para mais detalhes). Os 100 mais significativamente enriquecida desses conjuntos de genes pelos genes meta-análise mais instáveis ​​e menos instáveis ​​aparecem nas tabelas S3 e S4 respectivamente. Em particular Table (conjuntos de genes enriquecidos por genes meta-análise mais instáveis) S3 mostra muitos conjuntos de genes do desenvolvimento e sinalização celular.

Os genes meta-análise mais instáveis ​​estão associados a níveis de metilação geralmente mais altos do que os genes que não são significativa de acordo com o meta-análise (ou seja, genes que não são nem os genes de meta-análise mais instáveis ​​ou menos instáveis), tanto em tumor e amostras saudáveis, para estas regiões genómicas localizados mais perto do promotor em todos os tipos de tecidos, no entanto, a meta mais instável -Análise genes também estão associados com uma ampla variabilidade de níveis de metilação (Figura S4). Os genes menos de meta-análise instável Por outro lado estão associados com consistentemente níveis muito baixos de metilação em amostras tanto de tumores e saudáveis ​​para estas regiões genómicas, e particularmente para TSS200, 5’UTR e 1stExon, sugerindo que a baixa instabilidade metilação desses genes está associada com uma falta de metilação nas regiões genómicas mais funcionalmente importantes em ambos os tecidos doentes e normais e, por conseguinte, que a regulação destes genes é por outros que não os que a metilação do DNA, em particular, a disponibilidade de factores de transcrição mecanismos.

correlação de gene Expression com tumor intra-gene de metilação Arquitectura

de forma a investigar o efeito da metilação arquitectura intra-gene na expressão do gene, foram consideradas as amostras de tumor BRCA 217 com dados de expressão e de metilação do gene combinado disponíveis a partir TCGA em mais detalhes. Para cada gene foi realizada uma análise de regressão multivariada não-linear (ver “Métodos e Modelos”) da expressão do gene para a arquitetura metilação intra-gene, para estas amostras tumorais correspondentes, tendo a expressão do gene como a resposta, e tendo um dos médio-Score , média variância derivada e metilação como um preditor covariável, juntamente com metilação média como um segundo preditor covariável. As proporções relativas dos genes encontrados como significativa ou não, e de acordo com um importante co-variável ou o outro, ou ambos, são mostradas na Figura 4; em particular, há muitos genes com expressão não significativamente previsto por metilação média, mas consideravelmente prognosticada segundo a média-Score, significa derivado, ou variância metilação.

Expression foi tomada como a variável resposta, com um dos médio-Score, Quer dizer variância derivada e metilação como um preditor covariável, juntamente com metilação média como um segundo preditor covariável. (A) A proporção de genes com pelo menos um co-variável significativa (FDR), e a percentagem de genes com significativa nem covariável. (B) A proporção de genes significativas (isto é, a proporção dos genes representados pela esquerda de cada par de barras em a) que são significativos devido a uma, ou outra, ou ambas as co-variáveis. Para os genes que são significativos devido a apenas um preditor covariável, as proporções desses genes para os quais a significância é devido à correlação positiva ou negativa são indicados nas barras com /e \\ respectivamente. Há muitos genes com expressão não significativamente previstos por metilação média, mas significativamente previstos pela média-Score, significa derivado, ou variância metilação.

Enriquecimento de genes de células-tronco de genes com expressão significativa previstos por apenas um covariável foi novamente testado para confirmar a significância biológica dos resultados com referência aos genes que são bem conhecidos por serem importantes na biologia do cancro. Verificou-se que genes com expressão previsto por apenas o co-variável-Score média foram significativamente enriquecida por genes Biv ES e PCGTs (e, respectivamente, o teste exato de Fisher), resultado que é consistente com os achados aqui que genes Biv ES são enriquecidas entre os genes mais instáveis ​​meta-análise, ou seja, aqueles genes que são mais consistentemente associados com a maior diferença no padrão de metilação entre câncer e fenótipos saudáveis. Constatou-se também que, correspondentemente, genes com expressão previsto por apenas o co-variável metilação média na regressão multivariada com a média-Score covariável foram enriquecidos de forma significativa (teste exato de Fisher) por genes H3K4 ES, um resultado que é consistente com nossas descobertas que os genes H3K4 ES são enriquecidos entre genes meta-análise instáveis ​​menos, ou seja, os genes que têm consistentemente menos diferença no padrão de metilação entre câncer e fenótipos saudáveis. Do mesmo modo, verificou-se que os genes com expressão previsto por apenas o covariável significativo derivado foram significativamente enriquecida por genes e PCGTs Biv ES (e, respectivamente, teste exacto de Fisher) os genes e que, com a expressão previsto apenas pela covariável significativo metilação na mesma regressão multivariada foram significativamente enriquecida por genes H3K4 ES (, teste exato de Fisher).

Estas descobertas estendem para o fenótipo tumor heterogêneo, conforme definido pela expressão do gene, a ideia de que as diferenças nos padrões de metilação em genes de células-tronco são uma marca registrada de câncer , e mostra que este pode ser medido por uma arquitectura metilação intra-gene na forma de variabilidade intra-metilação do gene (de acordo com as medidas médias derivado de metilação e de desvio) e instabilidade (medida de acordo com a média-Score) com mais precisão do que por significativo nível de metilação sozinha.

Association of Genome-wide Média-Score com cancro da mama intrínsecos subtipos

As diferenças na arquitetura metilação intra-gene entre os fenótipos tumorais heterogéneas (conforme definido pela expressão do gene) foi explorada , no contexto do câncer de mama subtipos intrínsecas. As mesmas amostras de 217 BRCA com a expressão do gene correspondente e os dados de metilação disponíveis foram atribuídos exclusivamente a cada um destes subtipos da doença, de acordo com as definições estabelecidas moleculares, usando o classificador PAM50 [20]. Isto foi feito através da correlação do perfil de expressão do gene (de correlação de Spearman) para cada amostra para os perfis de expressão de gene canónicos PAM50 classificador durante 5 subtipos intrínsecos diferentes e, para cada amostra a escolha do subtipo com o maior coeficiente de correlação, levando a 42 amostras classificadas como Basal , 24 como Her2, 81 luminal A, 54 luminal B, e 16 classificados como normal. Para cada uma destas amostras, um genoma de largura dizer-Score também foi calculado, como uma medida do genoma por exemplo de arquitectura metilação intra-gene. As distribuições destes -scores médios do genoma para cada subtipo intrínseca são mostrados na Figura 5; há claras diferenças nas médias e distribuições entre cada um dos subtipos. Um teste de Kruskal-Wallis foi realizado para verificar o significado dessas diferenças, com um resultado muito significativo,. Removendo as amostras classificadas como Luminal B e Normal (como as distribuições de pontuação média-z do genoma têm variações maiores e menores, respectivamente, para esses subtipos que os outros), ainda resultou em um resultado significativo no teste de Kruskal-Wallis, . Esta capacidade de distinguir entre os fenótipos tumorais heterogéneas, no contexto das definições estabelecidas moleculares de subtipos da doença, indica que pode ser possível usar a arquitetura metilação intra-gene no desenvolvimento de novos classificadores moleculares de cancro, ou tornar as estabelecidas mais robusto. Isto é particularmente interessante, uma vez que os níveis de metilação são tipicamente mais estáveis ​​do que os níveis de expressão do gene.

A média em todos os genes das -scores média foi calculada para os 217 amostras com BRCA expressão correspondente e os dados de metilação disponível. Estas amostras foram independentemente classificada pela correlação dos seus perfis de expressão gênica (correlação de Spearman) com as do cancro da mama PAM50 classificador subtipo intrínseca [20]. As distribuições destes -scores médios do genoma, para cada subtipo intrínseca, são mostrados nas boxplots. significado indicado foi calculado utilizando o teste de Kruskal-Wallis.

Discussão

Nós mostramos que a reorganização da arquitetura metilação intra-gene é uma característica fundamental das células cancerosas, e que não muitas maneiras de avaliar essas diferenças, que podem fornecer informações de cortesia. Nós desenvolvemos medidas para detectar algumas destas diferenças, incluindo o primeiro procedimento de variabilidade intra-gene de metilação (por oposição a amostra para amostra variabilidade de metilação). Nós mostramos que a nossa medida-Score média é consistentemente mais eficaz na previsão de câncer em comparação com fenótipo saudável do que significa metilação, mesmo após o ajuste para o nível de metilação média.

Temos realizado o que é, a nosso conhecimento, a maior meta-análise realizada em qualquer estudo de metilação do DNA. Em particular, mais de 4000 genes foram encontrados para ser significativamente associado com uma diferença consistente entre o cancro e fenótipos saudáveis, demonstrando que, como um método para distinguir do cancro a partir de tecido saudável, a medida-Score significativo é robusto às diferenças entre os tipos de tumores. Os 100 genes mais importantes de acordo com esta meta-análise (Tabela S1) pode ser considerado como particularmente característica de um fenótipo do cancro específico de tecido e não generalizada. Estes genes meta-análise menos instáveis ​​também são enriquecidos de forma significativa (Tabela 2) por genes que transportam H3K27 e marcas de cromatina bivalentes em células ES e por PCGTs, consistentes com a ideia de que o fenótipo tumoral está associada com a aquisição de características de células estaminais-like [ ,,,0],15].

Deixe uma resposta