PLOS ONE: Análise do Tumor Matched e Normal Profiles revela transcrição Comum e epigenéticas Sinais compartilhados entre Cancer Types

Abstract

Para identificar as alterações reguladoras da transcrição que são mais difundido em tumores sólidos, foi realizado um pan-câncer análise utilizando mais de 600 pares de tumores e tecidos normais adjacentes perfilados no Cancer Genome Atlas (TCGA). Frequência de regulação positiva foi calculado entre os níveis de expressão de ARNm, os níveis de expressão de microRNA e locais de metilação de CpG e é fornecido aqui como um recurso. alterações associadas a tumores mais freqüentes foram identificados utilizando uma abordagem estatística simples. Muitas das alterações identificadas foram consistentes com a taxa de aumento da divisão celular no cancro, tais como a sobre-expressão de genes do ciclo celular e hipermetilação de locais de ligação PRC2. No entanto, também identificadas alterações independente de proliferação, que destacam novos caminhos essenciais para a formação de tumores. Quase todos os receptores de GABA são frequentemente regulados negativamente, com o gene que codifica a subunidade delta (GABRD) fortemente supra-regulada, como a notável excepção. genes metabólicos são também frequentemente regulados negativamente, em especial álcool desidrogenases e outros consistentes com a função de diminuição da fosforilação oxidativa em células cancerosas. As alterações na composição dos receptores de GABA e metabolismo pode desempenhar um papel fundamental na diferenciação de células cancerosas, independente da proliferação

citação:. AM bruto, Kreisberg JF, Ideker T (2015) Análise de tumor e normal com correspondência perfis revela transcrição comum e epigenéticas Sinais compartilhadas entre os tipos de câncer. PLoS ONE 10 (11): e0142618. doi: 10.1371 /journal.pone.0142618

editor: Jindan Yu, da Universidade Northwestern, Estados Unidos

Recebido: 02 de setembro de 2015; Aceito: 23 de outubro de 2015; Publicação: 10 de novembro de 2015

Direitos de autor: © 2015 Gross et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Dados Disponibilidade: Todos os dados são à disposição do público a partir do portal web Broad Firehose (https://gdac.broadinstitute.org/). Foram utilizados dados dos 2 de abril de 2015 dados padrão são executados nesta análise. Dados adicionais foi feita a partir de um pipeline de processamento alternativo, disponível publicamente na Omnibus Gene Expression na adesão GSE62944

Financiamento:. Este trabalho foi apoiado pelo Instituto Nacional de Ciências Médicas Gerais, Grant # P50 GM085764 para TI e JFK e do Instituto Nacional de Ciências Médicas gerais, Grant # P41 GM103504-04 de TI. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

as células cancerosas são caracterizados por inúmeras alterações no genoma, epigenoma, transcriptoma. Enquanto a maioria das mudanças associadas ao tumor tem pouca função, os principais genes e caminhos são frequentemente implicado por olhando através de pacientes dentro de uma coorte para eventos que são recorrentes [1-3]. Enquanto tais análises são tradicionalmente realizada através de populações de pacientes bem definidos, com tumores de localização anatómica semelhante e aparência histológica, grandes conjuntos de dados produzidos pelos esforços pública como a Cancer Genome Atlas (TCGA) [2, 4] já fez meta-análise de estudos de câncer viável.

Ao olhar através de muitos subtipos diferentes, análises pan-câncer de proporcionar um nível elevado, tecido vista agnóstico de câncer. Muitos desses estudos analisaram mudanças coordenadas em todo fenótipos moleculares e dados clínicos para isolar sinais chave durante tumorigênese. Tais esforços têm descoberto padrões conservados da co-expressão de genes em muitos tipos de tumores [5, 6] identificação de padrões moleculares associados com o crescimento do tumor e proliferação. Em uma abordagem complementar, um artigo recente de Gentles e colaboradores [7] genes identificados cuja expressão foi associada com a sobrevivência em todas as coortes abrangendo muitos tecidos. Estes autores descobriram que a sobre-expressão de genes próximos da rede transcricional FOXM1 e de genes que dirigem a progressão do ciclo celular foram associados com resultados adversos paciente. Estas assinaturas altamente conservadas de proliferação de células de suporte a hipótese de que um fenótipo de cancro do núcleo é activada a vários graus em diversos tipos de tumores.

Até agora, esses estudos pan-cancerosas de mudanças de transcrição têm-se centrado principalmente em amostras de tumor, sem consideração de tecido normal. Em contraste, estudos de mutações, variações estruturais ou alterações no número de cópias de DNA têm frequentemente utilizadas na análise subtrativo dos dados combinados para alcançar o poder na detecção de alterações específicas do tumor. Embora alguns estudos de expressão analisados ​​tumores pareados por pacientes e tecido normal adjacente, esses estudos foram restritos a grupos específicos de tecido [8-13]. Eles foram portanto capazes de identificar genes cuja expressão no tumor se desvia do normal num único tecido, mas não foram capazes de distinguir qual destas mudanças são específicos para uma dada população de estudo ou são características gerais do cancro como um todo. Para este efeito, uma análise pan-câncer do diferencial de transcrição programas-se reguladoras ao nível da expressão de mRNA, expressão miRNA ou-se metilação ainda não foram realizados.

Aqui, realizamos uma análise desse tipo utilizando informação prontamente disponível em The Cancer Genome Atlas (TCGA), o que permitiu procedimentos de coleta de dados padrão e ensaios de caracterização molecular para várias plataformas de medição [4]. Usando dados TCGA, nós compilamos uma lista abrangente de mRNAs associados ao tumor, miRNAs e locais de metilação medindo a freqüência com que seus níveis são elevados entre tumor combinados e amostras normais em todos os tecidos de câncer medidos. As frequências regulação positiva para esses recursos são fornecidos como um recurso geral para a comunidade do câncer. Nós achamos que, além de sobre-expressão quase universal de genes importantes para a proliferação do tumor, existem sinais proeminentes independente de proliferação que pode desempenhar um papel na remodelação do tecido.

Resultados

Para identificar tumor onipresente sinais -associated, fizemos o download de todos os dados disponíveis de TCGA a partir de 02 de abril de 2015, através do portal do Instituto Broad Firehose web (Métodos) [14]. Este conjunto de dados consistiu de expressão de mRNA de todo o genoma, microRNA (miRNA) expressão e CpG metilação para mais de 9.000 tumores, dos quais tecidos normais adjacentes também foram perfilados para mais de 600 pacientes (S1 FIG).

Dada esta grande colecção de tumor combinados e dados normais, que eram movidos a empregar uma análise simplificada para identificar sinais moleculares associados a tumores (Métodos, Fig 1A e S2 FIG). Para cada marcador de ARNm, miARN ou CpG, foi quantificado o upregulated fracção (

f

-se

), a fracção de doentes para os quais o nível do marcador foi maior no tumor do que na tecido normal correspondente. Esta métrica é uma formulação da estatística de sinal-test

p

= Pr (x

i y

i), onde x e y são vetores de amostras pareadas de tumor e tecido normal adjacente , respectivamente. Usando essa estatística identificamos mRNAs, miRNAs e CpGs que variaram de forma aleatória (

f

-se

= 0,5) a altamente diferencialmente expressos ou metilado (

f

sub>

-se

aproximando 0 ou 1) (Fig 1b e S1 Tabela). Para avaliar a reprodutibilidade desta estatística, foram estudados 10 conjuntos de dados de expressão de genes de microarranjos adicionais, abrangendo 1012 pacientes com tumor combinado /dados normais do Omnibus Gene Expression. Depois de calcular

f

-se Compra de todos os genes no conjunto de dados, encontramos uma correlação de 0,84 (

P Art 10

-16 , 95% de intervalo de confiança (IC): 0,838-0,847) entre essas pontuações e o

f

-se

pontuações identificadas no período de RNA-sequenciação TCGA (Fig 1c e S2 Table) .

(a) esquemática do cálculo da fração regulada (

f

-se

) para um perfil de expressão gênica única em toda a coorte TCGA. Os dados são filtrados para incluir apenas amostras emparelhadas, as magnitudes de tumor emparelhado /amostras de indivíduos normais são comparados, e uma fracção da frequência com que o gene é regulado positivamente é gravado. (B) Densidade de

f

-se

estatística através mRNA de todo o genoma, miRNA, e as medidas de metilação. (C) Comparação de mRNA

f

-se

estatística calculada a partir de medições TCGA mRNASeq contra medições microarray baixados da GEO.

Inspeção de entidades moleculares com valores extremos de

f

-se

confirmou que a proliferação do tumor desempenha um papel dominante, como descrito por estudos anteriores [5-7, 15-16]. Entre os genes mais fortemente associados a tumores foi FOXM1, para os quais os níveis de ARNm são sobre-regulada em 93% dos tumores dos pacientes (95% CI

Bonf: 87% -97%). FOXM1 é um factor de transcrição associadas a proliferação bem conhecido que desempenha um papel central na regulação da progressão do ciclo celular [16]. Gene-Set Análise de Enriquecimento destacou uma série de características associadas com a proliferação, incluindo regulação positiva de genes do ciclo celular com particular grandes tamanhos de efeito observados para os subconjuntos de genes do ciclo celular “deposição de CENPA contendo nucleossomos no centrômero” e “M transição /G1” ( Fig 2a e S3 Mesa, Mann-Whitney U,

P

BH Art 10

-16). Análise de metilação dos marcadores mostrou hipermetilação ocorrendo em locais de ligação PRC2 que foram anteriormente relacionados com a proliferação do cancro em [17] (Figura 2b). Tomados em conjunto, estes resultados confirmam que muitas mudanças moleculares associados a tumores são movidos por proliferação.

(a) parcelas violino mostrando distribuição do nível de mRNA

f

se

estatística (fracção sobre-expresso) através de todos os genes, em comparação com os genes anotados para o ciclo celular e dos seus sub-grupos: “deposição de CENPA contendo nucleossomas no centrómero” e “M transição /G1” em mSigDB. (B) parcelas densidade da distribuição de

f

-se

(fração com o aumento da metilação) em marcadores de metilação anotados aos locais de genômica funcional. (C) Gráfico de dispersão comparando

f

-se

estatística contra correlação gene com a proliferação para cada perfil de expressão gênica.

Para isolar a proliferação dependente e independente componentes do sinal associado a tumor, que recebem uma pontuação proliferação para cada ARNm, e o local de miARN metilação. Este foi calculado através da avaliação da correlação entre os pacientes TCGA de cada nível de expressão característica com uma assinatura proliferação publicado anteriormente [18] (meta-PCNA, Métodos). Na verdade, descobrimos que essas pontuações de proliferação foram altamente correlacionados com a

f

-se

pontuações em todos os três tipos de dados, com Pearson

r

= 0,63 (95% CI : ,62-,64), 0,62 (0,56-0,67) e 0,674 (0,672-0,676) para mRNA, miRNA e metilação, respectivamente (Fig 2c, para todas as três estatísticas

P Art 10

– 16). Curiosamente, observou-se uma distorção pesada no

f

-se

estatística para as espécies de miRNA em particular (Fig 1a), que atribuímos a uma tendência geral de aumento da expressão miRNA com a proliferação [19].

para avaliar associada ao tumor, sinais independentes de crescimento, nós ajustamos níveis de marcadores para remover qualquer associação com a proliferação e recalculado

f

-se

(ou seja, representando a assinatura meta-PCNA, consulte Métodos, S4 Tabela). Esperávamos que apresenta com valores extremos de Destendenciada

f

-se

seria alterada na transição do normal para as células tumorais, mas não associada a taxa de crescimento do tumor. análise de enriquecimento desta estatística identificada superexpressão retificada de genes envolvidos em processos ribossomais e proteossomo (S5 Mesa, Mann-Whitney U,

P

BH Art 10

– 16,

P

BH Art 10

-7, respectivamente). Curiosamente, enquanto genes de manutenção dos telômeros teve um aumento geral no

f

-se

, genes envolvidos com a extensão dos telômeros teve correlações mais fortes com a proliferação de genes envolvidos na embalagem de extremidades dos telômeros (

P Art 0,001, S3 Fig). É provável que estas e outras vias são importantes para a religação inicial da célula necessária para o crescimento acelerado, mas têm pouco impacto sobre a taxa de crescimento do tumor.

Os mais regulados positivamente, genes independentes de proliferação dos tumores foram SEMA5B (retificada

f

-se

= 0,82 [0,74-0,88], S4 Fig), a subunidade do receptor GABA GABRD (retificada

f

-se

= 0,82 [0,64-0,80], Fig 3), e o supressor de tumor CDKN2A bem estudado (retificada

f

-se

= 0,72 [0,63-0,79 ]). SEMA5B é um gene na família semaforina, cujos principais papéis são para servir como sinais de orientação em vários estágios de desenvolvimento. Estes genes foram recentemente mostrado ter um papel na sinalização de cancro [20]. Este GABA

subunidade A é expresso principalmente no cerebelo, onde o seu receptor está localizado extrasynaptically [21-22], mas também é expresso nos testículos (Fig S5) e células T CD4 + [22-23]. No conjunto de dados TCGA, GABRD é sobre-expresso em 89% (IC

Bonf 81% -93%) de indivíduos e tem uma ligeira associação negativa com a proliferação de tumores (Fig 3). Em contraste, a maioria dos outros genes de subunidades GABA são reprimidos através de muitos tipos de câncer (Fig 3C, S6 Fig). Observou-se um efeito particularmente grande em carcinoma de células renais, onde há uma diminuição média de dez vezes na GABRA2 juntamente com um aumento de seis vezes na expressão de GABRD (figura 4e). Efeitos similares foram observados em um conjunto de dados microarray emparelhado (S7 Fig).

(a) Scatter-plot comparando GABRD perfis de expressão gênica para dezenas de proliferação em todo tumor combinados e amostras normais. Linhas indicam figos de regressão linear de tumor (vermelho) e amostras normais (azul), regiões sombreadas indicam intervalos de confiança de 95%. (B) Comparação de Perfis de tumor e normais correspondentes para expressão GABRD, agrupadas por tipo de tecido. (C) Comparação de tumor combinados e perfis normais para todas as subunidades da proteína GABA em carcinoma de células renais. siglas cancerosas são definidos da seguinte forma: KIRC, renal renal carcinoma de células claras; THCA, carcinoma da tiróide; BRCA, peito carcinoma invasivo; LIHC, carcinoma hepatocelular fígado; KICH, chromophobe renal; STAD, adenocarcinoma do estômago; LEIA, adenocarcinoma do reto; LUAD, adenocarcinoma pulmonar; COAD, adenocarcinoma do cólon; UCEC, útero carcinoma corpus endometrioid; LUSC, pulmão carcinoma de células escamosas; BLCA, carcinoma urotelial da bexiga; HNSC, cabeça e pescoço carcinoma epidermóide; PRAD, adenocarcinoma da próstata; Kirp, carcinoma papilar renal renal.

Mostrado aqui para TCGA conjunto de dados do cancro da mama como uma coorte representativa. Também é mostrado ALDH2, que é a principal enzima responsável pela quebra do acetaldeído, produto intermediário primária do metabolismo do álcool.

conjuntos de genes com padrões similares de expressão diferencial como GABRD incluídos ‘linhagem de células hematopoiéticas’ e ‘ ‘polarização ajudante de célula T “(Métodos). A inspecção de genes na via de polarização de células T helper mostrou uma preferência para os genes expressos em Th1, em oposição às células Th2. Para determinar se este sinal representado infiltração de células do sistema imunológico para o tumor, foi utilizado o programa CIBERSORT [7] para prever subconjuntos de células imunes em amostras de tumor, mas encontrou pouca ou nenhuma associação com GABRD. Enquanto continua a ser difícil excluir totalmente a infiltração imune como uma força motriz deste sinal, estes resultados sugerem que o aumento dos níveis da subunidade delta poderia levar a alterações funcionais do GABA

Um receptor que pode desempenhar um papel na diferenciação de células tumorais .

Entre os genes mais reprimidos, independente proliferação percebemos silenciamento epigenético generalizada em tumores com fortes enriquecimentos para hipermetilação local de início da transcrição (Métodos, S8A Fig, Odds Ratio = 2,

P

10

-16) e hipometilação do corpo gene (S8b Fig, Odds-ratio = 2,5,

P Art 10

-16). Embora a cobertura de marcadores de metilação no chip Illumina 450k variou entre os genes, inspeção manual (Métodos) dos genes mais consistentemente subregulado identificados muitos genes com associado a alterações de metilação ao seu DNA incluindo GSTM5 (retificada

f

-se

= 0,27 [0,19-0,35], S8c Fig) e NRXN1 (retificada

f

-se

= 0,25 [0,18-0,34], S8d Fig) . Enquanto NRXN1 é expresso principalmente no cérebro, onde serve como uma proteína da superfície da célula, também tem sido demonstrado que desempenham um papel na remodelação de tecido vascular indicando que pode desempenhar um papel mais amplo na regulação da adesão de células na periferia [24].

Uma tela para gene-sets enriquecido para downregulation identificados de transcrição e de ácidos graxos vias metabólicas independente de proliferação (Mann-Whitney U,

P

BH Art 10

-8,

P

BH Art 10

-4, respectivamente). Entre o conjunto de genes do metabolismo de ácidos graxos foram os genes de álcool desidrogenase, que eram quase onipresente regulada para baixo com um efeito particularmente grande para a classe I genes (

f

-se

= 0,06 [ ,,,0],0,02-0,10], 0,05 [0,02-0,10] e 0,12 [0,06-0,18] para ADH1-a, -B e -C, respectivamente), bem como ALDH2 (

f

-se

= 0,15 [0,09-0,22]), que serve para quebrar o acetaldeído (Figura 4 e Figura S9). A regulação negativa do metabolismo do álcool é provavelmente um componente de uso piruvato alternativa mediada pelo efeito Warburg em que as células cancerosas aumentar a sua taxa de glicólise, deslocando ao metabolismo aeróbio [25]. Exploração de outros genes glicólise apoiado esta mudança com a regulação positiva do LDHA gene da lactato desidrogenase (

f

-se

= 0,79 [0,71-0,86]) ao lado de regulação negativa do gene transportador piruvato mitocondrial MPC1 (

f

-se

= 0,11 [0,09-0,22], TCGA símbolo BRP44L). Muito parecido com os genes ADH, MPC1 é regulada negativamente de forma independente proliferação, e, recentemente, foi mostrado para afetar o crescimento linha de células de câncer em, condições não aderentes de cultura 3D, mas não na proliferação ou ensaios progressão do ciclo celular [26].

Discussão

Aqui nós fornecemos um recurso para auxiliar no entendimento das mudanças moleculares associados a tumores. Usando o maior banco de dados de perfis moleculares de tumor emparelhados e tecidos normais adjacentes disponíveis, determinamos quantas vezes cada mRNA, miRNA e sítio de metilação é diferencialmente expressos em câncer.

Foram observadas mudanças nos níveis de expressão de características associadas com crescimento e proliferação, incluindo genes do ciclo celular, expressão miRNA global e metilação de sítios de ligação PRC2. Além das características consistentes com a proliferação celular rápida, também observamos uma série de sinais independentes de proliferação. Estes genes pode estar em vias necessárias para as células a se libertar dos mecanismos normais que regulam as propriedades, tais como o processamento dos telômeros e invasão dos tecidos. Tal padrão independente de proliferação também poderia surgir para supressores de tumor. Muitos supressores de tumor são ativados em resposta a danos no DNA, mas pode ser suprimida ativamente pela sinalização molecular alterada em tumores.

Uma das principais conclusões deste estudo é a regulação positiva independente de proliferação de GABRD em quase todos os tumores perfilados. Em adição ao seu papel bem conhecida de sinalização neurológica, a sinalização através de subunidades de GABA também podem suprimir a proliferação de ambas as células estaminais neurais e periféricas. Além disso, a desregulação da sinalização de GABA tem sido implicado em vários cancros, onde ele se a hipótese de ter um papel na diferenciação e proliferação de células estaminais do tumor [27].

Há um número de possíveis explicações para o porquê muitas subunidades GABA são reprimidos, mas GABRD em particular é regulada, em câncer. Uma possibilidade é que os tumores expressam uma configuração novo receptor; Outra é que a expressão da subunidade delta poderia criar receptores não-funcionais com outras subunidades. Embora seja difícil de descartar a explicação anterior, a expressão de GABRD nos testículos (S5 FIG), e a observação de que GABA tem sido demonstrado para promover a proliferação das células de Leydig nos testículos de roedores [28], dá algum peso à ideia que o uso de uma alternativa GABA

um receptor pode ser importante para a tumorigênese.

Mais trabalho é claramente necessária para compreender os genes independentes proliferação e expandir seu papel no câncer. Enquanto os métodos de validação secundários frequentemente medir a alteração da taxa de crescimento de uma linha celular em resposta à interrupção de um alvo, os fenótipos tal como os descritos aqui não seria provável manifesto em tais ensaios. Em contraste, os ensaios não-tradicionais, tais como migração de células e cultura de células 3D pode ser necessária para validar tais fenótipos. experiências de cultura de células 3D foram recentemente conduzidas na MPC1 transportador piruvato em que os co-autores mostram uma indução evidente do crescimento apenas quando este gene é re-expressos em modelos de cultura e de xenoenxerto de ratinho 3D, não na cultura clássica célula (2D) [26] .

Finalmente, gostaria de destacar a utilidade de usar uma grande coorte, diversificada para derivar um sinal pan-câncer robusto. É importante notar que não visam diminuir a importância de que a função normal do tecido, exposição a agentes cancerígenos, e celulares taxas de rotatividade pode ter sobre os fenótipos de apresentações diferentes de câncer. No entanto, os sinais que são robustos e ao tecido contexto ambiental são susceptíveis de ser muito importante para os processos essenciais de condução de um amplo espectro de tipos de cancro. Com a recente atenção para a medicina de precisão, é ainda mais importante para definir o fenótipo molecular padrão para o câncer em geral: Apenas definindo primeiro características moleculares comuns, podemos compreender verdadeiramente como o tratamento pode ser atendidas para detectar e atacar apresentações específicas da doença .

Métodos

foi obtido

consentimento informado

o consentimento informado para todos os pacientes, como parte do consórcio Cancer Genome Atlas. Todos os dados utilizados neste estudo foram baixados de sites públicos depois que os dados foram consentido para uso público. No tratamento das informações de identificação pessoal foi feito pelos investigadores sobre este estudo.

Molecular Recuperação de Dados e Processamento

Todos os dados foram baixados usando o utilitário de recuperação de dados firehose_get do Instituto Broad. Para manter a coerência da análise em diferentes camadas de dados e tipos de câncer, usamos Nível 3 dados moleculares normalizados como a entrada para a nossa análise e utilizado todos os dados disponíveis a partir do 02 de abril de 2015 de execução de dados padrão. O uso do TCGA Genome Data Analysis Center (GDAC) gasoduto visa tornar estes resultados fáceis de atualizar como mais tornam-se disponíveis dados TCGA.

Para valores de expressão gênica TCGA, foram utilizados dados fornecidos por Rahman e seus colegas, que reprocessado os dados de expressão baseada na sequência de RNA e apresentou melhor desempenho nos controles [29]. Enquanto estiver usando esses dados ao contrário do gasoduto TCGA padrão rendeu ligeiras alterações nos resultados aqui apresentados, eles são qualitativamente muito semelhantes para os dois gasodutos. Para manter a consistência e respeito versionamento dados que apenas os pacientes e os genes utilizados presente no conjunto de dados Firehose.

Um marcador (gene, miRNA, sonda de metilação) filtro foi aplicado a dados TCGA para garantir que houve uma mudança detectável em valor entre o paciente e do tumor correspondeu perfis normais de, pelo menos, 50% dos sujeitos. Em geral, esta abordagem removido elementos cujos níveis estavam abaixo do limite de detecção em ambos os tumores e normais, resultando em baixos valores idênticos. O conjunto de recursos resultante consistia de 396,059 sondas de metilação, 520 microRNA, e 18420 genes.

Os dados Microarray foi recuperado através de busca manual da Expressão Gênica Omnibus (GEO) para grandes grupos moleculares com tumor emparelhado /dados de expressão normais de os seguintes: GSE25097 adesões, GSE14520, GSE62872, GSE44076, GSE53757, GSE39791, GSE5364, GSE41258, GSE39004, GSE68468 e GSE33532. Os dados foram obtidos a partir dos arquivos de matriz série pré-processados ​​disponibilizados no GEO, e as sondas foram calculados em seus genes anotados. Devido à distribuição desequilibrada dos tecidos disponíveis no GEO, fração regulada (

f

-se

) estatísticas foram calculados para cada tipo de tecido individualmente, e então a média para obter um consenso. Como nem todas as plataformas de microarray teve cobertura completa dos genes que codificam, as estatísticas foram calculadas para os dados disponíveis, e genes perfilados em menos de 500 amostras foram descartados. Isto resultou em 16785 genes para os quais existem ambos os dados de microarranjos e RNA-sequenciação.

Avaliação da expressão diferencial via a fração de upregulated Pacientes

A fração métrica regulada é uma formulação do sinal- estatística de teste

p

= Pr (x

i y

i), onde x e y são vetores de amostras pareadas. Esta estatística pode ser visto como uma simplificação do teste de Wilcoxon, uma vez que não utiliza a magnitude das diferenças de uma classificação, mas antes conta os sinais das diferenças. Esta é uma medida simples, livre de suposição no qual a informação sobre a magnitude da expressão diferencial ou metilação é descartado. A estatística representa a fração de pacientes para os quais um marcador assume um valor superior no tumor do que a amostra normal correspondente e varia entre 0 e 1. Avaliação Estatística da

f

se

é realizada por meio de testes contra a hipótese nula de que

f

-se

assume uma distribuição binomial com uma média de 0,5. intervalos de confiança são avaliados por meio de exame de um ajuste de distribuição beta com parâmetros de forma definidos pelo teste do sinal. Embora tal procedimento pode limitar bastante poder estatístico quando o tamanho da amostra é pequeno, em grandes amostras,

f

-se

acompanha muito bem com as estatísticas paramétricas, como um emparelhado t- teste (S2 Fig).

ao simplificar a um teste de sinal perdemos poder estatístico, mas ganhar robustez do teste, permitindo a aplicação deste teste independentemente da distribuição dos dados. Este é utilizado em substituição de técnicas estatísticas padrão usados ​​como um teste t emparelhado ou ferramentas especializadas de expressão diferenciais que variância piscina em frente marcadores que são tradicionalmente usados ​​em estudos que têm tamanhos de amostra muito menores (geralmente

n

= 3 -20) e, portanto, não têm o poder de usar um modelo tão simplificado. Nós se abster de utilizar técnicas como que vão apresentar uma grande variedade de fatores de confusão que tornaria nossa análise muito menos robusta e mais difícil para o leitor a interpretar. Por exemplo, o uso de um t-teste sem pureza tumor modelagem como covariável seria inapropriado neste cenário como amostras mais puras teria um efeito desproporcional.

Além disso, este teste exato não paramétrico tem um número de propriedades desejáveis ​​para análise integrativa através conjuntos de dados. Estatisticamente se baseia em suposições e é robusto a outliers. Além disso ele não amostras piscina como repetições biológicas e, assim, dá todas as amostras pesos iguais ao calcular um valor de resumo. Biologicamente o único pressuposto do ensaio é que a amostra de tumor contém mais células de tumor do que a amostra normal. Devido a estas propriedades, esperamos pequena contribuição de expressão e de lote efeitos específicos de tecido não-cancerosas.

Proliferação Scoring

A pontuação proliferação nível do paciente foi adotada a partir da métrica meta-PCNA publicado em Venet

et al

. [18]. Este estudo anterior extraído tecidos normais, não doentes e definido um conjunto de 131 genes associados com o antigénio nuclear do gene bem estudado de proliferação celular (PCNA), então criada uma meta-gene calculada como o nível de expressão média destes 131 genes. Como em Venet

et ai., A mediana destes genes foi utilizado para construir o marcador para a proliferação no estudo corrente. Uma associação de nível de marcador com esta pontuação proliferação foi então calculado para cada gene, miARN ou sonda metilação por meio da avaliação da correlação de Pearson de a mudança de meta-PCNA com a alteração dos níveis de marcadores de tumor para tecido normal para todos os sujeitos com amostras emparelhadas.

Avaliação da proliferação-Independent tumor-Associated características

para procurar características que são independentemente da proliferação associada ao tumor, a associação dos marcadores com a proliferação (meta-PCNA) foi retificada através de um modelo linear. O retificada

f

-se

métrica é muito semelhante ao padrão

f

-se

cálculo com a adição de pré-processamento para remover as tendências de proliferação. termos de tecidos e interação adicionais são adicionados para modelar a associação de metaPCNA com o tecido

O passo detrending é implementado em R usando o seguinte modelo:. Onde metaPCNA: tecido é um termo de interação entre esses dois fatores. Após este modelo está apto para todos os marcadores obtemos uma matriz de resíduos do conjunto de marcadores, e repetir a tela para mudanças conservadas como anteriormente implementadas para

f

-se

. O resultado tela fornece-nos com p-valores e intervalos de confiança para todos os retificada

f

-se

valores.

Gene Set Análise de Enriquecimento

conjuntos de genes foram transferidos da base de dados assinaturas moleculares (mSigDB) [30]. Versão 5 dos conjuntos de genes via canonical foi usado para esta análise. Enriquecimento de

f

-se Compra de conjuntos de genes foi realizada pela triagem todos os conjuntos para uma diferença na distribuição da

f

se

dentro do conjunto, em comparação com o gene de fundo definida através do teste de Mann-Whitney U-base rank.

para entender se GABRD havia coordenado expressão diferencial com quaisquer caminhos anotados, foi realizado um teste de enriquecimento contra a co expressão -differential de GABRD com todos os outros genes. Para resolver isso, nós avaliamos o enriquecimento de expressão co-diferencial através do seguinte método:

dx: gene correlação x gene através da matriz da expressão diferencial

dt: gene correlação x gene através da matriz de tumor a expressão do gene -apenas

cx: dx-dt, mudança na correlação

enriquecimento via: alteração na média de cx dentro genes anotados a um determinado percurso

Durante análise preliminar observamos que a proliferação associada vias foram enriquecidas para a expressão co-diferencial com muitos genes. Nós suspeitamos que este é o caso devido ao componente proliferação forte do sinal de expressão diferencial dando a estes genes mais conteúdo de informação. Para aprimorar em vias com um enriquecimento específico para GABRD computamos enriquecimentos via para todos os genes, e classificado como GABRD no que diz respeito a todos os outros genes. 0,05. 0,05.

Deixe uma resposta