PLOS ONE: Convergência Biológica de Câncer Assinaturas

Abstract

A expressão gênica profiling identificou câncer assinaturas prognósticos e preditivos com desempenho superior aos parâmetros histopatológicos ou clínicos convencionais. Consequentemente, as assinaturas estão sendo incorporadas à prática clínica e irá influenciar em breve decisões diárias em oncologia. No entanto, a ligeira sobreposição na identidade genética entre as assinaturas para o mesmo tipo de câncer ou condição levanta questões sobre suas implicações biológicas e clínicas. Para esclarecer essas questões, é necessária uma melhor compreensão das propriedades moleculares e possíveis interações subjacentes assinaturas aparentemente diferentes. Aqui, nós avaliamos se as assinaturas de 24 estudos independentes estão relacionados aos níveis de genoma, transcriptoma ou proteoma. associações significativas foram consistentemente observados através destas camadas moleculares, o que sugere a existência de um fenótipo de células de câncer comum. Convergência na proliferação celular e morte apoia a participação fundamental desses processos no prognóstico, metástase e resposta ao tratamento. Além disso, as associações moleculares e funcionais foram identificados com a resposta imunitária em diferentes tipos de cancro e condições que complementam a contribuição da proliferação celular e da morte. Exame de,, conjuntos de dados de câncer independentes adicionais corroborada nossas observações. Este estudo propõe uma estratégia abrangente para interpretar assinaturas de câncer que revela os princípios de design comum e propriedades de nível de sistemas

Citation:. Solé X, Bonifaci N, López-Bigas N, Berenguer A, Hernández P, Reina O, et ai. (2009) Convergência Biológica de Câncer Assinaturas. PLoS ONE 4 (2): e4544. doi: 10.1371 /journal.pone.0004544

Edição: Gustavo Stolovitzky, IBM Thomas J. Watson Research Center, Estados Unidos da América

Recebido: 07 de outubro de 2008; Aceito: 16 de janeiro de 2009; Publicação: 20 de fevereiro de 2009

Direitos de autor: © 2009 Sole et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. A la Fundação Caixa concessão BM 05/254 (MAPA) eo Ministério da Saúde espanhol concede FIS 05/1006 (VM) e 06/0545 (MAP), RCESP C03 /09 e RTICCC C03 /10 (VM e GC). CAM é apoiado por uma bolsa Beatriu de Pinos da agência AGAUR do Governo catalão, HA é apoiado por uma bolsa de pós-doutorado do Ministério da Saúde espanhol e MAP é um pesquisador Ramon y Cajal com o Ministério da Educação e Ciência espanhol. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

Nos últimos anos temos visto a descrição de um grande número de perfis de expressão gênica ou assinaturas com valor clínico para a caracterização de prognóstico ou previsão exata de pacientes com câncer ou tumores. O cancro da mama é, provavelmente, o paradigma de tais estudos, com, pelo menos, três diferentes assinaturas actualmente a ser testada em ensaios clínicos e comercialmente disponíveis para a prática clínica de rotina em oncologia [1], [2]. No entanto, a falta de sobreposição nos genes selecionados levantou questões fundamentais sobre as suas implicações biológicas e clínicas [3], [4]. Esta situação não é exclusiva do prognóstico do câncer de mama, ea descrição de novos perfis de expressão sugere que é comum a outros tipos de câncer ou condições-i. metástases e tratamentos [5]. Razões para este paradoxo pode ser disparidades metodológicas [6] e constrangimentos estatísticos criados pelo grande número de genes examinados no que diz respeito ao número relativamente pequeno de amostras perfilado [7] – [9]. Importante, um estudo recente realizado por Perou e colegas [10] estabeleceu o valor prognóstico comum de algumas assinaturas de câncer de mama, apesar da falta de sobreposição de identidades genéticas. Esta observação confirma a relevância clínica das assinaturas e sugeriu que eles podem de forma eficiente capturar um fenótipo tumoral comum célula (s) [11]. Este fenótipo comum putativo para o cancro da mama e para outras neoplasias devem ser definidos para que possamos compreender melhor o significado de assinaturas.

Alguns dos primeiros descrições de assinaturas notou a presença de processos biológicos específicos sobre-representados na listas gene correspondente. Entre estes processos, os genes individuais envolvidos no ciclo celular e apoptose foram realçadas (por exemplo, [12], [13]). Mais evidências recentes apontam para genes específicos que são globalmente associados com o prognóstico do cancro da mama e relacionados com a proliferação de células, entre outros processos ou vias [14] – [21]. No entanto, ainda não está claro como esta evidência caracteriza níveis moleculares diferentes e como os níveis de integrar em um modelo de nível de sistemas contendo interações entre genes e /ou proteína para câncer de mama e de cancro humano em geral. Aqui, utilizou-se uma abordagem integrada para determinar a existência de um fenótipo de células de tumor comum putativo (s) associado com diferentes tipos e condições cancerosas. O estudo identificou comum propriedades moleculares e interações de rede associadas com a proliferação celular e morte, e revelou associação com a resposta imune. Nossos resultados destacam a importância de estudar as assinaturas de um perpective de nível de sistemas

Resultados

Propriedades Genomic:. E2F e do receptor de estrogênio (ER)

para identificar as propriedades comuns entre assinaturas de câncer que compilou as listas de genes literatura de 24 estudos (Tabela S1). Estes representam 19 assinaturas prognósticos, duas assinaturas incidiram principalmente sobre a metástase, e sete assinaturas resposta ao tratamento preditivos. Todas as assinaturas utilizados corresponderam aos conjuntos validados de genes ao mesmo nível. Em primeiro lugar, examinamos as propriedades moleculares ou características de topologia de rede de genes e /ou proteas nestas assinaturas nos níveis de genoma, transcriptoma e do proteoma. Em seguida, as propriedades identificadas e associações de rede foram corroborados em conjuntos de dados de expressão independentes de diferentes tipos de câncer e condições (Fig. 1).

Estratégia para definir as propriedades e interações comuns entre as assinaturas no genoma, transcriptoma e os níveis de proteoma e de validação em conjuntos de dados independentes.

Propriedades no nível do genoma foram avaliados por sondando o enriquecimento relativo em fatores de transcrição previsto motivos do local de ligação com os promotores de genes de assinatura (ver Métodos). Nestes analisa os motivos mais bem classificados em diversas assinaturas eram da família E2F. Significativa sobre-representação de motivos E2F foi identificado em -45% (13/28) das assinaturas testados, incluindo prognóstico (bexiga, mama e do sistema nervoso central (SNC) de câncer, e três assinaturas multi-cancerosas) e assinaturas preditivos (docetaxel em tumores de mama, inibidores de EGFR de tirosina quinase (TKI) em tumores de pulmão e pemetrexed em tumores sólidos avançados) (taxa de descoberta de falsas (FDR) -adjusted

P

valores . 0,05) (Figura 2

a

). Em contraste, apenas uma assinatura (a resposta assinatura prognóstico imune do receptor de estrogénio (ER) cancro da mama -negative [22]) apresentou sub-representação de motivos E2F. Esta observação será discutido nas seções a seguir.

A

, a representação de motivos E2F com base em Jaspar e matrizes TRANSFAC e a distribuição de Poisson, com

valores P

ajustado usando a abordagem FDR para análises-colunas. Os valores são apresentados como detalhado na inserção: vermelho /laranja indica significativa sobre-representação e azul indica significativa sub-representação. O motivo E2F1_Q6 representa a ação putativo da E2F1 e MYC.

B

, representação do E2F1-AP2 e E2F4 locais de cromatina imunoprecipitação (chip) ensaios de ligação utilizando a mesma metodologia estatística como descrito acima. Os dados E2F4 correspondem à análise conjunta das fases do ciclo celular [23].

C

, a representação de genes com expressão periódica através do ciclo celular.

D

, a representação da regulação transcricional ER a partir de ensaios de imunoprecipitação de cromatina ou mudanças de transcrição em células MCF-7.

E

, a representação de motivos promotoras adicionais usando matrizes TRANSFAC. A assinatura de resposta de ferida sem genes associados ao ciclo celular é indicado pelo sufixo “(-CC)”, e o “conjunto total” assinatura de cancro da mama ER-negativo contém a resposta imune para além de outros processos biológicos, tais como o ciclo celular. A assinatura preditiva dasatinib é dividido em dois conjuntos para o efeito no cancro da próstata e da mama, respectivamente. As assinaturas prognósticos colorretais são como definidos na Tabela S1.

Para avaliar previsões motivo nas sequências promotoras de genes assinatura, examinamos os dados experimentais de ensaios de cromatina imunoprecipitação de fatores de transcrição [23], [24] . Esta análise corrobora o importante papel dos programas de transcrição E2F. Aproximadamente 65% das assinaturas mostrou significativa sobre-representação das E2F1-AP2 e /ou E2F4 sítios de ligação (Fig. 2

B

). Os mais fortes sobre-representações foram detectados em prognóstico em particular assinaturas câncer de mama e resposta ao tratamento preditivo para sites E2F1-AP2. No entanto, especificidades também foram sugeridos para a resposta imune, que mostrou sub-representação das E2F1-AP2, e por assinaturas preditivos que não apresentaram representação diferencial de E2F4 em qualquer caso.

Os E2F são reguladores chave da célula proliferação e morte [25], [26], e da desregulamentação comum de programas de transcrição E2F-mediadas é uma característica da transcriptomes câncer [27]. A ligação com o risco potencial de proliferação celular foi ainda avaliada examinando transcritos com expressão periódica através do ciclo celular [28], o que indica um papel direto ou indireto em fase (s) de divisão celular, e através da análise de dados genômicos funcionais ER [29 ]. Significativa sobre-representação dos genes expressos periodicamente foi observado em -45% das assinaturas, a maioria dos quais eram assinaturas prognósticos para diferentes tipos de câncer (Fig. 2

C

). A análise detalhada de fases do ciclo celular mostraram específica sobre-representação de genes com um pico de expressão em G2 e G2 /M, o que está de acordo com o seu papel na divisão celular (dados não mostrados). Além disso, de acordo com a ligação entre a proliferação celular e da via de sinalização ER [30], significativa sobre-representação de locais de ligação de ER e /ou a regulação da transcrição foi identificado na maior parte das assinaturas (~ 90%), independentemente da mediada por ER seu tipo ou condição (Fig. 2

D

). Esta alta sobreposição com a regulamentação ER provavelmente reflete uma forte associação com a proliferação de células cancerosas para além hormônio dependências.

No geral, todos, exceto dois dos assinaturas aqui examinados mostraram significativa sobre-representação de uma ou mais das evidências moleculares associados com a regulação da proliferação celular e da morte. As excepções foram a assinatura de resposta imune, o que pode reflectir o envolvimento de diferentes processos biológicos, e a assinatura prognóstico do linfoma de células B, o que pode ser explicado por o poder estatístico necessário para detectar diferenças no conjunto de genes menor examinados (

N

= 19). Semelhanças para estas assinaturas em níveis moleculares adicionais serão apresentados nas seções a seguir.

Programas adicionais de proliferação celular, morte e metástase

Em um exame de mecanismos adicionais de regulação da transcrição de assinaturas, motivos de AHR, EGR1, MYB e MYC foram encontrados para ser sobre-representados em um segundo mandato. Estes sobre-representações não eram tão generalizada como para E2F ou ER, o que sugere que eles desempenham apenas um papel menor, mas diferentes tipos e condições de câncer foram incluídos: um motivo EGR1 foi encontrado para ser sobre-representados no CNS e colorretal ea β-catenina multi-cancerosas assinaturas prognósticos, o cancro da mama assinatura metástase pulmonar e as assinaturas preditivos de cisplatina e dasatinib (FDR-ajustado

P

valores 0,05) (Fig. 2

e

) . De acordo com estas observações, encontramos a assinatura metástase pulmonar para conter 22% (12/54) dos genes previstos em outros lugares para ser EGR1 alvos de transcrição [31] – [34] ea resposta ferida foi previamente mostrado para ser coordenadas com

MYC

amplificação [35]. Além disso, a sobre-representação de um motivo AHR é consistente com sua associação com ER para regular a proliferação celular [36].

Em seguida, o significado das representações motivo foi avaliada através da análise de correlações de expressão gênica em conjuntos de dados de câncer representativas. Assim, calculado correlações usando o coeficiente de correlação de Pearson (PCC) entre os sete fatores de transcrição apresentados acima e genes associados com o prognóstico do cancro da mama [12] ou com a resposta ao tratamento com docetaxel no cancro da mama [37], e comparou-os com os genes não -differentially expressa nestas condições. CCP absoluta mais elevada entre os factores de transcrição e os genes associados com o prognóstico ou tratamento resposta foram identificadas em todos os casos para os genes e /ou sondas de microarray (Mann-Whitney (MW) de teste

valores P

0,001) (Fig. 3) . O conjunto de dados prognóstico continha uma única sonda de microarray representante de cada fator de transcrição, portanto, todos eles mostraram diferenças significativas (Fig. 3

A

). O conjunto de dados da resposta ao tratamento continha várias sondas para alguns fatores, que foram avaliados individualmente para identificar diferenças técnicas ou biológicas. Neste conjunto de dados,

AHR

,

EGR1

e

HIF1A

foram, cada um representado por uma única sonda e todos eles mostraram correlações significativamente mais elevados com a resposta (Fig. 3

B

).

E2F1

,

E2F4

,

MYC

e

MYB

tinham mais de uma sonda de cada um, com resultados discordantes, em alguns casos, mas com PCCs médios significativamente associados com resposta em três deles (Fig. 3

B

), enquanto

E2F4

permaneceu não classificável como duas sondas foram significativamente correlacionados e dois não eram (dados não mostrados).

a

, correlações de expressão entre sete nomes de factores de transcrição de genes mostrados na parte superior de cada gráfico-e genes diferencialmente expressos para o prognóstico do cancro da mama medido por eventos metástase até 5 anos (curvas-de-rosa) em relação aos não genes diferencialmente expressos nessa condição (curvas marrom). Os gráficos mostram os valores absolutos do PCC.

B

, mesma análise para genes diferencialmente expressos após o tratamento com docetaxel de pacientes com câncer de mama em relação aos genes não-diferencialmente expressos nessa condição. Resultados para

E2F1

,

E2F4

,

MYB

e

MYC Quais são os valores médios de todas as sondas de microarranjo representando cada fator, enquanto que as inserções mostram a resultados para as sondas individuais com diferenças significativas.

para avaliar ainda mais estas observações, foram computados correlações entre os sete factores de transcrição e 5.000 conjuntos seleccionados aleatoriamente equivalentes ao tamanho dos conjuntos de genes diferencialmente expressos acima. PCCs mais elevados foram observados para a maioria dos fatores de transcrição em ambas as condições de câncer, com exceção de

E2F4

no prognóstico e resposta ao tratamento (

P valores

obtidos utilizando a distribuição empírica dos PCCs aleatórios (empírica

P valores

) foram de 0,16 e 0,11, respectivamente). Em geral, a identificação de correlações significativas com, pelo menos, seis dos sete factores testados suporta as previsões motivo e sugere a existência de programas de transcrição comuns que convergem sobre a proliferação celular e a morte, bem como metástase como revelado por EGR1 [33].

Análise de motivos e as correlações de expressão também revelou uma associação entre a aparentemente dessemelhantes set resposta imune e assinaturas diferentes prognóstico. Embora sub-representadas motivos E2F1, a resposta imune compartilhada sobre-representação de um motivo MYB com o 21-gene, ferida cancro da mama resposta e cancro da bexiga assinaturas prognósticos (Fig. 2

E). Sobre-representação de este factor na resposta imune é consistente com o seu papel na hematopoiese [38], e a sua sobre-representação de outras assinaturas é consistente com o envolvimento emergente da resposta imune no prognóstico de diferentes tipos de cancro [39]. As correlações altas observadas na Fig. 3

A

entre

MYB Comprar e genes globalmente associados com o prognóstico do cancro da mama (isto é, não limitado pelo estado de ER) apoiar esta hipótese. Associações de esta assinatura a outros níveis moleculares serão apresentados nas seções a seguir.

correlações transcriptomic entre assinaturas

Dada a identificação de programas de transcrição comuns, as correlações de expressão globais entre assinaturas deve ser maior do que o esperado por acaso. Usando um conjunto de dados do cancro da mama [40] e o PCC média para todos os pares de sondas de microarray entre quaisquer duas assinaturas, a co-expressão significativa foi encontrada em aproximadamente metade das análises quando comparado com 10.000 conjuntos de genes equivalentes, seleccionados aleatoriamente (empírica

P

valores 0,05) (Fig 4

Um

).. Estes resultados suportam a existência de associações funcionais e moleculares entre muitas assinaturas aparentemente diferentes, apesar do facto de que o conjunto de dados utilizado tinha especificidades técnicas biológicas e evidentes. Além disso, a assinatura de resposta imune mostrou co-expressão significativa com 15 das assinaturas estudados (dados não apresentados), que também suporta a convergência neste processo.

Um

, mapa de pontos de CCP médios entre assinaturas de câncer em um câncer de mama a expressão do gene conjunto de dados [40]. co-expressão significativa (empírica

P

valores 0,05) é indicado por pontos. Note-se que a matriz não é simétrica, porque os resultados eram dependentes da dimensão de cada conjunto de genes; por conseguinte, os conjuntos de genes maiores (por exemplo ferida ou resposta invasividade) mostraram co-expressão significativa com muitas outras assinaturas, talvez parcialmente devido ao facto de que tiveram maior poder estatístico para detectar com os quais eles. Cada ponto corresponde à comparação entre uma assinatura do lado esquerdo (conjunto simulado) e uma assinatura na parte inferior. Os conjuntos de morte celular e mitose são destacadas em cor de rosa.

B

, painel esquerdo, a lista de assinaturas que mostraram correlação significativa com a morte celular ou mitose conjuntos completos GO. painel direito, lista de assinaturas que mostraram correlação significativa com a morte celular ou conjuntos de mitose, mas apenas usando seus componentes principais.

C

, observada (linha descontínua vermelho) versus esperado (curva preto para 10.000 conjuntos selecionados aleatoriamente) PCCs médios entre a mitose e o conjunto de 70 genes, o conjunto Cell Death, ou genes com expressão periódica através da ciclo celular.

para testar ainda mais o link para a proliferação celular e morte no nível transcriptomic, e excluindo

a priori

informações sobre os níveis de expressão ou os perfis que poderia enviesar a análise, examinou correlações com conjuntos de genes selecionados, utilizando apenas os critérios para a Gene Ontology (GO) Morte termos celular e mitose. Estes conjuntos foram exclusivamente definido pela seleção de genes Entrez anotados com esses termos, e em seguida usado em comparações da mesma forma que qualquer outra assinatura. Usando 10.000 conjuntos aleatórios equivalentes, correlações absolutas entre estes vão conjuntos e as assinaturas foram encontrados para ser significativamente maior em ≥12 comparações (Fig. 4

B

,

esquerda). O conjunto Cell Death foi significativamente correlacionada com cinco assinaturas eo conjunto de mitose foi significativamente correlacionada com 11 assinaturas de diferentes tipos ou condições cancerosas. É importante ressaltar que as diferenças na GO define em relação ao acaso eram da mesma magnitude que as comparações entre assinaturas (Fig. 4

C).

Esta análise sugeriu que medir os níveis de genes conhecidos de expressão participar em processos biológicos específicos são susceptíveis de ser de valor prognóstico ou assistida em situações diferentes. No entanto, a análise foi limitado pela possível presença de expressão não informativo ou de sub-conjuntos de genes com um comportamento diferente dentro dos conjuntos GO. Assim, a redução da dimensionalidade de morte celular e mitose conjuntos usando uma análise de componentes principais que capturou ~ 80% da variância aumentou o número de correlações significativas para 12 e 14 conjuntos, respectivamente (Fig. 4

B

,

direito

); esses números correspondem a um total de ~ 60% das assinaturas examinados, independentemente do seu tipo ou condição.

associações de rede interactome

relações funcionais entre proteínas podem ser identificadas como interações diretas, sociedades complexas ou conexões relativamente próximos na rede de interações proteína-proteína ou rede interactome. Dada a evidência nos níveis genómicas e transcriptomic apresentados acima, a hipótese de que as proteínas codificadas por assinaturas aparentemente diferentes serão mais estreitamente localizado na rede de interactoma do que o esperado por acaso. Para esta análise utilizou-se um conjunto de dados consistindo de interacções proteína-proteína, principalmente de experimentalmente identificados, excluindo os homodímeros e previsões baseadas em ortologia, e calculado o caminho mais curto entre quaisquer dois nós ou proteínas no componente de rede gigante (isto é, o componente que contém o maior número de proteínas ligadas) [41].

Todas as comparações de assinatura mostrou distribuições de menor caminho desviada para valores menores do que o esperado a partir do componente gigante (Fig. 5). A avaliação estatística usando os testes MW não paramétrico identificadas diferenças significativas no que diz respeito à distribuição de componentes gigante em 90% das comparações. As menores caminhos mais curtos foram identificadas para o prognóstico 21-gene, e dasatinib e TKI de EGFR assinaturas preditivos, embora os resultados podem estar sujeitos a polarização porque estes conjuntos contêm várias proteínas que são amplamente estudados na literatura e, portanto, possuem uma elevada central da rede.

A

, mapa de calor dos caminhos mais curtos médios entre proteínas codificadas por assinaturas. Esta análise foi realizada usando apenas o componente de rede gigante. Um exemplo de menores diferenças de caminho no que diz respeito à componente gigante é mostrado no painel da direita para a comparação entre a morte celular completa e conjuntos mitose GO.

B

, mapa de calor de comparações de 1.000 conjuntos de 50 proteínas selecionados aleatoriamente no componente gigante. painel da direita, lote densidade de caminho mais curto média em conjuntos selecionados aleatoriamente: a 5% os valores mais baixos são realçadas, o que corresponde a um caminho 4,09. As comparações entre as assinaturas abaixo deste empírica de corte são mostrados por pontos em

A

.

C

, painel esquerdo, a representação da rede de caminhos médios mais curtos entre morte celular e mitose e assinaturas de câncer, como mostrado na inserção. Arestas comprimentos são proporcionais aos valores médios caminho mais curto. painel da direita, a representação da rede de caminhos mais curtos médios entre morte celular e mitose e assinaturas de câncer ou conjuntos de proteínas selecionados aleatoriamente com centralidade grau equivalente.

Para melhor avaliar essas diferenças, foram selecionados aleatoriamente 1.000 conjuntos de 50 proteínas com semelhante centralidade grau médio para as assinaturas e obtiveram suas distribuições caminho mais curto. A maioria das assinaturas de câncer foram mais de perto localizado do que o esperado por acaso e também perto da morte celular e conjuntos completos de mitose (empírica

P

valores. 0,05 marcados com pontos na figura 5

A e B

). De acordo com estas observações, o exame de anotações GO nos bairros diretos e one-hop de assinaturas identificadas significativa sobre-representação de termos ciclo celular ou morte celular ou seus filhos em todos os casos (FDR-ajustado

P

valores 0,05) (GO detalhes prazo não mostrado), o que reforça a hipótese de que os produtos do gene de assinatura são molecularmente e funcionalmente associado com estes processos.

em seguida, foram descritos como assinaturas nós de uma rede em que o comprimento da bordas é proporcional ao percurso médio mais curto para a morte celular e conjuntos mitose (Figura 5

C

,

esquerdo

). Nesta rede, a maioria das assinaturas foram encontrados perto esses processos centrais quando comparado com 100 conjuntos aleatórios com grau centralidade equivalente (Figura 5

C

,

direito

). assinaturas distantes representada associações modestas nos diferentes níveis moleculares examinados acima, tais como as assinaturas prognósticos para o linfoma de células B, câncer colorretal e de resposta à hipóxia. Estas observações sugerem correlação entre os diferentes níveis moleculares. Assim, foram observadas correlações negativas para todas as assinaturas entre os valores de co-expressão PCC e interactome distâncias de caminhos mais curtos (média

r

= -0,31 e

σ

= 0,16; teste de Mantel

P

value = 0,059), o que é consistente com as relações funcionais [42] – [45]. Consequentemente, a co-expressão mais elevada entre assinaturas parcialmente correlacionada com caminhos mais curtos menores entre eles na rede interactome. Estas observações destacam a importância do estudo integrativo, que revelou relações anteriormente não identificados em listas de genes.

A assinatura resposta imune foi também localizado perto da morte celular e conjuntos mitose (teste MW

P

valores 0,001) (Figura S1

A

). Consequentemente, a análise da proporção de anotações GO no bairro one-hop dessa assinatura identificada excesso de representações de termos relacionados à proliferação celular e morte, enquanto os interagentes diretos mostrou apenas sobre-representação dos termos associados com o sistema imune (Figura S1

B

). Assim, embora os produtos de genes com valor de prognóstico para cancro da mama ER-negativo não estão ligados directamente com os processos comuns identificados acima, eles estão significativamente associados em uma segunda duração, bem como transcricionalmente co-expressa e co-regulados com muitas assinaturas.

a avaliação das propriedades e interações em conjuntos de dados independentes

As observações acima descritos foram avaliados em duas assinaturas geradas independentemente de condições cancerosas. Um estudo recente descreveu uma assinatura metástase pulmonar de câncer de mama usando uma abordagem metodológica diferente [46]. Encontramos ~ 70% (15/21) dos genes nesta assinatura para conter motivos E2F TRANSFAC e -60% (13/21) a ser alvos de E2F1-AP2 e /ou ER. Além disso, foram identificadas correlações significativas com oito assinaturas prognósticos, sete deles de câncer de mama (empíricos

valores P Restaurant 0,001) (resultados das análises de esta assinatura estão detalhados na Tabela S2). A correlação com a mitose foi maior do que o esperado (empírica

P Art 0,001), enquanto que a correlação com morte celular não foi significativa (empírica

P

= 0,18). Finalmente, produtos de genes neste assinatura mostrou menores caminhos médios mais curtos do que o esperado, com 21 das 28 assinaturas, incluindo a morte celular, mitose ea assinatura metástase pulmonar apresentado anteriormente [31] (empíricos

P

valores 0,05).

Para corroborar ainda mais as nossas observações, foi selecionada uma condição neoplásica diferente da literatura recente: câncer colorretal metastático tratados com o cetuximab inibidor EGFR (Erbitux®) [47]. Estudos anteriores sugerem que as mutações de EGFR estão associados com a resposta a TKI mas não ao cetuximab [48], [49]. Nós avaliamos nossas observações examinando a distribuição de anotações de genes no posto de taxas de risco (HRS), que mede a resposta ao tratamento com cetuximab por sobrevida livre de progressão. Nesta análise, a proliferação celular e a resposta imunitária foram identificados como os processos com o maior efeito sobre a resposta (Fig. 6). Importantemente, o conjunto de genes cuja expressão elevada associar mais fortemente a resposta foi ferida para um fenótipo semelhante a que foi mostrado anteriormente para fornecer o valor prognóstico de cancro da mama, do pulmão e do cancro gástrico [50]. Os próximos conjuntos de alta expressão associada foram para o tratamento doxorrubicina em câncer gástrico, o prognóstico do cancro da mama (70-gene) e prognóstico de diferentes tipos de câncer não examinadas neste estudo (carcinoma hepatocelular e múltipla prognóstico mieloma). Além disso, de alta expressão de E2F1, alvos de hipoxia e MYC também foi associado com a resposta com uma força semelhante (Fig. 6

Um

). Coletivamente, essas observações apoiar a convergência biológica de assinaturas.

A

, painel esquerdo, resultados GSEA para o mais forte fenótipo associado com genes de alta expressão prever a resposta ao tratamento (log

2 HR 0). painel central, plot análise de expressão da expressão do gene extrema (

EREG

), que também foi observado na publicação original [47]. painel direito, fenotípica adicional e GO conjuntos de termos com genes de alta expressão associada à resposta ao tratamento no FDR

Q

valores 1%.

B

, painel esquerdo, resultados GSEA para o mais forte fenótipo associado com genes de baixa expressão prever a resposta ao tratamento (log

2 HR 0). painel central, plot análise de expressão da expressão do gene extrema (

IL15

). painel direito, fenotípica adicional e GO conjuntos de termos com genes de baixa expressão associada à resposta ao tratamento no FDR

Q

valores 1%.

C

, Histograma parcela de valores de expressão médios de genes anotados com a resposta imune ou mitose através de amostras no conjunto de dados cetuximab. definido Média GO valores de expressão mostram uma correlação negativa com amostras metastáticos encomendados.

A análise do conjunto de dados cetuximab também revelou um comportamento complementar da proliferação celular e da resposta imune consistente com a representação de motivos E2F1 mostrado acima . Pacientes com elevada expressão de genes relacionados com a proliferação de células e baixa expressão de genes relacionados com a resposta imune, responderam ao tratamento (Fig. 6

B

), enquanto não houve doentes com valores elevados de expressão de ambos os processos. Assim, foi observado um forte anti-correlação entre genes anotados com o termo GO resposta imune e genes anotados com mitose (

r

= -0,79) (Fig. 6

C

). Esta observação leva a especular que estes processos têm um papel de equilíbrio no prognóstico e resposta ao tratamento. Bons respondedores ao cetuximab pode mostrar forte dependência em um programa molecular “proliferação-on célula”, enquanto os não-respondedores pode ser sensível à terapia baseada no sistema imunológico.

Discussão

Apesar do baixo grau de sobreposição em termos de identidade genética, assinaturas de câncer aparentemente diferentes convergem para processos biológicos específicos. A convergência é definida por associações moleculares e funcionais significativas entre os genes e /ou proteínas: i /previu motivos promotor; ii /ligação a DNA locais experimentalmente identificados; iii /célula perfis do ciclo de periódicos; iv /regulação da transcrição mediada por ER;

Deixe uma resposta