PLOS ONE: Genes câncer humano comum Descoberto por Integrado Gene Expression-Analysis

Abstract

Fundo

tecnologia de microarrays permite uma avaliação objetiva e padronizada de diagnóstico oncológico e prognóstico. No entanto, tais estudos são geralmente específicas para certos tipos de câncer, e os resultados têm uso limitado devido à validação inadequada em grandes grupos de pacientes. Descoberta de genes comumente regulados em câncer pode ter uma implicação importante para a compreensão do mecanismo molecular comum de câncer.

métodos e resultados

Nós descritas uma análise gene-expressão integrado de 2.186 amostras de 39 estudos para identificar e validar um gene assinatura independente do tipo de cancro que pode identificar doentes de cancro para uma ampla variedade de malignidades humanas. A vulgaridade da expressão do gene em 20 tipos de câncer comum foi avaliada em 20 conjuntos de dados de treinamento. O poder discriminatório de uma assinatura definida por estes genes do cancro comuns foi avaliada em outros 19 conjuntos de dados independentes, incluindo tipos romance cancerosas. QRT-PCR e tissue microarray foram utilizados para validar os genes regulados normalmente em vários tipos de cancro. Foram identificados 187 genes desregulados em quase todas as amostras de tecidos cancerosos. A assinatura 187 para o gene pode prever de forma robusta contra o cancro estado normal para uma ampla variedade de doenças malignas humanas, com uma precisão global de 92,6%. Nós refinou ainda mais a nossa assinatura de 28 genes confirmados por qRT-PCR. A assinatura refinado ainda alcançado 80% de precisão de classificação de amostras de tipos de câncer mistos. Esta assinatura tem um bom desempenho na previsão de novos tipos de cancro que não estavam representados no conjunto de dados de treinamento. Nós também identificou três vias biológicas, incluindo a glicólise, checkpoint do ciclo celular II e das vias PLK3 em que a maioria dos genes são sistematicamente sobre-regulada em muitos tipos de câncer.

Conclusões

A assinatura identificado capturou essencial características de transcrição de transformação neoplásica ea progressão em geral. Estes resultados vão ajudar a elucidar o mecanismo molecular comum de câncer, e fornecer novos insights sobre diagnóstico de câncer, prognóstico e terapia

Citation:. Lu Y, Yi Y, Liu P, Wen W, James M, Wang D , et ai. (2007) Genes câncer humano comum Descoberto por análise de expressão genética integrada. PLoS ONE 2 (11): E1149. doi: 10.1371 /journal.pone.0001149

Editor do Academic: Oliver Hofmann, Sul Africano Instituto Nacional de Bioinformática, África do Sul

Recebido: 13 Agosto, 2007; Aceito: 16 de outubro de 2007; Publicação: 07 de novembro de 2007

Direitos de autor: © 2007 Lu et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este trabalho foi apoiado pelo NIH conceder R01CA58554 (MY)

Conflito de interesses:.. os autores declararam que não existem interesses conflitantes

Introdução

o cancro é uma das principais causas de morte nos países ocidentais, resultando em uma em cada quatro mortes. Mais do que 100 tipos de cancro com incidência diferente foram diagnosticados em vários órgãos ou tecidos. O câncer é associado a várias aberrações genéticas e regulamentares na célula. Para capturar estas anormalidades, micromatrizes de ADN, que permitem a medição simultânea dos níveis de dezenas de milhares de genes de expressão, têm sido cada vez mais utilizada para caracterizar os perfis de expressão genética globais de células tumorais e células normais correspondentes da mesma origem. Ao longo dos últimos anos, os perfis de expressão genética globais de vários cancros foram analisados ​​e muitas assinaturas de expressão genética que estão associados com a progressão do cancro, prognóstico e resposta terapêutica foram descritos [1] – [19]. No entanto, tais estudos são geralmente específicas para certos tumores. As assinaturas de tipo específico de câncer destes estudos mostram pouca sobreposição nas constituições genéticas e vias biologicamente importantes. Décadas de pesquisa em oncologia molecular têm rendido alguns marcadores moleculares específicos do tumor úteis, devido a limitações com disponibilidade de amostras, identificação, aquisição, integridade e preparação [20]. O cancro é uma doença altamente heterogêneo, tanto morfologicamente e geneticamente. Ele continua sendo um desafio para capturar uma característica essencial da transcrição, comum de transformação neoplásica e progressão.

Para extrair o máximo valor da recente acumulação de dados de expressão genética de câncer publicamente disponíveis, é necessário avaliar, integrar e inter -validate vários conjuntos de dados. análises abrangentes de uma infinidade de conjuntos de dados publicados torná-lo possível encontrar genes de câncer comuns e as consequências funcionais essenciais que estão associados com a iniciação e progressão tumoral em geral. caracterização sistemática de mudanças de expressão em vias biológicas entre diferentes tipos de cancro irão eventualmente levar a uma melhor compreensão do que perturbações na célula dar origem a cancro. Estes resultados irão fornecer várias indicações clínicas para o diagnóstico de cancro, e terapia de prognósticos sobre a base da assinatura de pacientes a expressão do gene. No presente estudo, nós descrevemos uma análise de expressão genética integrado de 2.186 amostras de 39 estudos diferentes para identificar e validar um gene assinatura cancro que é independente de tipos de tumores e pode identificar doentes de cancro para uma ampla variedade de malignidades humanas.

Resultados

mudanças de expressão gênica comum em vários tipos de câncer

o primeiro analisados ​​perfis de expressão gênica de 1.223 amostras humanas (343 tecidos normais e 880 tecidos tumorais) a partir dos conjuntos de dados de treinamento 1-20 contendo 20 diferentes tipos de cânceres (Tabela S1). A vulgaridade da expressão do gene nesses 20 tipos de câncer foi estatisticamente avaliada por análises de permutação (p 10

-5). No total, foram identificados 187 genes comumente afetadas no câncer. Destes, 117 foram supra-regulados e 70 foram regulados negativamente em amostras de tecidos cancerosos quase todos, independentemente do seu tecido de origem (Tabela 1 e 2). Com a ferramenta de bioinformática, Fatigo (https://fatigo.bioinfo.cnio.es), encontramos 142 de 187 genes de câncer foram significativamente associados com pelo menos um Gene Ontology (GO) categoria. Diversas categorias funcionais demonstraram ser importantes para a carcinogénese e progressão do cancro (Tabela S2). Por exemplo, 11 genes (BFAR, Card4, SPP1 SNCA, Bax, STAT1, CLU, GULP1, oferta, CIDEA e PPP2R1B) controle a morte celular programada; 8 genes (TTK, Reck BAX, STAT1, NME1, CCNB2, E2F3 e PPP2R1B) estão envolvidos na regulação do ciclo celular; 8 genes (TAP1, APOL2, SPP1, CLU, PSMB8, TAPBP, HLA-F e TNFSF13b) desempenham um papel na resposta imune; e 6 genes (TTK, SPP1 NME1, NAP1L1, NPM1 e TNFSF13b) regulam a proliferação celular. Além disso, os genes que estão envolvidos no transporte de proteínas, do ciclo celular fase M, via secretora e reparo de DNA são consistentemente sobre-regulada em uma grande maioria dos tipos de câncer.

Validação de câncer comum genes por qRT-PCR e TMA

Para validar os resultados de expressão de genes de microarranjos de análise de expressão genética integrada, os níveis de expressão relativa de 32 dos 187 genes do cancro foram determinados por análise de QRT-PCR utilizando amostras completamente independentes a partir de cada um dos três mama, pulmão, próstata, cólon e cancro do colo do útero e o seu tecido normal correspondente. Confirmou-se os resultados de expressão para a maioria destes genes seleccionados (Mudar vezes 1,5, p £ 0,05 e consistência 60%) (Tabela 3). Os 10 melhores genes com alterações 85% foram confirmados usando outro 18 tumor combinados e amostras normais da mama, pulmão e pacientes com câncer cervical. Na análise expandida, os níveis destes 10 genes de expressão foram ainda significativamente diferente com a mudança absoluta vezes 4, p £ 0,05 e consistência 85%, excepto genes SPP1 e NDRG2, que exibiu uma ligeira diminuição de consistência (Figura 1).

Fold diferenças mais correspondentes controlos normais foram representados por 21 e os 24 tumores de todos os tecidos testados, incluindo os da mama, pulmão, próstata, colo-rectal e os tumores do colo do útero, em duplicado, desde 42 a 48 pontos de dados por gene. A variação média vezes, valor de p, a coerência da regulamentação tendência, e os números dos tecidos com sobre ou sob-expressão também foram listados.

Também foi realizada

análise de microsséries de tecido (TMA) para três escolhido aleatoriamente genes do cancro comuns (SPP1, BID e CLU) para determinar se as mudanças de mRNA foram correlacionados com mudanças na expressão da proteína em pacientes com câncer. A tissue microarray contém 200 amostras tumorais com 50 amostras de cada um dos quatro tipos de cancro (do cólon, mama, ovário, e pulmão). Análise da expressão de proteína SPP1 em tecidos tumorais e normais indicaram que SPP1 está presente no citoplasma e núcleo das células. A maioria das amostras de adenocarcinoma do cólon, adenocarcinoma da mama, adenocarcinoma do ovário e cancro do pulmão mostraram forte coloração intermediário para SPP1 citoplasmática em células tumorais, mas a coloração de tecidos normais foi muito mais fraca. As pontuações médias para tumor e tecidos normais são 11,1 ± 1,8 e 1,8 ± 1,5 no adenocarcinoma de cólon (p = 0,0005), 10,9 ± 1,7 e 4,5 ± 3,8 no peito de adenocarcinoma (p = 0,043), 11,7 ± 1,0 e 3,3 ± 4,2 no ovário adenocarcinoma (p = 0,028), e de 9,0 ± 2,2 e 3,5 ± 2,0 no cancro do pulmão (p = 0,0005), respectivamente (Figura 2 e Figura S1). coloração citoplasmática positiva de clusterina (CLU) estava presente em ambos os tumores e as células normais em pulmão, mama, ovário e tecido. No entanto, em comparação com os tecidos normais, a clusterina diminuição no cancro do pulmão (5,6 ± 2,1

vs.

10,8 ± 1,6, p = 0,005), o câncer de mama (7,1 ± 2,7

vs.

10,5 ± 1,7, p = 0,017), e cancro do ovário (6,8 ± 3,0

vs.

10,5 ± 1,7, p = 0,011) (Figura 3A, B e D). O cancro do cólon apresentaram coloração positiva CLU muito menos do que os outros tipos de tumores e não houve diferença significativa entre os tumores de cólon e tecidos do cólon normal (Figura 3C). BID proteína foi significativamente regulada positivamente em cancro do cólon, cancro do pulmão e cancro da mama, mas não em cancro do ovário (dados não mostrados). As pontuações médias de coloração imuno-reactivo em tumor e tecidos normais são 11,2 ± 1,9

vs 2,0 ± 1,4 (p = 0,00015), 10,4 ± 2,2

vs.

2,5 ± 2,2 (p = 0,0002.

) e 11,5 ± 1,4

vs.

6,5 ± 1,9 (p = 0,010) para estes três tipos de cancro, respectivamente (Figura 3E-G). A análise semi-quantitativa indica que a maioria das amostras de diferentes tipos de câncer têm alto percentual de imunorreacção BID forte, enquanto os tecidos normais só mostram nível baixo a médio de coloração; CLU tende a ser regulada em tumores (Figura 3H). Os resultados demonstram que o nível de proteína é largamente consistente com a expressão de ARNm destes três genes.

Coloração

SPP1 positivo apresenta no citoplasma e nucleares de células de tumor no cancro do pulmão (A, direita), do cancro da mama (B, direita ), o câncer de ovário (C, à direita), e cancro do cólon (D, à direita), enquanto coloração negativa no pulmão normal (a, à esquerda), e ovário (C, à esquerda), coloração fraca em mama normal (B, à esquerda), e cólon (D, esquerda).

coloração citoplasmática positiva de CLU apresenta em ambos os tumores e as células normais em pulmão, mama, cólon, ovário e tecido (a a D). expressão CLU diminuição no cancro do pulmão (A, nível superior) em comparação com o pulmão normal (A, nível inferior). Ambos mama normal (B, nível inferior) e ovário (D, nível mais baixo) mostram meio da coloração forte no citoplasma, e do meio para coloração fraca no peito (B, nível superior) e de ovário (D, nível superior). Muito coloração clusterina menos positivo presente em ambos tumor de cólon (C, nível superior) e tecidos normais (C, nível inferior). BID mostra forte coloração citoplasmática e nuclear no cancro do pulmão (E, nível superior) e coloração nuclear fraca no epitélio pulmonar normal (E, nível mais baixo). coloração nuclear e citoplasmática forte aumento da é vista em tumor da mama (F, nível superior) quando comparada com o tecido da mama normal (F, nível inferior). No cancro do cólon, BID mostra forte citoplasmática e coloração nuclear em células tumorais (G, nível superior), enquanto a coloração BID menos positiva foi encontrada no tecido do cólon normal (G, nível inferior). A análise semiquantitativa da CLU e BID imunorreacção em tumores e tecidos normais (H). A maioria das amostras de diferentes tipos de câncer têm alto percentual de imunorreacção BID forte, e os tecidos normais mostrar apenas do meio para coloração de baixo nível; enquanto CLU tende a sub-regulada em tumores (H). Alto = pontuação 10-12, = meia marcar 6-9, e baixas = marcador para 1-5. coluna da esquerda em cada painel é em baixa potência (100X) e coluna da direita em cada painel é de alta potência (400X).

vias de câncer comum em vários tipos de câncer

Nós ainda mais pesquisada uma lista de 1,687 vias biológicas que incluem vias metabólicas, redes de interacção de proteínas, vias de transdução de sinal, e rede de transcrição para analisar se vários genes dentro de um acto via específica de um modo cumulativo a influenciar a transformação neoplásica e progressão. A riqueza de genes diferencialmente expressos de forma significativa em um determinado percurso foi novamente avaliada por 100.000 testes de permutação nos conjuntos de dados de treinamento. Pathway Analysis mostrou que os genes diferencialmente expressos significativa (p 0,01) foram principalmente enriquecido na via da glicólise, posto II percurso e PLK3 percurso do ciclo celular, incluindo 24, 10 e 10 genes, respectivamente (p 10

-5) . Curiosamente, a maioria dos genes envolvidos nestes três vias são regulados positivamente em uma grande maioria dos tecidos cancerosos quando comparado com tecidos normais (Figura S2), o que sugere a prevalência da hiperactivação gene de amplificação e em malignidades humanas.

a confirmação do padrão de expressão gênica comum em conjuntos de dados independentes

em seguida, determinou-se a validar a nossa assinatura de expressão gênica e ver se podia distinguir amostras de câncer a partir de amostras normais em conjuntos de dados completamente independentes. O poder discriminatório da assinatura de expressão de 187 genes em amostras normais e tumorais foi testada pelo agrupamento análise utilizando dados de expressão de genes oligonucleotídeo obtidos a partir de 19 conjuntos de dados completamente independentes. Conjuntos de dados 21 a 38, utilizado para validação, eram compostas de 211 normal e 492 tecidos tumorais de 14 tipos diferentes de câncer. Na maior parte destes 18 conjuntos de dados, as amostras foram classificadas em dois grupos, um que compreende a da maior parte das amostras normais e outra para a maioria das amostras de tumores, com base no nosso gene assinatura 187 (Figura S3). A precisão global de classificação correcta é, em média, 92,64% variando de 78% a 100% (Tabela 4). Deve notar-se esse conjunto de dados 30 e 31 são ligeiramente diferente dos outros conjuntos de dados devido à heterogeneidade das amostras de cancro. Todas as amostras nestes dois conjuntos de dados foram classificados em dois grandes grupos: um que contém apenas amostras de tumor; o outro grupo contendo ambos os tumores e normais, o que pode ser claramente distinguida como dois subgrupos. Especificamente, no conjunto de dados 30, oito linhas de células de mieloma formou um grupo com a inclusão de uma leucemia de células plasmáticas (PCL); no outro grupo, oito amostras de células normais do plasma e oito amostras de pacientes com mieloma múltiplo (MM) ou PCL foram claramente subdividida. No conjunto de dados 31, seis amostras de cancro da próstata metastático foram agrupados em conjunto, enquanto os tecidos normais e os cancros da próstata primários estavam no outro grupo, com seis tecidos normais e um cancro da próstata primário em um subgrupo, e seis cancros da próstata primários no outro subgrupo. No agrupamento de análise para amostras de tumores de diferentes subtipos com dados de expressão gênica, não é incomum que alguns subgrupos de tumores estão mais próximos do grupo normal, mas são claramente distinto do grupo normal.

Dataset 39 incluiu 180 amostras tumorais, que abrangem 14 tipos de tumores comuns, e 81 amostras de tecido normal. Entre 14 tipos de tumores, o adenocarcinoma uterino, leucemia e mesotelioma pleural não estavam presentes nos 20 conjuntos de dados de treinamento. Na análise de agrupamento, as amostras estão agrupadas em três grupos: grupo tumor I compor de 57 tumores e 20 tecidos normais, compondo grupo normal de 11 tumores e 53 tecidos normais e grupo tumor II composição de 112 tumor e 8 tecidos normais (Figura 4) . A precisão da classificação é de 85%. Todos cancro do sistema nervoso central e mais de adenocarcinoma pancreático foram classificados em grupos de tumor I, enquanto todos leucemia e mais de linfomas foram classificados em grupos de tumor II. Notavelmente, o assinatura 187 para o gene tem um bom desempenho (81-100%) em classificar os novos tipos de cancro (tais como adenocarcinoma uterino, leucemia e mesotelioma pleural). É importante notar também que só ~31-60% dos genes deste gene assinatura 187 que eram usados ​​em agrupamento analisa em cada um dos conjuntos de dados de validação devido à especificidade de plataformas, a disponibilidade de amostra e valores ausentes em experimentos de microarranjos. Além disso, o conjunto de genes utilizados para análises de agrupamento são em parte diferente entre os conjuntos de dados de validação, em função da disponibilidade de dados de expressão genética num estudo específico. Isto demonstrou a robustez, utilidade e ubiquidade da nossa assinatura gene. Por último, nós também tentou classificar essas 261 amostras usando os perfis dos 28 genes de câncer comuns confirmados pela análise QRT-PCR com a mudança vezes 3 e consistência 60%. A assinatura 28-gene refinado ainda alcançado ~ 80% de precisão de classificação (Figura S4). Deve notar-se que 39 conjunto de dados utilizado um sistema de microarranjos de idade de Affymetrix FL 6800 chip de gene com um total de 7,289 sondas. O número de sondas utilizadas nos dois agrupamento acima análises para o conjunto de dados 39 foram de 72 e 19, correspondendo a 59 e 15 genes, respectivamente.

tecidos normais foram marcados tecidos pretos e tumorais foram marcados a vermelho. As amostras estão agrupadas em três grupos: grupo I tumor compor de 57 tumores e 20 tecidos normais, compondo grupo normal de 11 tumores e tecidos normais 53, eo grupo tumor II composição de 112 tumor e 8 tecidos normais. Todos cancro do sistema nervoso central e mais de adenocarcinoma pancreático foram classificados em grupos de tumor I, enquanto todos leucemia e mais de linfomas foram classificados em grupos de tumor II. A precisão da classificação é de 85%.

Discussão

DNA à base de microarray classificação gene-expressão permite uma avaliação objetiva e padronizada de diagnóstico oncológico e prognóstico e fornece informações complementares a clínica atual protocolos [20]. No entanto, tais estudos são geralmente específicas para certos tipos de câncer, e os perfis de expressão obtidos têm uso limitado devido à validação inadequada em grandes grupos de pacientes. Neste estudo, identificamos uma assinatura gene para a classificação do câncer molecular através de uma análise gene-expressão integradora de 20 tipos diferentes de câncer comum. Esta assinatura contém 187 genes cuja expressão aberrante foi observada em quase todas as amostras de tecido canceroso, independentemente do seu tecido de origem. Para ilustrar a utilidade e robustez desta assinatura, determinou-se o seu poder discriminativo em outros 19 conjuntos de dados completamente independentes. A precisão da classificação é de cerca de 92,6% usando esta assinatura câncer comum. Curiosamente, um subconjunto diferente de genes que são responsáveis ​​por 31-60% da assinatura 187 para o gene pode identificar com rigor os pacientes de cancro para uma ampla variedade de malignidades humanas. Mais importante ainda, esta assinatura também tem um bom desempenho na previsão de novos tipos de cancro que não foram representados na análise integrativa em conjuntos de dados de formação. Isto confirma que o assinatura identificado é independente do tipo de cancro e capturou algumas das características essenciais da transcrição e transformação neoplásica progressão em geral. No entanto, não se sabe se todas estas genes na nossa assinatura estão envolvidos no desenvolvimento do cancro. Alguns deles podem ser uma indicação de algo acontecendo no corpo que está acompanhando o processo da doença; enquanto outros são genes

pe se

que promovem tumorigênese e cancro progressão. Nós também comparamos a nossa assinatura com duas outras assinaturas em conjuntos de dados independentes que foram anteriormente utilizados nesses estudos [21], [22]. A precisão global de classificação correta usando a nossa assinatura é, em média, 95% variando de 90% a 100%; enquanto a precisão global de Rhode do e Xu é de 89% e 93%, respectivamente (Tabela S3). As duas assinaturas anteriores foram determinados a partir do mesmo conjunto de genes em uma única plataforma de microarray [21] ou genes comuns entre plataformas diferentes [22]. Os genes analisados ​​representam apenas um subconjunto de genes no genoma (cerca de 25%) e foram altamente sobre-representados em suas assinaturas; enquanto os outros genes que não são apresentados na plataforma analisados ​​ou não são comuns entre plataformas foram perdidas em suas assinaturas. No presente estudo, o método proposto para a determinação de assinatura gene é simples e independente de diferentes plataformas de microarray (por exemplo, vários chips de cDNA uncommercial e chips Affymetrix). Portanto, pode-se utilizar a informação de todos os genes de um estudo de microarray específica. Nosso estudo também destaca a importância do tamanho da amostra grande em microarrays análises para identificar e validar assinaturas prognósticos. Neste estudo, foram reunidas de um total de 2.186 amostras de 39 estudos independentes microarray para a descoberta e classificador de validação. Os resultados desta análise integrativa gene-expressão em larga escala deve ser mais robusto e confiável do que cada um dos estudos individuais potencialmente sub-alimentados.

Foram também identificadas várias vias comuns onde expressão alterada de vários genes agem de comum caminho para influenciar o desenvolvimento do tumor. Estas vias incluem as glicólise, checkpoint do ciclo celular II e PLK3 vias. Descobrimos que muitos dos genes dentro de cada uma vias foram regulados positivamente em vários tipos de tecidos de tumor, em comparação com tecidos normais. A perturbação da expressão de vários genes dentro destas vias podem ser uma característica comum de transformação neoplásica e progressão de tumores malignos. manipulação terapêutica destas vias pode fornecer uma estratégia universal para o tratamento de muitos tipos de cancro. Por exemplo, células de cancro muitas vezes gerar energia através da fermentação glicolítica em vez de fosforilação oxidativa. É possível que a falta de fosforilação oxidativa limita a produção de superóxido pró-apoptótica. Três enzimas do perfil 187 do gene, TPI, PGK1, e ENO1, que estão envolvidos na via glicolítica, também foram encontrados para ser significativamente sobre-expresso em HER-2 tumores da mama /neu-positivo [23]. Superexpressão dessas enzimas pode muito bem se relacionam com o aumento dos requisitos de ambas as vias de síntese /degradação de energia e proteína em tumores que crescem rapidamente. Esta via foi proposta a ser significativo na tumorigênese mais de 70 anos por Warburg [24].

Os genes identificados em nossa assinatura poderiam ser os principais alvos de terapia e prevenção do câncer, uma vez que estão desregulados em muitos tipos de Câncer. Caracterização desses genes comuns devem proporcionar oportunidades para elucidar alguns dos mecanismos mais gerais de iniciação e progressão do câncer. a terapia genética do cancro envolve classicamente entrega de supressor de tumor, apoptose, induzir ou genes suicidas directamente em células tumorais. Prisão de proliferação de células tumorais é o objetivo final da terapia antineoplásica. Curiosamente, nos nossos dados, os genes comuns identificados que estão envolvidas na regulação da proliferação celular são supra-regulados em diferentes tipos de tecidos do tumor (Tabela S2). Estes genes incluem TTK, SPP1, NME1, NAP1L1, NPM1 e TNFSF13b. A osteopontina (SPP1) é um gene que regula a proliferação celular. Muitos estudos têm demonstrado que SPP1 é altamente expresso em vários tumores malignos. Abundante secreção de SPP1 actua como um marcador de cancro da mama e cancro da próstata, osteossarcoma, glioblastoma, carcinoma espinocelular e melanoma [25]. As células de camundongos knockout SPP1 mostrar formação prejudicada colónia em agar mole e crescimento tumoral mais lenta

in vivo

em comparação com tumores em camundongos selvagens [26]. Na nossa análise de qRT-PCR, SPP1 foi sobre-expresso em 18 de 22 amostras de cinco tipos diferentes de tecidos tumorais (Figura 1). A análise tissue microarray ainda demonstrado que este aumento no nível de expressão de ARNm de SPP1 foi significativamente correlacionado com nível de proteína em pacientes com cancro (Figura 2). Assim, SPP1 pode ser um alvo comum promissora de terapia e a prevenção do cancro.

BH3-interagindo agonista domínio de morte (DD) e clusterina (CLU) são dois outros alvos terapêuticos potenciais que estão envolvidos na morte celular programada. BID contém apenas o domínio BH3, o que é necessário para a sua interacção com as proteínas da família Bcl-2 e para a sua actividade pró-morte. BID é suscetível a proteolítica clivagem por caspases, calpaína, granzima B e catepsinas [27]. BID é importante para a morte celular mediada por estas proteases e, portanto, é o sentinela para sinais de morte mediada por protease [28]. BID clivada pela protease é capaz de induzir várias disfunções mitocondriais, incluindo a libertação de proteínas do espaço inter-membranas, reorganização cristas, despolarização, transição de permeabilidade e geração de espécies de oxigénio reactivas. Assim BID é uma ponte molecular que liga várias vias de morte periférica à via mitocôndria central. Estudos recentes indicaram ainda que o BID pode funcionar como mais do que apenas uma molécula assassino pró-apoptótica. BID não só promove a progressão do ciclo celular na fase S, mas também envolve a manutenção da estabilidade genômica, envolvendo em postos de controle mitóticas [27]. Esta proteína tem diversas funções que são importantes tanto para a vida e a morte da célula. Um estudo recente mostrou que a oferta aumentada em tumores cerebrais, gliomas, cancro da próstata, cancro do ovário e cancro do cólon [29]. CLU é uma glicoproteína sulfatado, implicado em várias funções celulares envolvidos na carcinogénese e na progressão tumoral, incluindo regulação do ciclo celular, a adesão celular, a reparação do ADN e apoptose. Vários estudos mostram muito reduzida expressão de CLU em tumores em comparação com o tecido normal, incluindo tumor testicular, Von Hippel-Lindau (pVHL) tumor renal -defective, carcinoma de células escamosas do esôfago [30] – [34]. A redução do nível global CLU aparece porque os compartimentos do estroma positivos CLU de mucosa normal são perdidos em tumores [35]. CLU desempenha um papel negativo na proliferação de células epiteliais e a falta de CLU aumenta a susceptibilidade a tumorigénese após desafio carcinogénico. A sub-expressão de CLU foi imediatamente aparente em células de adenocarcinoma de próstata MD PR317 altamente malignas utilizando a técnica de microdissecção a laser e análise de série da expressão genética [36]. Tanto o nosso microarray QRT-PCR e tecido análises confirmaram a regulação positiva da proposta e de regulação negativa da CLU na maioria dos tecidos cancerosos (Figura 3).

As células estaminais são muito mais rapidamente as células do embrião, que se dividem e se diferenciam para formar órgãos e tecidos maduros. Um pequeno número de células-tronco normais persistir na idade adulta e função para manter e reparar tecidos saudáveis. Estabeleceu-se recentemente que, como tecidos normais, tumores humanos são iniciadas e mantidas por células estaminais. células-tronco cancerosas existir como uma população minoritária dentro do tumor e compartilham muitas características genéticas e biológicas de células-tronco normais. Alguns genes sobre-expressos em tecidos de cancro identificados na nossa assinatura foram encontrados altamente expresso em células estaminais embrionárias. Por exemplo, EPR, NPM1, STAT1 e LSM4 são expressos superior em linhas de células estaminais embrionárias humanas em comparação com o ARN humano universal [37], [38]. CCNB1, FBXO2, NMe2, SNRPF, DDX21, SLC38A4, PSMA2, PSMA3 e AP1S2 também são expressos maior em linhas de células estaminais embrionárias humanas [37], [38], os membros dessas famílias de genes tais como CCNB2, FBXO32, NME1, SNRPB, DDX39, SLC38A1, PSMA4, PSMA7 e AP1S1 são observados em nossa assinatura. Particularmente, dois genes em nossa assinatura, DNMT1 e TAPBP, estão listados na SuperArray GEArray Série S estaminais humanas conjunto de genes celular, que se destina ao perfil da expressão de genes que se sabe serem importantes para a identificação, o crescimento e diferenciação de células estaminais (Catálogo número HS-601,2, Superarray, Frederick, MD; https://www.superarray.com/home.php). Nossa assinatura gene também inclui vários genes relacionados com o desenvolvimento de tecidos, tais como regulação do processo de desenvolvimento (FNDC3B, SPP1 e TTL), o desenvolvimento embrionário (ADAM10) e desenvolvimento de órgãos (NCL, SPP1, SFXN1, BAX, ADAM12, NRP2 e NME1) ( https://fatigo.bioinfo.cnio.es).

Em resumo, nós definimos um preditivo assinatura gene do cancro independente do tipo de estatuto de câncer para uma ampla variedade de tumores malignos humanos. Esta assinatura tem capturado a transição de transcrição essencial do comportamento celular normal para o crescimento descontrolado de células em tumores malignos e, portanto, tem implicações significativas no diagnóstico de câncer, prognóstico e terapia. Esses genes devem provar aplicável não só para entender o mecanismo molecular comum de câncer e diagnóstico de câncer, mas também servem como alvos moleculares potenciais também.

Materiais e Métodos

coleta e processamento de dados

conjuntos de dados de microarrays foram obtidos a partir de bases de dados públicas. Os dados eram de dois tipos gerais, dados dupla relação de canal correspondente a cDNA microarrays manchados e dados de intensidade de canal único correspondentes a microarrays Affymetrix. Trinta e nove estudos tiveram 634 normal e 1.552 amostras de câncer no total (Tabela S1). Todos estes estudos anteriores de microarray foram originalmente concebidas para a identificação de genes expressos diferencialmente entre os tecidos normais e malignas do tumor para o tipo específico de cancro. Os laudos foram a base para classificar os tumores normais e tecidos tumorais, e benignas e malignas nos estudos. Os conjuntos de dados 1-20 que representam 20 diferentes tipos de cancro comuns, tais como o da bexiga, da mama, do cólon, do endométrio, rim, fígado, pulmão, melanoma, linfoma, do pâncreas, da próstata e cancro da tiróide foram usadas para identificar genes comuns de cancro e caminhos, e conjuntos de dados 21 -39 foram usadas para validação extensa. Os conjuntos de dados de treinamento escolhidos foram normalmente maiores do que os conjuntos de dados de validação, exceto vários conjuntos de dados muito recentemente divulgados. Todos os valores de expressão de base foram de dois log transformado. Para facilitar a análise de multi-estudo, nomes e ID do cluster de genes UniGene foi atribuído a todos os clones de ADNc e sondas Affymetrix com base no NCBI Unigene construir 198 (https://www.ncbi.nlm.nih.gov/entrez/query. fcgidbunigene).

Detecção de genes diferencialmente expressos

Nós utilizados permutação de duas amostras

t

teste para identificação de genes diferencialmente expressos (degs), que foi implementado em R Permax pacote (https://www.r-project.org/), para cada um dos conjuntos de dados 1-20.

Deixe uma resposta