PLOS ONE: genes diferencialmente expressos e Vias assinatura da próstata humana Cancer

Abstract

tecnologias genômicas, incluindo microarrays e sequenciamento de última geração permitiram a geração de assinaturas moleculares do câncer de próstata. As listas de genes expressos diferencialmente entre os estados malignos e não malignos são pensados ​​para ser fontes férteis de biomarcadores putativos de cancro da próstata. No entanto, tais listas de genes expressos diferencialmente podem ser altamente variável para múltiplas razões. Como tal, olhando para expressão diferencial no contexto de conjuntos de genes e vias tem sido mais robusto. Usando a próxima geração de dados de sequenciamento do genoma da The Cancer Genome Atlas, expressão gênica diferencial entre idade e stage- tumores de próstata humanos combinados e amostras não-malignas foi avaliado e usado para criar uma assinatura via de câncer de próstata. Para cima e para baixo genes regulados foram designados para percursos compostos por grupos curadoria de genes relacionados a partir de vários bancos de dados. O significado destas vias, em seguida, foi avaliada de acordo com o número de genes diferencialmente expressos encontrados na via e a sua posição no interior da via utilizando Gene Conjunto de Análise de Enriquecimento e análise de impacto via de sinalização. O “fator transformador de crescimento beta sinalização” e “Ran regulação da mitose formação do fuso” caminhos estavam fortemente associados com câncer de próstata. Várias outras vias significativas confirmam os achados de dados microarray que sugerem regulação do citoesqueleto de actina, ciclo celular, a sinalização da proteína quinase ativada por mitógeno, e sinalização de cálcio também são alterados no câncer de próstata relatado. Assim temos demonstrado viabilidade de análise de caminho e identificou uma área pouco explorada (Ran) para investigação na patogênese do câncer de próstata

Citation:. Myers JS, von Lersner AK, Robbins CJ, Sang Q-XA (2015) diferencialmente expressos genes e vias de assinatura de cancro da próstata humano. PLoS ONE 10 (12): e0145322. doi: 10.1371 /journal.pone.0145322

editor: Jian Cao, Stony Brook University, United States |

Recebido: 14 Outubro, 2015; Aceito: 02 de dezembro de 2015; Publicação: 18 de dezembro de 2015

Direitos de autor: © 2015 Myers et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Disponibilidade de dados: Todos os dados relevantes estão dentro do papel e seus arquivos de suporte de informação

Financiamento:. Este trabalho foi parcialmente apoiado pela Leslie N. Wilson-Delores Auzenne graduação de assistente para as Minorias adjudicados a JSM pela Graduate School Universidade Estadual da Flórida, a Research Programa de experiência de Mulheres em matemática, Ciência e Engenharia de Florida State University para AKVL e doações da Universidade do Estado da Flórida e uma cadeira dotada Professorship em Cancer Research de doadores anônimos para QXAS. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

Competir interesses:.. Os autores declararam que não existem interesses conflitantes

abreviações :, o antígeno PSA específico da próstata; Degs, genes diferencialmente expressos; MAPK, mitogen activated protein quinase; TGF-β, factor de crescimento transformante-beta; TCGA, The Cancer Genome Atlas; FDR, a taxa de descoberta false; PANTHER, análise de proteínas através de relações evolutivas; GO, Gene Ontology; GSEA, Gene Set Análise de Enriquecimento; KEGG, Enciclopédia Kyoto de genes e genomas; SPIA, sinalizando Análise de Impacto Caminho; ES, pontuação enriquecimento; NES, pontuação enriquecimento normalizada; PNDE, probabilidade de sobre-representação; pPERT, a probabilidade de perturbação

Introdução

O câncer de próstata é o segundo câncer mais diagnosticado entre os homens americanos, com mais de 220.000 novos casos previstos em 2015 [1]. antígeno específico da próstata (PSA) tem sido a pedra angular do rastreio do cancro da próstata ao longo de décadas. No entanto PSA não é um biomarcador ideal e uso generalizado de PSA-rastreio está caindo em desuso [2-4]. Dependência de rastreio PSA é problemático porque falsos positivos resultar de hiperplasia prostática benigna ou prostatite e porque PSA não consegue discriminar doença indolente, levando ao excesso de diagnósticos. A expansão da tecnologia e metodologia de genômica e proteômica melhorou a caracterização da biologia do tumor, conduzindo a busca de biomarcadores de câncer mais precisos. diferenças expressão gênica e protéica entre tecidos normais e malignas da próstata têm sido bem documentadas e servem como uma piscina para, biomarcadores putativos de diagnóstico prognóstico e estratificação de risco [5-24]. As mutações genéticas, alterações epigenéticas, e as mudanças de expressão microRNA que ocorrem no início e progressão do câncer também têm sido estudados com o objetivo de descoberta de biomarcadores [25-29]. No entanto, continuam a existir vários obstáculos substanciais na implementação do biomarcador. Baixa reprodutibilidade através laboratórios, as diferenças de plataformas e de técnicas experimentais, a heterogeneidade inerente de câncer de próstata, e utilidade clínica insignificantes ou pequenos ganhos de sensibilidade e especificidade para além PSA dificulta a identificação, validação e implementação de biomarcadores [30-35].

os trabalhos anteriores focado na seleção e validação de genes individuais como biomarcadores. No entanto, a heterogeneidade do cancro da próstata faz com que seja extremamente improvável encontrar um único gene que é um marcador representativo [36]. Rastreio painéis formados pela combinação de vários genes foram utilizados para aumentar o poder preditivo para a detecção do cancro, reincidência, recidivas, e sobrevivência para além da utilização de PSA ou Gleason sozinho [37-40]. O sucesso da abordagem do painel de biomarcador é evidenciado pelo lançamento comercial de vários testes de rastreio que têm encontrado utilidade clínica: ProMark [41], Oncotype DX [42], Prolaris [43], e decifrar [44]. Estes painéis podem ser puxado a partir de estudos classificações moleculares que usam a expressão diferencial para criar uma assinatura para o câncer.

No entanto classificações moleculares e assinaturas de genes não são sempre estáveis ​​no sentido de que várias assinaturas podem ser encontrados para cancros. Grandes discrepâncias entre as listas de genes diferencialmente expressos (degs) a partir de dados de microarranjos foram destacados [45]. Em alguns casos, a sobreposição entre os conjuntos de dados de microarray era tão baixa quanto 5% [46]. Assim, para cada conjunto de degs, uma assinatura diferente poderia ser encontrado. Assim biomarcadores seleccionados a partir destas listas iria realizar com variados graus de sucesso. Tomando a lista de degs e correlacionando-os com um marcador de prognóstico pode gerar uma mais útil piscina biomarcador putativo porque então apenas genes correlacionados com o prognóstico incluiria a assinatura molecular. No entanto, Ein-Dor

et al

. mostrou que no cancro da mama, não houve único, único conjunto de genes previu que a sobrevivência porque alterando a população de pacientes podem produzir vários conjuntos de genes de capacidade igual prognóstico na predição de sobrevivência [33]. Além disso, a correlação com a sobrevivência não era necessária para a capacidade de prognóstico [33]. Por isso, é provável que muitos painéis de excluir um número de outros genes que poderiam ser potenciais biomarcadores porque o painel foi derivado a partir de um corpo de amostras (embora possa ser grande) e considerou apenas as correlações mais fortes.

Uma abordagem alternativa é a análise baseada em percurso. Na análise de via, um conjunto de genes relacionados a partir da mesma via ou de rede de interacção é avaliada em vez de análise de um grupo de genes não relacionados que, potencialmente, optimizar a sensibilidade e a selectividade de diagnóstico ou prognóstico. Há aumento da sobreposição entre dados no nível via comparação com sobreposição entre listas de degs [46, 47]. análise de caminho não negligenciar a natureza cooperativa de genes e considera que muitas vezes os genes envolvidos no mesmo processo são frequentemente desregulado juntos. Ao olhar para o caminho, pequenas variações na instrumentação ou método são menos propensos a impactar os resultados, levando a resultados mais consistentes entre os diferentes conjuntos de dados [48]. Assim, a abordagem via produz resultados mais robustos, melhora a classificação da doença, e pode revelar novos insights sobre uma doença [49-51]. Um tipo de análise via inicia-se com um gene expresso diferencialmente e correlaciona-se a expressão de genes envolvidas na mesma via ou processo semelhante, com um resultado de diagnóstico ou de prognóstico em particular [52-54]. A iteração semelhante começa com um percurso de conhecida importância na iniciação ou progressão do câncer e avalia o poder prognóstico dos seus componentes individuais. Isto foi feito por via da proteína quinase activada por mitogénio (MAPK) [55], Akt [56], mTOR [57, 58], via de sinalização de Toll-like receptor [59], e outros assinaturas oncogene [60].

neste documento, a expressão genética global no câncer de próstata humano foi caracterizada usando uma abordagem via imparcial. Em seguida a geração de sequenciação foi usada para obter um perfil de as diferenças na expressão de ARN entre tumores humanos e de tecidos não-malignas de pacientes. análise de caminho incluído Gene Set Análise de Enriquecimento e Análise de Impacto via de sinalização. Dois caminhos foram significativamente associados com próstata humana tumors- “Ran regulação da formação do fuso mitótico” via e “fator transformador de crescimento beta (TGF-β) de sinalização” via.

Materiais e Métodos

dados de sequenciamento RNA

Nível 3 de dados identificada-de para amostras de câncer de próstata e todas as amostras não-malignas disponíveis para estes pacientes com câncer de próstata foi descarregado a partir do portal de dados Cancer Genome Atlas (TCGA) (https: //tcga- data.nci.nih.gov). Nível 3 descreve os dados que foram processados ​​e agregados para dar sinais de expressão de genes para uma amostra. Para cada amostra, os dados contêm contagens de expressão para até 20.531 codificação e não-codificante transcrições de RNA mais informações clínicas, tais como idade, estágio, a pontuação de Gleason, o nível de PSA, e raça /etnia. Antes da análise, tumor e amostras não-malignas foram aleatoriamente puxado para conseguir uma piscina equivalente em idade e estágio de 225 amostras (S1 tabela). Foram analisados ​​um total de 173 amostras de câncer de próstata e 52 amostras não-malignas de 204 pacientes únicas. A informação clínica do paciente é apresentado na Tabela 1.

Gene Expression Diferencial

O ambiente de programação R (versão 3.1.2) [61] foi usado para processar dados brutos, execute estatística cálculos, e realizar análise de expressão diferencial. Depois de idade e estágio de correspondência, 393 transcrições foram removidos porque não tinham expressão nas 225 amostras que compõem o conjunto de dados. As contagens de ARN para os restantes 20.138 transcritos foram arredondados para o número inteiro mais próximo e compilados em uma matriz para construir o conjunto de dados. A magnitude de expressão muda com relação às amostras não-malignas, também foi calculada tomando a base 2 logaritmo da razão de expressão tumor /não-malignas média. Para genes com nenhuma expressão em amostras tanto o tumor ou não-malignas, o log

2 mudanças de dobra foram ajustados adicionando um para cada média e, em seguida, o cálculo da relação. Todos os log

2 valores mencionados são valores após tais ajustes. mudanças dobra negativos indicados infra-regulação em amostras de tumor enquanto os valores positivos indicam aumento da regulação. O pacote DESeq2 R (versão 1.6.3) [62] foi usado para identificar degs nos dados de ARN TCGA paciente. A computação foi feito no Cluster Florida State University High Performance Computing. DESeq2 devolvido um valor P determinado por meio de estatística Wald e uma P-valor ajustado (valor-Q) para corrigir para as comparações múltiplas de teste utilizando o método de Hochberg-Benjamini para determinar a taxa de detecção falsa (FDR). Degs foram definidos como genes diferentes com um FDR menos de 1% (Q 0,01).

Para avaliar a significância dos degs identificados, foram realizadas análises para procurar vias de sobre-representados, o enriquecimento conjunto de genes e de sinalização impacto percurso. Em primeiro lugar, elementos sobre-representadas foram identificados entre os degs. A análise de proteínas através de relações evolucionárias ferramentas (Panther) sistema de classificação e análise foram usadas para categorizar degs por classe de proteína PANTHER, Gene Ontology (GO) Função Molecular, e GO Processo Biológico, em seguida, determinar se alguma dessas classes ou ir termos foram sobre-representados [ ,,,0],63]. A sobre-representação Teste PANTHER (liberação 20.150.430) foi utilizada para pesquisar os dados no banco de dados PANTHER (PANTHER versão 10.0 Lançado 2015/05/15) eo banco de dados GO (Lançado 2015/05/09) para identificar tanto as classes de proteínas ou VÁ anotações sobre-representadas nos nossos dados quando comparado com um genoma de referência humano. Os valores P foram ajustadas usando uma correcção de Bonferroni.

Pathway Analysis

Gene Conjunto de Análise de Enriquecimento de (AGEE) [64] foi usado para identificar os grupos de genes enriquecidas quer no tumor ou não maligna condição. A ferramenta de análise GSEA (versão 2.2.0) foi baixado do site do Instituto Broad (https://www.broadinstitute.org/gsea/index.jsp). conjuntos de genes com curadoria de BioCarta e Reactome vias foram baixadas a partir de assinaturas moleculares de banco de dados do Instituto Broad. Um conjunto de genes adicional foi construído a partir de Kyoto Encyclopedia of Genes e vias Genomas (KEGG) [65]. Foram excluídos os caminhos com o menor relevância para o câncer de próstata. As vias KEGG incluídos na análise estão listados na Informação de Apoio (S2 Tabela). A matriz de contagem de expressão de ARN total foi carregado para a aplicação GSEA sem limitar a entrada de apenas degs. Ambos os pequenos ( 5 genes) e grandes ( 500 genes) conjuntos de genes foram excluídos da análise

via de sinalização Análise Impacto (SPIA) foi utilizado para avaliar a importância das vias enriquecida em termos do seu. impacto e capacidade de ativar ou inibir um caminho [66]. SPIA análise foi realizada utilizando o pacote de R “SPIA” (versão 2.18.0) [67]. IDs do Entrez, ingresse

2 mudanças de dobra, e valores de Q para todos os genes foram compilados. A expressão diferencial de corte utilizado no algoritmo SPIA baseou-se o Q-valor FDR-ajustado. A análise foi executado usando a mesma lista personalizada de vias como usado no GSEA (S2 Table) e versões atualizadas desses caminhos eram de download antes de executar a análise (acessada 2015/07/29).

Resultados

Usando um FDR 1% (Q 0,01), análise DESeq2 marcou 11,115 genes e transcrições como estatisticamente diferentes entre amostras de tumores e amostras não-malignas no nosso TCGA conjunto de dados (Tabelas S3 e S4). Este abrange 55% dos genes sequenciados e transcrições. O número de genes e transcritos regulados para baixo totalizaram 5.379 eo número de up-regulada genes e transcrições totalizaram 5.736. No geral, as maiores alterações observadas estavam na sub-regulação de genes e transcritos (Figura 1). A magnitude do aumento da regulação de genes e transcritos foi menor do que a magnitude de genes regulados para baixo e a gama de expressão também foi menor. Os vinte mais regulada e os vinte maioria dos genes up-regulamentados são apresentados na Tabela 2 e Tabela 3.

Neste gráfico de dispersão unidimensional a magnitude das mudanças de expressão de genes representados por log

2 vezes índices são mostrados. Cada ponto representa um gene ou transcrito. Significativamente genes e transcritos diferencialmente expressos são mostrados como diamantes vermelhos sólidos.

Classificação e Análise de Sobre-representação

Os 11,115 degs foram agrupados de acordo com a classe de proteínas PANTHER, GO Função molecular e anotações de processos GO Biológicas. Um total de 6.254 degs tinha uma ou outra classe de proteínas PANTHER, GO Processo Biológico, ou ir anotações função molecular e foram ainda classificados. O agrupamento por classe de proteínas e GO categorias processo biológico provou ser o mais informativo (Figura 2). As classificações completas podem ser encontradas na informação de suporte (S5 Tabela). Os degs representam uma vasta gama de classes de proteínas envolvidas numa vasta gama de processos. A classe de proteínas PANTHER “Nucleic Acid Binding” inclui tanto RNA e proteínas de ligação de ADN, nucleases, e helicases. A classe de proteína “Fator de Transcrição” é sub-categorizados por motivo estrutural e também contém co-fatores e receptores hormonais nucleares. Proteases e fosfatases são encontrados dentro da classe de proteínas “hidrolase”. Os tipos de “receptor” incluídos são os receptores da proteína quinase, receptores de hormonas nucleares, receptores de citoquina, canais iónicos dependentes de ligandos e receptores acoplados à proteína G. A categoria “Enzima Modulador” caracteriza proteína G, cinase, fosfatase, e moduladores de protease. Curiosamente, as categorias foram geralmente não predominantemente povoadas por genes ou transcrições regulada para baixo ou up-regulada. Para todas as classes de proteínas, com excepção da classe “Nucleic Acid Binding”, degs foram distribuída de maneira uniforme do tumor e amostras não-malignas. Na classe de proteínas “Nucleic Acid Binding”, havia quase uma vez e meia o maior número de genes up-regulamentados como sub-regulada. A abundância de genes de ligação de ácido nucleico alterado sugere actividade de transcrição em amostras de tumor.

(A) “Nucleic Acid Binding” inclui ADN e ARN de ligação, nucleases, e helicases. “Fator de Transcrição” inclui dedo de zinco, hélice-volta-hélice, a caixa de grupo de alta mobilidade, a hélice-volta-hélice, e fatores básicos de transcrição de fecho de leucina; cofatores; e receptores de hormonas nucleares. “Hidrolase” refere-se a proteases, fosfatases, esterases, lipases, desaminases, fosfodiesterases, glicosidases, desacetilases, pirofosfatases, glucosidases, galactosidases, e amilases. “Receptor” inclui os receptores da proteína quinase, receptores de hormonas nucleares, receptores de citoquina, canais iónicos dependentes de ligandos e receptores acoplados à proteína G. “Enzima Modulador” inclui proteína G, cinase, fosfatase, e moduladores de protease. (B) “processo metabólico” caracteriza hidrato de carbono, aminoácido celular, de lípidos, proteínas, e do metabolismo composto contendo nucleobase; e o ciclo do ácido tricarboxílico. Categorias “processo celular” são sinalização célula-célula, do ciclo celular, o crescimento e a proliferação, os movimentos do componente celular, e citocinese. “Regulação biológica” inclui a regulação da apoptose, metabolismo, ciclo celular, tradução, atividade catalítica e homeostase. Categorias “Developmental processo” são o sistema, ectoderma, mesoderme e endoderme desenvolvimento; a diferenciação de células; morte; estrutura anatômica morfogênese; desenvolvimento do embrião; determinação do sexo; e processos de especificação padrão. “Localização” inclui proteínas de transporte, proteínas e processos de localização RNA.

O Processo GO Biológica dois mais abundantes Grupos- “processo metabólico” e “processo celular” -são não é surpreendente, porque estes contém genes estão envolvidos no mais básico dos processos da vida. De facto, as alterações metabólicas têm sido amplamente documentada em tumores [68-70]. O aumento das necessidades energéticas e de biossíntese de células cancerosas proliferam muitas vezes são satisfeitas através de desregulação metabólica [71-73]. O título “processo metabólico” inclui o metabolismo de carboidratos, metabolismo de aminoácidos celular, metabolismo lipídico, metabolismo composto contendo nucleobases, metabolismo de proteínas, e o ciclo do ácido tricarboxílico. “Processo celular” inclui sinalização célula-célula, do ciclo celular, o crescimento e a proliferação, os movimentos do componente celular, e citocinese. “Regulação biológica” inclui a regulação da apoptose, metabolismo, ciclo celular, tradução, atividade catalítica e homeostase. A categoria “processo de desenvolvimento” incorpora sistema, ectoderme, mesoderme, e endoderme desenvolvimento, bem como diferenciação celular, morte, morfogénese estrutura anatómica, o desenvolvimento embrionário, a determinação do sexo, e padrão de processos de especificação. “Localização” refere-se a proteínas de transporte gerais e processos de proteína e localização RNA específicas.

Estatística de sobre-representação do PANTERA foi usado para calcular a probabilidade de que as classes e de proteínas de alta densidade populacional GO agrupamentos entre os degs iria ocorrer por acaso. Com efeito, muitas das categorias mais abundantes estão sobre-representados em dados quando comparado com um genoma de referência (Tabela 4). A proteína mais abundante três classes: “Nucleic Acid Binding”, “factor de transcrio”, e “hidrolase” -foram enriquecido juntamente com as classes “Transferase” e “transportador”. Os cinco processos GO Biológicas mais populosas também foram enriquecidos: “processo metabólico”, “processo celular”, “regulação biológica”, “Localização”, e “processo de desenvolvimento”. O “multicelular Organismo de Processo”, “Adesão Biológica”, “Cellular Organização Componente ou Biogenesis”, e “Processo Immune System”, vêm os processos biológicos também foram enriquecidos. Finalmente, cinco dos seis principais funções GO moleculares foram enriquecidos: “Ligação”, “atividade catalítica”, “Nucleic Acid Binding Fator de Transcrição Activity”, “Atividade Transporter”, e “estrutural Molecule Activity”

Gene Set análise de Enriquecimento

uma limitação de uma análise de classe ou caminho sobre-representação é que ele não indica que condição está associada com a sobre-representação; GSEA faz. genes expressos foram classificados por sua correlação com o fenótipo maligno e, em seguida, esta lista foi comparado com conjuntos de genes em uma via, ligando o enriquecimento caminho para um fenótipo. Os genes mais altamente correlacionados em um conjunto de genes, maior o significado de que conjunto de genes. Os conjuntos de genes com as maiores pontuações de enriquecimento normalizados são apresentados na Tabela 5 e outros resultados estão listados na informação de suporte (S7 Tabela). O ponto de corte FDR foi fixado em 25% para maximizar a geração de hipóteses. Apenas uma via foi enriquecida nas amostras de tumor, o “RanMS via”, que inclui os genes que regulam a formação do fuso mitótico durante a divisão celular. Dez genes na nossa lista de degs pertencia a esta via, contribuindo cada um para o seu enriquecimento no fenótipo maligno (Tabela 6). Todos os dez foram diferencialmente expressos e supra-regulados em amostras malignas. Os percursos restantes foram enriquecidas no fenótipo não-maligno. A via mais significativo enriquecido no fenótipo não-maligno foi a via de “sinalização de cálcio”. Enriquecimento da via de sinalização de cálcio era devido a degs 81 e 19 outros genes ou transcritos (S8 tabela). Também enriquecido no fenótipo não-maligno várias outras vias de sinalização (oxitocina, prolactina, AMPc, MAPK, o cGMP-PKG, o TGF-β, Hipopótamo, e Ras) e vias relacionadas com a célula-célula e célula-matriz aderência (matriz extracelular receptor interação, a regulação do citoesqueleto de actina, proteoglicanos, e adesão focal).

via de sinalização Análise de Impacto

SPIA considera ou não as degs encontrados em uma via têm um impacto significativo dentro que via e, assim, elimina a topologia de degs em vias [66]. Em outras palavras, a via de significância é parcialmente dependente se o número de degs observados num percurso é maior do que o observado por acaso. Este é capturado na probabilidade de sobre-representação. significância via também é, em parte, com base em se degs em um caminho particular, são cruciais nos cruzamentos e pode, assim, perturbar o percurso. Esta é a probabilidade de perturbação. Estas duas probabilidades estão combinadas em uma probabilidade global, que é ajustado pela taxa de detecção falsa. Esta métrica ajustado foi usada para avaliar o impacto das vias. Muitas das mesmas vias foram identificados como significativos em ambos GSEA e análise SPIA (Tabela 7). De facto, os resultados mais significativos 8 da via de SPIA foram todos significativamente enriquecidos em GSEA. No entanto, apenas a via “sinalização de cálcio” foi altamente classificados em ambas as análises. A única via ativada na condição maligna foi a via de “sinalização de TGF-β” (Tabela 8). Os outros percursos foram todos inibida na condição maligna. Semelhante aos resultados GSEA, diversas vias de sinalização (oxitocina, AMPc, MAPK, o cGMP-PKG, o TGF-β, Hipopótamo, Rap1, ErbB, e Ras) e vias relacionadas com célula-célula e adesão célula-matriz (proteoglicanos, adesão focal, e regulação do citoesqueleto de actina) foram impactados. Imagens das vias com degs iluminada pode ser acessada na informação de suporte (S9 Tabela).

Discussão

estudos de expressão globais documentaram muitos genes diferencialmente expressos em próstata humana câncer [7, 9, 13-15, 96-102]. Lucas e Heath compilou uma lista de genes diferencialmente expressos com significado prognóstico relatado no câncer de próstata [30]. Dos 22 genes listadas, 19 foram diferencialmente expressos em nosso conjunto de dados TCGA e houve acordo em padrão de expressão entre os 12 genes.

PTEN

,

TMPRSS2

,

MYC

,

SMAD4

,

EZH2

,

p53

,

BCL2

,

NPY

,

PLA2G7

,

Ki-67

,

p16

, e

expressão BAX

em nossos resultados combinados que foi apresentada na literatura.

PTEN

, um supressor de tumor, foi regulada para baixo em amostras malignas. A supressão do

PTEN

correlaciona-se com maior grau de Gleason, risco de progressão e recorrência após a terapia, e avançado localizada ou doença metastática e da morte [103, 104].

SMAD página 4 foi regulada para baixo em nossos dados de câncer de próstata TCGA e também tem sido encontrado para ser regulada em cancros da próstata, incluindo tumores avançados [105, 106]. A supressão deste gene levou a cânceres de próstata invasivos, metastáticos e letais em um modelo de rato [39].

TMPRSS2

foi regulada e isso está de acordo com relatórios de ele ser mais altamente expressos no carcinoma da próstata em comparação com o epitélio normal da próstata [107, 108].

TMPRSS2

contribui para a invasão e metástase de câncer de próstata [109]. Além disso,

TMPRSS2-ERG

gene de fusão é uma promessa como um potencial biomarcador de câncer de próstata [110].

MYC

também foi regulado para cima neste conjunto de dados ea superexpressão (amplificação do gene, mRNA, e aumento de proteína) de

MYC

no câncer de próstata está bem documentado [111-115].

MYC

amplificação do gene foi encontrado mais frequentemente em metástases [116, 117] e também se correlacionou com fatores de mau prognóstico, como maior Gleason e os escores histopatológicos [118], ou maior probabilidade de recorrência PSA [114].

EZH2

regulação up-é relatado aqui e na literatura, onde tais superexpressão levou ao aumento da proliferação nas células da próstata e está associada com doença agressiva e maior risco de recorrência [119]. A expressão de

p53

ARNm foi maior em amostras malignas nos dados TCGA. Num estudo de pacientes com cancro da próstata,

p53

expressão positiva foi observada na maioria (69,1%) dos pacientes com o número de pacientes positivos aumenta à medida que palco e Gleason pontuação aumentada. P53 também foi um preditor independente de recorrência [120].

BCL2

expressão de mRNA foi diminuída em amostras de tumor TCGA. A ausência da expressão da proteína bcl-2 está relatado no cancro da próstata [120, 121]. Além disso, BCL-2 expressão é negativa em dependentes de androgênio, mas aumentou em hormona cancros da próstata insensível [122-124] e correlacionados com mau prognóstico [125]. Pro-neuropeptídeo Y foi regulado para cima neste estudo e na literatura [126, 127]. Pro-neuropéptido Y-regulação está associada com tumores não agressivos [128] e regula a proliferação em linhas celulares de cancro da próstata [129].

PLA2G7

foi regulada em nossos dados. Relata-se a ser mais altamente expresso no cancro da próstata em comparação com amostras benignas [130, 131] e as amostras TCGA aqui estudadas. Os níveis de

Ki-67 ARNm foram

aumentada no tumor contra amostras não-malignas de nossos dados TCGA e na literatura em comparação com o tecido normal [132]. Além disso proteína Ki-67 é aumentada no cancro da próstata [133-136], metástases de cancro da próstata [137, 138] e é um marcador prognóstico útil [139]. Em nossa lista de degs,

p16

foi regulado para cima. Recentemente, a expressão de p16 foi encontrado em uma grande maioria dos tecidos da próstata [140].

BAX

expressão de mRNA foi aumentada neste conjunto de dados TCGA e proteínas BAX tinha aumentado expressão no câncer de próstata [141].

Os restantes 7 degs em comum com lista de Lucas e Heath exibida uma discrepância na expressão padrão entre nossos resultados e na literatura.

TGF-β1

não foi diferencialmente expressos, mas

TGF-β2

foi regulada para baixo. Expressão de

TGF-β1

e

TGF-β2

foi aumentada no cancro da próstata em comparação com tecidos normais ou não malignos [142-147]. No entanto,

TGF-β3

foi regulada de acordo com outros relatos de

TGF-β3

expressão no câncer de próstata [97, 148]. Ambos α e ß isoformas de

IL-1 | e

IL-6

foram regulados negativamente neste conjunto de dados TCGA.

IL-1α

e

IL-6

foram regulados positivamente em amostras de câncer de próstata [149-153].

IL-6

estimulou o crescimento de células LNCaP [154] e elevado

IL-6

foi também associada a um mau prognóstico no câncer de próstata [149, 155-162].

IL-1β

tem sido relatada tanto para cima e para baixo-regulado na literatura. A expressão de proteínas em amostras de doentes foi regulada para baixo [163] mas gene elevada e a expressão da proteína em células de cancro humanas e tumores também tem sido relatada [164]. Em nossa lista de degs,

p21

foi regulada para baixo. Aaltomaa

et al

. a expressão da proteína p21 relatada na maioria dos tumores da próstata, mas não em células normais da próstata epiteliais [165], mas outros estudos relatados imunocoloração de p21 em apenas 20% -35% das amostras de cancro [166, 167]. Ambos

p21

e

p16

inibiu o crescimento em linhas celulares de cancro da próstata [168]. Endotelial vascular factor de crescimento A (

VEGF-A

) foi regulada para baixo em nossos dados. Alta expressão de

VEGF

correlacionada com mau prognóstico [169], mas alguns estudos relataram que a maior expressão de

VEGF-A

correlacionada com melhor resultado clínico [170].

TRAIL /TNFSF10

foi regulado para cima em nossos dados TCGA. Enquanto expressão epitelial de proteína TRAIL foi mais forte em tumores, expressão do estroma de TRAIL foi diminuído ou ausente nos tumores [171, 172]. Apenas a expressão de TRAIL estromal correlacionada com sobrevida livre de recidiva [171].

NFKB1

foi regulada para baixo em nossos dados. No entanto,

NFKB1

expressão da proteína aumentou progressivamente em tecidos normais hiperplasia prostática benigna e câncer de próstata [173]. Os outros degs com significado prognóstico no câncer de próstata que não foram diferencialmente expressos em nossa lista de degs incluem

IL-7

,

CCL-2

, e

CDH1

.

as comparações entre os degs aqui apresentadas e degs listados na outra variância estudos destaque de experiência para experiência.

Deixe uma resposta