PLOS ONE: Descoberta e validação de um câncer de próstata Genomic classificador que prevê precoce Metástase após prostatectomia radical

Abstract

Purpose

características clínico-patológicas e recidiva bioquímica são sensíveis, mas não específico, os preditores de doença metastática e câncer de próstata letal. Nossa hipótese é que uma assinatura de expressão genómica detectada no tumor primário representa verdadeiro potencial biológica da doença agressiva e proporciona uma melhor previsão de metástase precoce do câncer de próstata.

Métodos

A aninhados desenho caso-controle foi utilizada para selecionar 639 pacientes a partir do registo tumor Mayo Clinic que foram submetidos a prostatectomia radical entre 1987 e 2001. Um classificador genômica (GC) foi desenvolvido pela modelagem expressão do RNA diferencial utilizando 1,4 milhões de recursos de alta densidade matrizes de expressão dos homens enriquecido para aumento do PSA após a prostatectomia, incluindo 213 que sofreram metástase clínica precoce após o retorno da bioquímica. Um conjunto de treinamento foi usado para desenvolver um classificador Floresta aleatória de 22 marcadores para prever para casos – homens com metástase clínica precoce depois de subir PSA. Desempenho da GC foi comparado com fatores prognósticos como pontuação de Gleason e assinaturas de expressão gênica anteriores em um conjunto de validação retido.

Resultados

perfis de expressão foram gerados a partir de 545 amostras exclusivas de pacientes, com seguimento médio -se de 16,9 anos. GC atingiu uma área sob a curva ROC de 0,75 (0,67-0,83) na validação, superando variáveis ​​clínicas e assinaturas genéticas. GC era o único fator prognóstico significativo na análise multivariada. Dentro dos grupos de pontuação de Gleason, casos com pontuação alta GC experimentado a morte antes de câncer de próstata e reduziu a sobrevida global. Os marcadores no classificador foram encontrados para ser associado com um número de processos biológicos fundamentais em cancro da próstata metastático progressão da doença.

Conclusão

Um classificador genómico foi desenvolvida e validada numa grande grupo de pacientes enriquecido com pacientes com metástase de câncer de próstata e um aumento do PSA, que passou a experimentar a doença metastática. Este modelo de previsão metástase precoce com base na expressão genómica no tumor primário podem ser úteis para a identificação de cancro da próstata agressivo

citação:. Erho N, Crisan A, Vergara IA, Mitra AP, Ghadessi H, Buerki C, et ai. (2013) Descoberta e validação de um classificador Prostate Cancer Genomic que prediz precoce Metástase após prostatectomia radical. PLoS ONE 8 (6): e66855. doi: 10.1371 /journal.pone.0066855

editor: Chad Creighton, Baylor College of Medicine, Estados Unidos da América

Recebido: 04 de fevereiro de 2013; Aceito: 10 de maio de 2013; Publicação: 24 de junho de 2013

Direitos de autor: © 2013 erho et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este estudo foi apoiado em parte pelo National Research Council of Canada, Programa de Pesquisa de Assistência industrial (https://www.nrc-cnrc.gc.ca/eng/irap/index.html), eo CA91956 Mayo Clinic cancro da próstata SPORE P50 ( PI:. Donald Tindall Ph.D.) os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

Competir interesses: os autores leram a política da revista e têm os seguintes conflitos: NE, AC, IV, MG, CB, ZH, BZ, TS, TT, e ED são funcionários da GenomeDx Biosciences Inc. ED e TT estoque próprio em GenomeDx Biosciences Inc. ED recebeu financiamento para pesquisa da GenomeDx Biociências Inc. e o Conselho Nacional de Pesquisa – Programa de Auxílio à Pesquisa industrial. PB recebeu financiamento para pesquisa da GenomeDx Biosciences Inc. GK recebeu financiamento para pesquisa da Beckman Coulter. KB, EB, RC, SF, RK, RJ, e TK declararam que não existem interesses conflitantes. Isto não altera a adesão autores a todas as políticas de PLoS One sobre os dados e materiais de compartilhamento.

Introdução

Mais de 240.000 homens são diagnosticados com câncer de próstata em os EUA anualmente, ea maioria deles abrigam doença local ou regional, onde o prognóstico a longo prazo é excelente [1]. Cerca de metade desses homens submetidos a prostatectomia radical (RP) e quase 40% irá apresentar-se com uma ou mais características clínico-patológicas, como a alta pontuação de Gleason (GS), extensão extra-capsular (ECE), margens cirúrgicas positivas (SM +), seminal invasão das vesículas (SVI) ou envolvimento dos nódulos linfáticos (N +) que estão associados a maior risco de metástase clínica [2] – [4]. Embora apenas uma minoria desses homens são realmente em risco de morrer de seu câncer [5], muitos destes “clinicamente alto risco” os doentes receberão intervenções pós-operatórias adicionais (por exemplo, radiação adjuvante) e muitas vezes sofrem morbidade do tratamento. Por outro lado, muitos homens apresentam sem características clínicas adversas e ainda morrem de câncer de próstata. ferramentas atuais têm capacidade para identificar, no momento da RP, os homens que correm maior risco de metástase e morte por câncer de próstata limitada – tais pacientes são actualmente tratados agressivamente somente após a observação de aumento do PSA (Prostate Specific Antigen) ou recorrência bioquímica (BCR) . Ensaios clínicos recentes sugerem que estes pacientes provavelmente teria resultados mais favoráveis ​​se tratados cedo pós-RP [6] – [10]. Assim, o desempenho limitado de fatores clínicos para predizer os homens com maior risco de metástase permite retirar ilações gestão paciente.

Durante a última década, muitos estudos têm tentado resolver a necessidade clínica não satisfeita para prever câncer de próstata agressivo utilizando indivíduo biomarcadores ou assinaturas de expressão de genes [11] – [30]. No entanto, estes esforços anteriores não vi aplicação generalizada na prática clínica porque nenhum demonstraram de forma convincente uma melhor previsão sobre fatores clínicos estabelecidos, como o GS. Isto é principalmente devido a limitações no tamanho da amostra e poder, o longo acompanhamento clínico necessário para observar metastático ou eventos de câncer de próstata letal eo uso de BCR como um desfecho substituto; um sensível, mas não específica, preditor da progressão da doença [31]. Assim, a maioria dos estudos de biomarcadores amostra mal clinicamente comprovada casos agressivos de câncer de próstata. Além disso, a maioria das assinaturas de expressão de genes foram desenvolvidos com os ensaios que requeriam tecido fresco ou congelado, que não é rotineiramente disponíveis na prática clínica, e foram limitadas a perfilar genes codificadores de proteínas – que examinam apenas uma minoria do genoma activo (isto é, transcriptoma) . Em um relatório anterior, obtido de parafina fixado em formalina arquivado incorporado (FFPE) amostras de câncer de próstata primário do registro tumor Mayo Clinic, que incluiu um grande número de pacientes que desenvolveram doença metastática. Com a longo prazo acompanhamento constatamos uma assinatura biomarcador que poderia identificar os homens com risco de progressão para metástase clínica e câncer de próstata letal [20]. No entanto, na validação que não demonstrou uma melhoria significativa no desempenho em comparação com variáveis ​​clínicas e a hipótese de que isto pode ser devido ao foco limitado em um conjunto de cerca de 1.000 genes codificadores de proteínas.

Aqui nós expandimos esta obra por re-profiling os pacientes do estudo original utilizando um microarray de todo o transcriptoma de alta densidade que avalia a expressão de mais de 1,4 milhões de recursos de RNA, incluindo os ~22,000 genes codificadores de proteínas conhecidas, bem como muitos milhares de não-codificante RNAs. Tais RNAs não-codificantes são agora reconhecidos quanto à sua capacidade para regular a actividade de oncogenes e genes supressores de tumores envolvidos no desenvolvimento de recidiva e progressão da doença metastática [32], [33]. Nós apresentamos o desenvolvimento e validação de um classificador genômica (GC) para a previsão do risco de metástase clínica precoce, que é enriquecido em RNAs não-codificantes. Nós demonstramos que GC fornece informações prognóstico independente e estatisticamente significativo para além variáveis ​​clínico-patológicas e mostrar que GC ultrapassa o desempenho relatado anteriormente assinaturas genéticas.

Materiais e Métodos

População paciente e os resultados clínicos

os pacientes deste estudo foram selecionados utilizando um desenho de caso-controle aninhado a partir do Registro Tumor Mayo Clinic prostatectomia radical, como descrito anteriormente [20]. Em resumo, os pacientes que receberam a prostatectomia radical (RP) para o adenocarcinoma da próstata primária como primeira linha de tratamento na Clínica Mayo Comprehensive Cancer Center entre 1987 e 2001 foram retrospectivamente classificadas nos seguintes grupos de desfecho:

Não há evidência da doença (NED) progressão grupo

:. não apresentaram sinais clínicos bioquímicas ou outras de progressão da doença após RP, com pelo menos 7 anos de follow-up

antigénio específico da próstata (PSA) -recurrence grupo

: recorrência bioquímica experiente (BCR), definida como dois sucessivos aumentos de medições de PSA acima de 0,02 ng /ml (com a medida subsequente de 0,05 ng /mL acima da primeira medição) sem metástases clínica detectável (ver abaixo) no prazo de 5 anos de BCR

grupo clínico metástase (metástase)

:. BCR experiente e metástases regionais ou distantes desenvolvidos, confirmado por cintilografia óssea ou CT, no prazo de 5 anos de BCR. Este grupo era conhecido como sistêmica progressão (

SYS

) em nosso estudo anterior [20].

Um total de 213 pacientes preencheram a definição do grupo de metástase e foram designados como casos [20]. Para cada caso, um paciente cada dos grupos PSA e Ned foram selecionados com base nos critérios de correspondência descritas anteriormente [20] e foram designadas como controles.

Ética comunicado.

Este estudo foi aprovado pelo o Review Board da Mayo Clinic e devido à natureza de arquivo dos espécimes Institucional, o consentimento paciente foi dispensado pelo conselho

RNA Extração e Microarray Hybridization

a partir do estudo original (n = 639. ), RNA estava disponível para microarray de 545 pacientes únicas. Como descrito anteriormente, depois de re-avaliação histopatológica por um patologista especialista geniturinário, do tumor foi macrodissected do estroma circundante da 3-4 10 um secções de tecido a partir do grau de Gleason primário da lesão índice (o mais alto patológica GS) para a extracção de ARN total [20 ]. O ARN total foi submetido a amplificação utilizando o kit V2 WT-Ovation FFPE em conjunto com o módulo de Exão (NuGen, San Carlos, CA) de acordo com as recomendações do fabricante com pequenas modificações. Os produtos amplificados foram fragmentados e rotulados com a biotina Módulo Encore (NuGen, San Carlos, CA) e hibridado com Exon Human 1,0 GeneChips ST (Affymetrix, Santa Clara, CA) seguindo as recomendações do fabricante. Human perfil Exon GeneChips codificação e regiões do transcriptoma usando aproximadamente 1,4 milhão de regiões de seleção sonda (PSR) não-codificante, a seguir designado características.

Microarray Processamento

controle de qualidade Microarray.

dos 545 pacientes com tecido disponível e RNA, um total de 59 amostras falhou QC inicial (como avaliado por Ferramentas Affymetrix Poder métrica AUC [34]) e foram re-run. Além disso, uma linha celular PC3 (ATCC, Manassas, VA) de controlo foi administrado com cada lote e utilizado para identificar características pouco fiáveis ​​(ver abaixo). Os dados da matriz Exon humano correspondente a este estudo estão disponíveis a partir do Centro Nacional de Gene Expression Omnibus banco de dados de Biotecnologia da Informação (GSE46691).

Microarray Normalização, Remoção de Recursos confiáveis ​​e Efeito Batch Correção

Característica compactação e a normalização dos valores de expressão foram realizadas por análise de multi-congelado robusta matriz (frma; [35]), que está disponível através Bioconductor. Um costume conjunto de vectores congelados foram gerados escolhendo aleatoriamente 15 matrizes de cada um dos 19 lotes através de todo o estudo. Características interrogados com menos de quatro sondas ou quaisquer sondas de hibridação cruzada (como definido pela Affymetrix) foram removidos (https://www.affymetrix.com). A variação dos valores característica expressão em linhas celulares PC3 foi usada para medir a técnica versus variabilidade biológica. Características com a maior variância de 10% nas linhas celulares PC3 foram removidos a partir da matriz de expressão. Por último, a fim de avaliar e remover o efeito de grupo, os dados foram decompostos nos seus componentes principais e foi utilizado um modelo de análise de variância. Como sugerido por um estudo anterior [36], os primeiros 10 componentes principais foram examinados quanto à sua correlação com efeito lote. A partir destes 10 componentes principais (capturando 31% da variância total), os dois componentes que foram mais altamente correlacionadas com efeitos lote foram removidas.

Definição de Formação e validação Define, Seleção de recursos e Genomic Classificador Desenvolvimento

Formação e validação conjuntos.

Depois de avaliar as diferenças moleculares entre os três grupos de pacientes, foi observada expressão diferencial muito limitado entre o NED e os grupos PSA recorrência. A expressão diferencial de características individuais foram obtidos através de comparações de pares dos grupos de resultado (Crisan et al., manuscrito em preparação). Em um limiar de fold-change of 1.5 (após correcção para falso-discovery), apenas 2 (de ~1.4 milhões) características foram encontrados para ser diferencialmente expressos entre os grupos Ned e PSA, em comparação com 1186 e 887 em resultados metástase em comparação com NED e BCR-somente grupos, respectivamente [37]. Por conseguinte, e de forma a desenvolver uma assinatura que prediz metástases clínica precoce, estes dois grupos foram combinados em um único grupo de controlo. A atribuição de pacientes no treinamento (n = 359) e validação (n = 186) foi conforme definido em nosso estudo anterior [20].

Seleção de características.

Dado o inicialmente grande número de características (~1.4 milhões), cada recurso foi filtrada utilizando um teste t (p 0,01) para a redução da complexidade do conjunto de treinamento (Figura S1). Características foram ainda examinadas em etapas de seleção subseqüentes. Para identificar características robustas, regressão logística regularizada foi aplicado [38], [39] com uma pena de rede elástica de α = 0,5. Este procedimento foi bootstrapped 1.000 vezes eo número de vezes que um recurso foi selecionado pela regressão regularizada foi computados. Recursos que foram selecionados pelo menos 25% do tempo foram utilizados para o desenvolvimento do classificador.

desenvolvimento classificador Genomic.

Um algoritmo de aprendizagem de máquina florestal aleatória foi usado para montar os recursos selecionados em um classificador [ ,,,0],40]. A etapa de seleção final foi usado para otimizar o conjunto de recursos no algoritmo de classificação. Usando a função rfcv dentro do pacote Floresta aleatória [41], a validação cruzada 10 vezes erro quadrático (MSE) dos modelos com a diminuição do número de recursos foi plotado. Em cada iteração, os recursos foram excluídos se tivessem o menor de 10% Índice de Gini. Características que mostraram uma pequena contribuição para o desempenho do modelo não foram incluídos no classificador final, mantendo as características acima do joelho da curva de MSE (Figura S2). Com este conjunto de recursos final, o mtry e parâmetros florestais nodesize aleatórios estavam sintonizados com uma pesquisa da rede de otimização de precisão. A pesquisa do espaço parâmetro foi prosseguido com a função tune.randomForest no pacote e1071 [42]. Especificamente, o conjunto de treinamento (composto de 359 amostras) foi ainda dividido em 1/3 e 2/3 formação testes e usado com 1000 iterações de bootstrapping para melhorar as estimativas de desempenho e controle sobre-montagem. O classificador genômica final (GC) gera uma pontuação variável contínua que varia entre 0 e 1, onde uma pontuação mais alta indica uma maior probabilidade de metástase clínica.

classificador Clínica e classificador clínica genômica integrada.

para referência a capacidade prognóstica da GC, desenvolvemos uma “clínica-only ‘classificador (CC), treinados sobre os mesmos pacientes utilizados para descobrir GC. CC combina GS patológicas, PSA pré-operatório (PPSA), SM +, SVI, ECE e N + usando regressão logística. Quando marcou pacientes, CC produz uma pontuação entre 0 e 1, análogo ao GC. Além disso, a fim de medir a capacidade de prognóstico conjunta das variáveis ​​de assinatura e clínico-patológicas moleculares, um classificador genômica-clínica integrada (GCC) foi construída através da combinação dos modelos CC e GC meio de regressão logística.

Comparação Contra Biomarcador externo assinaturas

O desempenho de GC foi comparada com a de assinaturas de genes previamente publicados [11] – [13], [15], [16], [18] – [24], [28] – [30 ] e marcadores genômicos individuais associada com a progressão do câncer de próstata, incluindo CHGA [43], DAB2IP [44], GOLPH2 [45], PAP [46], ETV1 e ERG [47], KI-67 [48], PSA [49], PSCA [50], PSMA [51], AMACR [52], de GSTP1 [53], de PCA3 [54], B7-H3 [55], TOP2A [14] e CAV1 [56]. Cada marcador de genômica e genética nas assinaturas foram mapeados para seus associados Affymetrix

núcleo aglomerado

transcrição (https://www.affymetrix.com/analysis/index.affx) quando disponíveis, caso contrário, o

estendido

foi usado aglomerado transcrição. Com base na frma resumidos os valores de expressão para os genes individuais, as assinaturas foram modelados no conjunto de treinamento usando uma floresta aleatória e sintonizado com o

tune.randomForest

função do pacote e1071 R. Sintonia envolvidos realizando uma pesquisa de 20 por 20 grade para encontrar o “mtry” ideal e “nodesize” parâmetros do modelo avaliado através de validação cruzada de 5 vezes, a fim de maximizar a precisão.

Avaliação de Desempenho de classificadores e variáveis ​​clínicas

As análises estatísticas foram realizadas em R v2.14.1, e todos os testes foram em frente e verso usando um nível de significância de 5%. A capacidade de prognóstico de todos os classificadores (GC, CC, GCC, e as assinaturas de biomarcadores externos) foram comparadas usando a área sob a curva ROC (AUC), boxplots discriminação e de regressão univariável (UVA) logística. Importância do classificadores em relação à informação clínica e capacidade de prognóstico independente foram comparados por meio de regressão multivariada (MVA) logística.

As variáveis ​​clínicas foram calculadas, categorizadas ou transformadas como se segue. GS foi dicotomizado em grupos com o limiar de ≥8; embora convenção é segregar GS em três grupos (≤6, 7, ≥8) a falta relativa de pacientes com GS≤6 solicitado a dicotomização de GS. A PPSA, medida imediatamente antes da RP, foi log

2-transformado. As seguintes variáveis ​​foram binária: ECE, SVI, SM +, e N +. Hormonal e terapia de radiação foram incluídos como co-variáveis ​​binárias separadas, se administrado em adjuvante ( 90 dias de pós-RP) definição ou de salvamento (após aumento PSA). Tratamentos administrados após a metástase clínica não foram incluídos.

Com base em um critério regra da maioria, os pacientes com GC, CC e as pontuações do CCG superiores a 0,5 foram classificadas como de alto risco enquanto aqueles com uma pontuação menor ou igual a 0,5 foram classificados como de baixo risco. curvas de sobrevida de Kaplan-Meier foram gerados para a mortalidade por câncer prostático específico (PCSM) e terminais de sobrevida global. Por último, todos os momentos de acompanhamento foram reportados utilizando o método descrito por Korn [57].

Resultados

Características Clínicas de Estudo da População

A partir da população de estudo de 639 pacientes [20], 545 (85%) correspondente a 192 casos e 353 controlos tinham ARN disponível e foram hibridados com êxito para microarranjos para análise (ver métodos). A idade média dos homens neste estudo é de 66 (IQR: 61-70) anos, com uma mediana de 16,9 anos de acompanhamento. As características clínicas destes pacientes são descritos na Tabela 1. Em geral, 60% dos casos (116/192) tinha GS ≥8 com apenas seis ≤6 GS, ao passo que os controlos foram predominantemente GS 7 (57%) e GS ≤6 (16 %). Uma proporção similar de ambos os casos e controles, (49% e 45%, respectivamente) foram patológica estágio T3 /4. Controlos teve 47% de doença T2 (em contraste com 27% dos casos), e 23% dos casos eram N +, em contraste com apenas 8% para os controlos. Observou-se uma taxa ligeiramente superior de SM + nos casos (54%) em comparação com controlos (46%). Como esperado dado o desenho do estudo, o tempo médio para BCR foi muito semelhante entre os casos (2,3 anos) e controles de PSA (1,7 anos). Enquanto houve 21 eventos metástases clínicas entre os controles, estes ocorreram com mediana de 9,39 (IQR: 7.5-10.95) anos, enquanto os casos apresentaram eventos muito mais rápidas com uma mediana de 5,47 (IQR: 3.7-8.14) anos pós-RP. Em geral, o tempo mediano para PCSM (n = 132) foi de 10,5 anos. A fim de caracterizar o verdadeiro potencial biológico de tumores de pacientes que progridem cedo para metástase clínica após aumento do PSA, foi realizada a análise da expressão diferencial de largura-transcriptoma para testar a hipótese de que uma assinatura de expressão em tumores primários poderiam prever melhor metástase clínica do que as variáveis ​​clínicas sozinho .

desenvolvimento de modelos para predizer Metástase

Casos e controles clínicos iniciais foram comparados e utilizados para o desenvolvimento de um genoma (GC), clínico-only (CC) e integrado ( modelos GCC) classificador para casos que predizem (ou seja, metástase clínica precoce depois de subir PSA) como o objectivo primário (ver métodos). As 545 amostras foram designados para formação (n = 359, 39% dos casos) e validação (n = 186, 37% dos casos) conjuntos (Figura 1). GC foi desenvolvido a partir da análise de 1,1 milhões de recursos de RNA no microarray na formação definida após a remoção do cross-hibridação e recursos não confiáveis ​​(ver métodos). Um passo inicial de seleção de recursos com base em testes t para a redução da complexidade rendeu 18.902 características diferencialmente expressos entre os casos e controles (Figura S1). Além disso selecção destas características diferencialmente expressos por regressão logística regularizada reduziu a lista para um total de 43. Como etapa final, estas 43 características diferencialmente expressos foram posteriormente filtrada para apenas aqueles que demonstraram melhorar a métrica de desempenho de base florestal aleatório (ver métodos ). Isto resultou em um conjunto final de 22 marcadores correspondentes a ARN a partir de regiões de codificação e não de codificação de proteínas do genoma (Tabela 2). A análise de escalonamento multidimensional descreve agrupamento de casos e controlos baseados na expressão dos marcadores 22 (Figura 2). Um algoritmo de aprendizagem de máquina florestal aleatório foi utilizado para gerar pontuações GC após a montagem dos 22 marcadores com parâmetros florestais para otimizar a precisão mais elevada no conjunto de treinamento. A regressão logística foi usada para montar os seis fatores de risco clínico-patológicas em um CC e também integrado com o GC para construir um GCC.

quebra Estudo em casos e controles. Treinamento e validação conjuntos são mostrados.

Os controles são indicados em azul e casos em vermelho. Em tanto a formação e validação define os controles tendem a se aglomerar no lado esquerdo da trama e os casos sobre o direito da trama. Desta forma, a maior parte das diferenças biológicos são expressos na primeira dimensão da descamação. proximidade da floresta aleatório [https://www.stat.berkeley.edu/~breiman/] foi utilizado para medir a distância 22 marcador entre as amostras.

Performance Classificador em Treinamento e Validação Set

no conjunto de treinamento, área sob a curva de valores ROC (AUC) para GC, CC e GCC foram de 0,90, 0,76 e 0,91, respectivamente, maior do que qualquer variável clínica individual (Figura 3). No conjunto de validação, GC e GCC teve a maior AUC de 0,75 e 0,74, respectivamente, para prever casos. A clínica só de CC teve uma AUC de 0,69, que foi apenas marginalmente melhor do que GS patológicas sozinho (0,65). A forma das curvas ROC para GC e GCC mostra que estes modelos têm a mais elevada sensibilidade e especificidade em comparação com modelos clínicos acima de um limiar de ~ 50% de especificidade (Figura S3). diagramas de caixa discriminação mostram ainda maiores diferenças médias nos GC e pontuações do CCG entre casos e controles do que para CC (Figura 4).

Para cada preditor, a AUC obtida nos conjuntos de treinamento e de validação, bem como a 95 % intervalo de confiança para essa métrica é mostrado. CC: clínica somente classificador. GC: classificador genómico. GCC:. Combinada classificador genômica-clínica

A distribuição de pontuações são desenhadas para um CC B) GC) e GCC C) para controles e casos. pontuações medianas e intervalos de confiança de 95% são representados por uma linha preta horizontal e entalhes, respectivamente. entalhes não sobrepostos indicam que as diferenças na distribuição dos escores entre casos e controles são estatisticamente significativos. Outliers são representados como pontos além dos bigodes boxplot.

GC Reclassificação de grupos GS

A distribuição de casos e controles na validação definido por ambos GC e GS [58] grupos de risco é ilustrada na Figura 5 e resumidos na Tabela 3. Entre GS ≤6 tumores (n = 18) nenhum teve pontuações mais altas GC, enquanto que entre GS 7 tumores (n = 97), quase um terço (29%) tiveram pontuação alta GC e metade destes eram casos que desenvolveram metástases no início, depois de subir PSA. Enquanto a maioria dos pacientes com altos GS (≥8) tiveram pontuações GC elevados, entre os 29 (40%) com baixa pontuação GC havia apenas 7 casos com 3 óbitos por câncer de próstata. No geral, 116 de 186 (62%) pacientes conjunto de validação teve baixa pontuação GC dos quais apenas 21 eram casos, resultando em 7 mortes por câncer de próstata. Entre os 70 (38%) pacientes com pontuação alta GC, houve 42 casos e 25 destes homens morreram de câncer de próstata.

pontuações GC são plotados com um jitter de modo a diferenciar mais facilmente os pacientes entre cada GS patológicas (eixo-x) grupos. Casos (vermelho) e controles pacientes (azul) são mostrados para cada categoria. A linha preta pontilhada indica o corte GC de 0,5. As tendências mostram os pacientes com pontuação alta GC tendem a ter altas GS também.

GC é um

variável independente de prognóstico

A fim de testar o tamanho do efeito de indivíduo variáveis, bem como as dependências entre essas variáveis ​​foram realizadas análises univariáveis ​​e multivariada por meio de regressão logística no conjunto de validação (Tabela 4). Na análise univariável, encontramos GC, CC, GCC, GS, SVI e ECE-se estatisticamente preditores significativos de casos (p 0,05). O odds ratio para GC foi de 1,42 para cada aumento de 10% na pontuação da GC. Quando dicotomizado em grupos de risco baixo e alto GC, como descrito acima, o odds ratio foi (IC 95%: 3,46-13,29) 6,79, mais do dobro da razão de chances de GS (OR: 3,02 (95% CI: 1,61-5,68) ) para prever casos. Na análise multivariada, após ajuste para tratamento pós-RP, GC permaneceu como a única variável prognóstica significativa (p 0,001) com um OR de 1,36 para cada aumento de 10% na pontuação da GC. O significado independente da GC sugere que uma medida mais direta da biologia do tumor (isto é, 22-marcador assinatura de expressão) adiciona informação de prognóstico importante na previsão da metástase cedo após aumento do PSA, que não é capturada pelas variáveis ​​clínicos disponíveis a partir de análise patológica.

casos com alto GC Scores morrer mais cedo do câncer de próstata e outras causas

a seguir, compararam os resultados de sobrevivência dos casos e controles na análise de Kaplan-Meier de grupos de pontuação de baixa e alta GC. Casos com pontuações mais baixas GC teve uma sobrevida mediana de câncer de próstata 6,9 ano específico em comparação com mediana de 2,9 anos para os casos com pontuações altas GC (p = 0,003) (Figura 6). Para a sobrevida global, houve uma (p = 0,03) diferença significativa no resultado, com mediana de sobrevida global após a metástase de 2,5 e 4,98 anos para os casos com pontuações altas e baixas de GC, respectivamente. Entre todos os controles, 21 pacientes desenvolveram metástases clínica fora das definições de caso-controle estudo (ou seja, 5 anos depois de subir PSA). Nós avaliamos se GC foi capaz de segregar pacientes que tiveram que ocorrem eventos metástase final entre os controles de PSA (Figura S4). GC foi capaz de forma significativa (p 0,05) separar aqueles doentes que iriam de PSA para detectar metástases depois clínica, daquelas que não. Esta diferença nos resultados fortalece ainda mais a noção de que as medidas de GC um componente do potencial biológico para a metástase e que aqueles pacientes com as maiores pontuações GC pode ser mais em risco para o início de progressão metastática de pós-RP.

Os casos foram separados em alta ( 0,5) ou baixo risco de acordo com a pontuação GC. p-valores de log-rank são mostrados no canto superior direito. Hora de PCSM e OS é medido a partir BCR em anos.

comparações com biomarcadores assinaturas externas

A fim de comparar o desempenho de GC para assinaturas de genes previamente relatados, nós compilamos os genes associados às assinaturas externas e as combinou em um classificador aleatória Floresta (ver métodos). Além disso, avaliou-se a expressão de genes individuais previamente relatados para ser associada a resultados do cancro da próstata. O desempenho dos classificadores e os genes individuais foi posteriormente avaliado em treinamento e validação conjuntos (Figuras 7 e S5). Como esperado, observamos altos AUC no treinamento por quase todas as assinaturas externas, semelhante ao que foi observado com GC. Quando aplicado a validação, a AUC para cada modelo diminuiu. Entre as 17 assinaturas externos que foram modelados, 12 foram preditores estatisticamente significativos de metástases (i.e., intervalos de confiança de 95% não cair abaixo de um limiar aleatório AUC probabilidade de 0,5) (Figura 7). A AUC da GC era de 0,08 pontos mais elevado do que o assinatura realizando externa superior, a assinatura 16 do gene relatado por Bibikova et al [12], que tinha uma AUC de 0,68 (95% CI: 0,60-0,76,). Em contraste com os modelos de expressão de assinatura, o desempenho dos 16 genes isolados foram testados para se espera ser semelhante nos conjuntos de treino e de validação. Estes marcadores genômicos mostram um acordo global no desempenho, com diferenças de significado provavelmente explicada pelo menor tamanho da amostra do conjunto de validação em relação ao conjunto de treinamento (Figura S5). Dos 16 marcadores genômicos, única B7-H3 (CD276), GSTP1 e PCA3 foram estatisticamente significativos em ambos os conjuntos de treinamento e de validação (Figura S5). Mais uma vez, nenhum dos marcadores genômicos GC outperform indivíduo ou o melhor desempenho preditor clínico, GS (AUC ≤0.64).

Para cada assinatura, a instituição que lhe está associado, ano de publicação, o autor principal, a AUC obtida nos conjuntos de treinamento e de validação, bem como a confiança de 95% Intervalo para essa métrica é mostrado.

Discussão

este estudo foi desenhado para testar a hipótese de que a avaliação biológica de ambos codificação e de não codificação perfis de expressão em tumores primários poderia prever o desenvolvimento de metástases clínica precoce após BCR. Descobrimos um classificador genômico de 22 marcador (GC) que, sem sacrifício de sensibilidade, foi mais específico na validação de fatores prognósticos estabelecidos, como GS. Com base nos resultados aqui apresentados, GC mede um componente do potencial biológico para a metástase clínica precoce melhor do que as variáveis ​​clínicas ou assinaturas biomarcador anteriormente relatados.

Deixe uma resposta