PLOS ONE: um tecido Painel de Biomarcador Prevendo Systemic Progressão após PSA recorrência pós-definitivos Prostate Cancer Therapy

Abstract

Fundo

Muitos homens desenvolver um aumento do PSA após a terapia inicial para câncer de próstata. Embora alguns desses homens irão desenvolver uma recorrência local ou metastático, que garante a continuidade da terapia, outros terão nenhuma evidência de progressão da doença. Nossa hipótese é que um painel de expressão de biomarcadores podem prever quais homens com um aumento do PSA se beneficiariam de terapia adicional.

Metodologia /Principais Achados

Um projeto de caso-controle foi usado para testar a associação de gene expressão com o resultado. Sistêmicas (SYS) casos de progressão eram homens pós-prostatectomia que desenvolveu progressão sistêmica dentro de 5 anos após o retorno da PSA. controles de progressão PSA foram pareados homens pós-prostatectomia com recorrência PSA mas nenhuma evidência de progressão clínica no prazo de 5 anos. O uso de matrizes de expressão otimizados para RNA de tecido embebido em parafina, 1021 genes relacionados com o cancro foram avaliados, incluindo 570 genes implicados na progressão do câncer de próstata. Os genes de marcadores 8 painéis anteriormente referidos foram incluídos. Um modelo de progressão sistémica contendo 17 genes foi desenvolvida. Este modelo gerou uma AUC de 0,88 (IC 95%: ,84-,92). AUCs semelhantes foram gerados usando 3 painéis reportados anteriormente. Em análises secundárias, o modelo previu os pontos finais de morte por câncer de próstata (nos casos SYS) e progressão sistêmica além de 5 anos (em controles de PSA), com taxas de risco 2,5 e 4,7, respectivamente (valores de p-log rank de 0,0007 e 0,0005). Genes mapeados 8q24 foram significativamente enriquecida no modelo.

Conclusões /Significado

padrões de expressão gênica específicos são significativamente associada com a progressão sistêmica após o retorno da PSA. A medição do padrão de expressão gênica pode ser útil para determinar quais os homens podem se beneficiar de terapia adicional após o retorno da PSA

Citation:. Nakagawa T, Kollmeyer TM, Morlan BW, Anderson SK, Bergstralh EJ, Davis BJ, et al . (2008) um ​​tecido de biomarcador Painel de prever a progressão sistêmica após a terapia do cancro da próstata PSA recorrência pós-definitiva. PLoS ONE 3 (5): E2318. doi: 10.1371 /journal.pone.0002318

editor: Anja-Katrin Bielinsky, da Universidade de Minnesota, Estados Unidos da América

Recebido: 27 Dezembro, 2007; Aceito: 12 de março de 2008; Publicado em: 28 de maio de 2008 |

Direitos de autor: © 2008 Nakagawa et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Esta pesquisa foi apoiado pelo P50 CA91956 Mayo cancro da próstata SPORE subvenção do NIH, e da Fundação Richard M. Schulze família. Ele também foi apoiado pelo Departamento de Minnesota de Emprego e Desenvolvimento Económico da apropriação legislativo do Estado para a Parceria Minnesota for Biotechnology and Medical Genomics. Tohru Nakagawa foi apoiado em parte por uma bolsa-in-Aid para a estratégia global de 10 anos Terceiro Termo de Controle do Câncer do Ministério da Saúde, Trabalho e Bem-estar do Japão

Conflito de interesses:. Os autores declararam que não existem interesses conflitantes.

Introdução

A maioria dos homens com câncer de próstata estão agora diagnosticados com cancros que têm um baixo risco de mortalidade específica por causa [1]. Estes homens são normalmente tratados com prostatectomia radical retropúbica (RRP), a radioterapia externa, ou braquiterapia intersticial e são seguidas de avaliações regulares de PSA no soro. Durante o próximo período de 5 a 10 anos, 15-30% destes homens irá desenvolver um aumento do PSA [2] – [6], a definição de uma população em rápido crescimento da maior importância para a saúde pública e clínica. Deste grupo recaída PSA alguns homens terão recorrência local ou ter metástase clinicamente detectável, mas muitos não terão outra evidência de câncer de próstata periódico que não seja o aumento do PSA. O PSA “tempo de duplicação” tem sido identificada como um substituto potencial de mortalidade por causas específicas, e é utilizado por alguns clínicos para determinar quais os homens com recaída PSA merecem ablação adjuvante hormonal, terapia de radiação local, ou a simples observação [4] – [6 ]. Biomarcadores que predizem qual desses homens se beneficiariam de qualquer terapia adicional são necessários

estudos de expressão gênica em grande escala de cancros da próstata de diferente grau e estágio foram realizados por vários grupos [7] -. [16]. Estes estudos de expressão têm utilizado matrizes contendo conjuntos de sondas de até 35.000 genes. Embora estes estudos são importantes para a descoberta de biomarcadores, várias dificuldades impedem a sua tradução em um cenário clincial. Em primeiro lugar, é provável que os painéis mais pequenos serão utilizados clinicamente. Em segundo lugar, porque os estudos anteriores exigiam material congelado, o número de amostras analisadas era limitado. Em terceiro lugar, uma vez que os eventos clínicos adversos em pacientes com câncer de próstata requerem longa acompanhamento, os métodos de ensaio deve ser aplicável ao material embebido em parafina de arquivo. Finalmente, nenhum dos estudos anteriores foi focada no desenvolvimento de um painel de biomarcadores para prever a progressão do câncer de próstata sistêmica na definição de recorrência PSA.

Usando a Mayo Clinic Radical Retropubic prostatectomia (RRP) Registry, foi elaborado um estudo de caso-controle para testar a hipótese de que um conjunto limitado de biomarcadores de expressão do RNA pode prever quais homens com PSA pós-RRP crescente pode se beneficiar de intervenção clínica adicional. O DASL ™ plataforma expressão microarray Ilumina foi escolhida como método de medição biomarcador, porque mede a expressão de genes alvos usando tecidos de parafina [17] – [19]. Usando dados de expressão da literatura e derivados de nosso próprio programa de pesquisa foi desenvolvido um conjunto limitado de marcadores de expressão que, provavelmente, ser alterados em associação com a progressão do câncer de próstata. O painel também incluiu biomarcadores de expressão de vários outros painéis publicados anteriormente que estão associados com substitutos (High Score Gleason, alta estágio patológico ou doença metastática) para a agressividade do câncer de próstata [12] – [16].

Nós relatamos que as medições com base na matriz mostrou excelente correlação com as medições quantitativos de RT-PCR de ARN derivado de parafina. Nós também relatam excelente intra-array, inter-matriz e reprodutibilidade intra-gene. Em seguida, descrevemos o teste e validação de um painel de biomarcadores tecido expressão do gene para a predição de câncer de próstata progressão sistémica na sequência de um aumento do PSA após a prostatectomia radical. Nós comparamos o desempenho do nosso painel com outros painéis previamente publicados. Finalmente, mostramos que a superexpressão de genes mapeados para banda cromossômica 8q24 está associado ao câncer de próstata progressão sistêmica.

Métodos

Selecção Gene e matriz de design para o DASL ™ Assay

Dois microarrays expressão DASL Illumina foram utilizados para os experimentos.

O padrão disponível comercialmente Illumina expressão DASL microarray (v1 Cancer Panel ™) contendo 502 oncogenes, genes supressores tumorais e genes em suas vias associadas. Setenta e oito dos alvos na matriz comercial têm sido associados com a progressão do câncer de próstata.

Um costume Illumina microarray expressão DASL ™ contendo 526 genes alvos para RNAs, incluindo genes cuja expressão é alterada em associação com a progressão do câncer de próstata . As sondas para o painel de DASL® costume foram concebidos e sintetizados por Illumina, Inc. (San Diego, CA).

Quatro conjuntos diferentes de genes de agressividade de cancro da próstata foram incluídos no estudo (não se os genes estavam presentes no matriz do Painel cancer v1, eles foram incluídos no projeto da matriz personalizado):

os marcadores de agressividade do câncer de próstata identificados por um Mayo /Universidade de Parceria Minnesota [20]: os perfis de 100 laser de captura de expressão lesões de câncer de próstata microdissecadas e lesões de controlo normais e BPH pareados foram analisados ​​usando Affymetrix HG-U133 mais 2,0 microarrays. listas de classificados de genes significativamente sobre e sub-expressas comparando 10 Gleason 5 e 7 lesões metastáticas para 31 Gleason 3 lesões de câncer foram gerados. Os 500 melhores genes nesta lista foram comparados com as listas geradas a partir de estudos de expressão microarray anteriores e outros estudos de marcadores de câncer de próstata (ver 2-4 seguinte). Após esta análise não havia espaço para 204 novos alvos com potencial associação com câncer de próstata agressivo na matriz personalizado.

marcadores associados com a agressividade do câncer de próstata a partir de conjuntos de dados de expressão de microarranjo publicamente disponíveis (por exemplo, EZH2, AMACR, hepsina, PRLz, PRL3): Quando projetamos a matriz suficientemente grandes conjuntos de dados a partir de 9 estudos de microarranjos anteriores de câncer de próstata de diferentes graus e potencial metastático [7] – [15] estavam disponíveis a partir do site internet Oncomine [21], [22], www.oncomine .org. A partir de listas ordenadas de estes dados foram selecionados 32 genes para inclusão na matriz

marcadores anteriormente publicados associados com a agressividade do câncer de próstata (por exemplo, PSMA, PSCA, Cav-1):. De dados microarray Expression também tem sido publicado. Esta literatura foi avaliada por biomarcadores adicionais de tecido. Por exemplo, no momento da concepção matriz fomos capazes de identificar 13 estudos de qualidade elevada expressão de microarranjo de agressividade do câncer de próstata (ver quadros S1 e S2 para a lista de referência completa). Além disso, entre os 13 relatórios, 5 trabalhos apresentados 8 painéis de expressão de biomarcadores para prever a agressividade do cancro da próstata [12] – [16]. Quando sondas apropriadas adequadas para a química DASL poderia ser concebido para estes painéis foram incluídos na matriz de costume. Também identificaram 12 artigos de revisão genes associados ao câncer de próstata. Estes critérios resultou na seleção de 150 genes.

Marcadores derivados da investigação Mayo SPORE (incluindo genes e ESTs mapeados para 8q24). Foram identificadas noventa e três biomarcadores adicionais (ver quadros S1 e S2).

A matriz personalizado também incluiu conjuntos de sondas para 45 genes que não se esperava que diferiu entre os grupos caso e controle baseados em Mayo /Universidade Parceria de dados Minnesota. Trinta e oito destes genes também estavam presentes na matriz comercial (ver quadros S1 e S2).

Depois de enumerar o câncer de próstata potencialmente genes relevantes no painel câncer comercialmente disponível 570 de câncer de próstata potencialmente genes e 451 outras relevantes genes relacionados com o cancro foram avaliados em ambos os arrays.

projeto de Nested Caso-Controle estudo

Para este estudo foram amostrados indivíduos do RRP Registry Mayo Clinic. O registro consiste em uma população de homens que receberam a prostatectomia como seu primeiro tratamento para câncer de próstata na Clínica Mayo (Para uma descrição atual e uso do registro, veja referência [23]). Como a progressão sistêmica é relativamente pouco frequente, foi elaborado um estudo caso-controle aninhado em uma coorte de homens com um aumento do PSA. Entre 1987-2001, inclusive, 9.989 homens previamente não tratados tiveram RRP na Mayo. No follow-up, 2.131 desenvolveram um aumento do PSA ( 30 dias após RRP), na ausência de recorrência clínica concorrente. aumento PSA foi definida como um follow-up PSA = 0,20 ng /ml, com o próximo PSA pelo menos 0,05 ng /ml ou superior, o início do tratamento para a recorrência de PSA (para pacientes cujas seguimento de PSA era alta o suficiente para justificar o tratamento). Este grupo de 2.131 homens compreende a coorte de base a partir da qual foram selecionados casos SYS e controles de PSA.

Dentro de 5 anos de origem PSA, 213 homens desenvolveram progressão sistêmica (casos SYS), definida como uma cintilografia óssea positiva ou CT digitalizar. Destes, 100 homens sucumbiram a uma morte específicas de cancro da próstata, 37 morreram por outras causas e 76 permanecem em risco.

controlos PSA recorrência (213) foram seleccionados de entre aqueles homens sem progressão sistémica dentro de 5 anos após o aumento PSA e foram pareados (1: 1) no ano de nascimento, ano-calendário de origem PSA e patológica diagnóstica inicial pontuação de Gleason ( = 6, 7 +). Vinte desses homens desenvolveram progressão sistêmica maior que 5 anos após a ascensão PSA inicial e 9 sucumbiu a uma morte específica por câncer de próstata.

Um conjunto de 213 sem evidência de doença (NED) controles de progressão também foram selecionados a partir da Mayo Clinic RRP Registro de 9.989 homens e usado para algumas comparações. Estes controlos tinha PVP a partir de 1987-1998, com nenhuma evidência de aumento de PSA no prazo de 7 anos de PVP. A mediana (25

th, 75

percentil) acompanhamento da RRP foi de 11,3 (9,3, 13,8) anos. Os controles NED foram pareados com os casos de progressão sistêmicas na nascimento anos, ano-calendário de RRP e inicial Pontuação diagnóstico Gleason. a melhor adequação computadorizada foi realizada para minimizar a “distância” total entre casos e controles em termos da soma da diferença absoluta entre os fatores correspondentes [24].

O presente estudo foi aprovado pelo Conselho de Revisão Institucional Mayo Clinic.

Bloco de Identificação, Isolamento de RNA, e Análise de Expressão

A lista de 639 casos e controles foi aleatória. Foi feita uma tentativa para identificar todos os blocos disponíveis (incluindo os nós aparentemente normais e anormais linfáticos) a partir da lista randomizado de 639 casos e controles elegíveis. Manter a randomização, cada bloco disponível foi avaliado por conteúdo de tecido por meio de revisão da patologia e o bloco com a dominante câncer padrão de Gleason foi selecionado para o isolamento de RNA.

Quatro secções de 10 um recém-cortadas de tecido FFPE foram desparafinados e Gleason dominante foco câncer foi macrodissected. O ARN foi extraído utilizando o Kit High Pure RNA de parafina a partir de Roche (Indianapolis, IN). O ARN foi quantificado utilizando espectros otómetro ND-1000 a partir de NanoDrop Technologies (Wilmington, DE). Os ARN, incluindo intra- e inter-chapa de placa de repetições, foram distribuídas em placas de 96 poços na ordem ao acaso para análise DASL.

As amostras de RNA foram processadas, hibridizadas para Sentrix Universais 96 Matrizes, digitalizados utilizando BeadArray leitor, e os dados processados ​​inicialmente em BeadStudio de acordo com as instruções do fabricante. dados de Microarray está disponível a partir do banco de dados do GEO (https://www.ncbi.nlm.nih.gov/geo/número de acesso GSE10645).

Para avaliar a precisão dos níveis de expressão de genes definidos pela tecnologia DASL , foi realizada SYBR quantitativa reações verde RT-PCR para 9 genes selecionados “alvo” (CDH1, MUC1, VEGF, IGFBP3, ERG, TPD52, YWHAZ, FAM13C1 e Page4) e 4 genes de controle endógena comumente usados ​​(GAPDH, B2M, PPIA e RPL13a) em placas de 384 poços, com o uso de instrumentos Prism 7900HT (Applied Biosystems, Foster City, CA). 210 As amostras de ARN com ARN abundante a partir do grupo do total de 639 pacientes foram analisados. Por causa da escassez de ARN, apenas 77 amostras foram analisadas por Page4. ARNm foi transcrito reverso com SuperScript First Strand Synthesis III SuperMix (Invitrogen, Carlsbad, CA), utilizando hexâmeros aleatórios. Para cada um dos nove genes estudados, o limiar de ciclo (CT) foi determinado em triplicado e a expressão foi normalizada em relação ao conjunto de quatro genes de referência.

Patologia avaliação

A classificação de Gleason em Registro Mayo Clinic RRP foi definida como a pontuação de Gleason inicial. Já que houve mudanças na interpretação patológica da pontuação Gleason ao longo do tempo, um único patologista (JCC) reviu a pontuação de Gleason de cada um dos blocos selecionados para análise de expressão. Esta variável clínica foi definida como a pontuação de Gleason revisto.

Metodologia Estatística

Recolha de dados de expressão gênica foi tentada para os 623 pacientes, conforme descrito em resultados. Destes, havia 596 (n

SYS = 200, n

PSA = 201, n

NED = 195) pacientes para os quais os dados foram coletados, o resto ter falhado um ou de ambos os painéis de expressão como descrito no Resultados. Para garantir a seleção de conjuntos de treino e de validação semelhantes, 100 coortes de controle de caso-controle composto de 133 pacientes escolhidos aleatoriamente SYS (dois terços de 200 para treinamento), juntamente com o seu PSA combinados e controles NED foram selecionados como um conjunto de treinamento proposto. Os casos e controles restantes foram tratados como um conjunto de validação proposto. As variáveis ​​clínicas foram testados para a independência entre a formação proposta e conjuntos de validação separadamente nos casos SYS e os controles de PSA. fatores clínicos discretos (estágio patológico, adjuvantes do tratamento hormonal para RRP, adjuvantes tratamento de radiação para RRP, adjuvantes do tratamento hormonal para recorrência PSA e radioterapia adjuvante à recorrência PSA) foram testadas usando análise de Qui-quadrado. As variáveis ​​contínuas clínicas (escore de Gleason (revista), a idade de recorrência PSA, primeira subida valor de PSA, segundo crescente valor de PSA, e inclinação PSA) foram testados usando Wilcoxon. Seis dos cem conjuntos amostra aleatória não conseguiu mostrar dependência para qualquer uma das variáveis ​​clínicas no nível 0,2, ea primeira delas foi escolhido como o conjunto de treinamento: 391 pacientes (n

SYS = 133, n

PSA = 133, n

NED = 125). Este reservados 205 pacientes para o conjunto de validação (n

SYS = 67, n

PSA = 68, n

NED = 70).

Os dados brutos de BeadStudio foi normalizada utilizando loess cíclica (fastlo) [25].

Os dados de treinamento foram analisados ​​utilizando floresta aleatória [26] com R versão 2.3.1 (https://www.r-project.org) e floresta aleatória versão 4,5-16 ( https://stat-www.berkeley.edu/users/breiman/RandomForests). Os dados foram analisados ​​pelo painel (Câncer, personalizado e integrado, quando mesclados foi os dados Câncer e personalizadas tratadas como uma única matriz). Testando a

ntree

parâmetro da função Floresta aleatória determinamos que 4000 florestas aleatórias foram suficientes para gerar uma lista de marcadores estáveis. Os principais marcadores como ordenados de significância pelo programa Floresta aleatória foram combinadas com várias combinações de variáveis ​​clínicas usando programa de regressão R logística (GLM () com a família = binário (um modelo logístico), onde GLM refere-se ao modelo linear generalizado). A função de pontuação resultante foi então analisada utilizando métodos receiver operating characteristic (ROC) e o ponto de corte foi escolhido, que assumiu uma penalidade igual para falsos positivos e falsos negativos. Uma revisão dos modelos permitido um subconjunto dos marcadores de ser identificado, e um subconjunto de suporte de dados clínicos identificados. O número de recursos no modelo foi determinada por licença 1/3 fora Monte Carlo Cruz Validation (MCCV) usando 100 iterações. O número de características foi seleccionada para maximizar e minimizar AUC variação aleatória no modelo. O modelo final foi então aplicado ao conjunto de treinamento 391 paciente eo reservados 205 conjunto de validação paciente. Para efeito de comparação, outros modelos de expressão de genes previamente relatados também foram testados contra os conjuntos de treino e de validação [12] – [16].

Foram comparados os modelos previamente relatados para a sua classificação de pacientes para o controle conhecido recorrência PSA e SYS grupos caso progressão. Usamos V-estatística do Cramér [27] para comparar modelos.

Resultados

Estudo de Concepção /Parafina Bloco de Recuperação /Isolamento RNA e expressão Painel sucesso

Resumidamente, uma aninhada estudo caso-controle foi realizada através do grande grupo, bem definido de homens com aumento do PSA seguinte RRP (Figura S1). casos SYS foram 213 homens que desenvolveram progressão sistêmica entre 90 dias e 5,0 anos na sequência do aumento de PSA. controles de PSA eram uma amostra aleatória de 213 homens que tinham 5 anos de pós-RRP com recorrência PSA, mas sem evidência de progressão clínica. controles NED foram uma amostra aleatória de 213 homens que foram 7 anos de pós-RRP, sem aumento PSA (a comparação de controles de PSA com NED controla-será apresentado em um artigo posterior). casos SYS e controles de PSA foram pareados (1: 1) para o ano de nascimento, ano-calendário de origem PSA e patológico inicial pontuação de Gleason ( = 6 vs. = 7). A lista de casos e controles elegíveis foi randomizeed para a verificação cego de blocos, o isolamento de RNA e desempenho dos experimentos de matriz expressão.

A tabela 1 resume a distribuição dos parâmetros clínicos entre os casos SYS ea PSA e NED grupos de controle. Não houve diferença significativa entre os grupos para as variáveis ​​correspondentes (não houve diferença significativa na pontuação inicial Gleason de diagnóstico quando o = 6 e critérios-se 7 grupos-the correspondentes comparação). A comparação da pontuação de Gleason de diagnóstico inicial para a pontuação de Gleason revistos revelou que a pontuação de Gleason têm aumentado ao longo do tempo. Além disso, a proporção de Gleason 8-10 tumores aumentou comparando NED controla a controlos de PSA, PSA e controla a casos SYS. A pontuação de Gleason revista foi usado em toda a modelagem biomarcador.

(regiões de câncer de Gleason primário e secundário Todos os blocos embebidos em parafina de homens elegíveis foram identificados e cada bloco foi pesquisados ​​para o tecido presente, normal e linfonodos metastáticos, etc.). Nós macrodissected a região padrão dominante Gleason e tentou isolar RNA. Illumina Painel ™ Câncer e análises de matriz painel de câncer de próstata DASL costume foram então realizadas em todas as amostras de RNA. A seção de Métodos e Tabelas S1 S2 descrever a composição do Painel de Câncer e o design do painel de costume.

A Tabela 2 resume a disponibilidade bloco final, a taxa de sucesso de isolamento de ARN e as taxas de sucesso da expressão analisa matriz. Dos 639 pacientes elegíveis, blocos estavam disponíveis em 623 (97,5%). RNA foi isolado e ensaios DASL realizada com sucesso em uma alta proporção de pacientes /espécimes: RNA utilizável foi preparado a partir de todos os 623 blocos, eo Painel de Câncer e painel personalizado matrizes DASL foram bem sucedidos (depois de repetir alguns espécimes-veja abaixo) em 596 RNA espécimes (95,7% dos RNAs; 93,3% dos pacientes design). Apenas 9 (1,4%) amostras de ARN falharam ambos os painéis. O motivo principal para estas falhas foi pobre qualidade de ARN, como medido por qRT-PCR da expressão do gene RPL13a [19]. Das 1246 amostras iniciais são executados em ambos os painéis, 87 (7,0%) espécimes falhou. Esses espécimes para os quais não havia RNA residual foram repetidos com uma taxa de sucesso de 77,2% (61 de 79 amostras).

Análise Expressão Reprodutibilidade

Replicar resultados de análise (Figura S2), comparações RT-PCR (Figura S3) e comparações de expressão genética inter e intra-painel são descritos nos resultados S1.

resultados de gene expressão específica Comparando a progressão coortes sistémicos com a PSA recorrência e sem evidência de progressão coortes

as análises univariadas por gene.

Porque o ensaio DASL apareceu para gerar resultados precisos e reprodutíveis, os dados de matriz foi examinado para genes cuja expressão foi alterada significativamente quando os casos SYS foram comparados com os controles de PSA . Para esta análise inicial, o valor da expressão do gene DASL foi determinado como sendo a média de up-to-três sondas para cada gene em cada matriz. Após a análise univariada (two-cauda t-test) dos dados normalizados e fastlo média-sonda [25], 68 genes foram altamente significativamente acima ou abaixo do expresso nos casos SYS contra controlos de PSA (p 9,73 × 10

-7, correcção de Bonferroni para p 0,001) (Tabela 3). Cento e vinte e seis genes foram significativamente acima ou abaixo do expresso nos casos SYS versus os controlos de PSA (p 4,86 ​​× 10

-5, correção de Bonferroni para p 0,05). Tabela S3 proporciona uma lista de genes completa ordenados por p-valor. A figura 1 ilustra nove genes com expressão significativamente diferente nos casos SYS e controles de PSA.

P-valores (teste t) para a comparação SYS caso /controle PSA são mostrados. Controles sem evidência de recorrência da doença (NED) também estão incluídos.

sistêmica progressão Prediction Modelo de Desenvolvimento e Teste em um conjunto de treinamento.

Um modelo estatístico para prever sistêmica progressão (com e sem variáveis ​​clínicas), utilizando um conjunto de treinamento foi desenvolvido utilizando floresta aleatória [21] e de regressão logística, conforme descrito em Métodos. Os dados de treinamento foram analisados ​​pelo painel (câncer, personalizado e mesclado), por gene (a expressão média para todas as sondas específicas para o gene), e por sondas individuais. Tabela 4 lista os 15 genes e 2 sondas individuais selecionadas para o modelo final.

Tabela 5 e Figura 2A resumir as áreas sob a curva (AUC) para três modelos clínicos, a final 17 gene /sonda modelo e os modelos de sonda clínicos combinados. As variáveis ​​nos modelos clínicos (Tabela 6) foram baseados em informações clínicas disponíveis. modelo clínico A incluiu revisto pontuação Gleason e estágio patológico (informações disponíveis imediatamente após RRP). A adição de PSA de diagnóstico e idade no momento da cirurgia não aumentar significativamente a AUC e foi deixado de fora deste modelo (dados não mostrados). modelo clínico B adicionado a idade no momento da cirurgia, o valor de PSA pré-operatório, e qualquer adjuvante ou terapia hormonal no prazo de 90 dias após RRP (informação disponível após RRP mas antes de recorrência PSA). modelo clínico C adicionou idade de recorrência PSA, o segundo nível de PSA no tempo de recorrência PSA, ea inclinação PSA (informações disponíveis no momento da recorrência PSA).

A. O conjunto de treinamento AUC por três modelos clínicos, o modelo final 17 gene /sonda eo modelo /probe /17 gene clínica combinada. B. A validação definir AUC por três modelos clínicos, o modelo final 17 gene /sonda eo modelo /probe /17 gene clínica combinada. C. O conjunto de treinamento AUCs de 4 modelos de expressão de genes previamente relatados de agressividade do câncer de próstata em comparação com o modelo clínico isolado C e com o modelo /sonda 17 gene. D. A validação definir AUCs de 4 modelos de expressão de genes previamente relatados de agressividade do câncer de próstata em comparação com o modelo clínico isolado C e com o modelo /sonda 17 gene. Para uma explicação sobre os modelos clínicos ver Tabela 6. (E e F) Uma comparação das AUC de formação e conjunto de validação para cada um dos modelos. E. AUC da cada um dos modelos gene /sonda sozinho. F. AUC de cada um dos modelos gene /sonda com a inclusão do modelo clínico C.

Usando o conjunto de treinamento, modelos clínico A, B e C só tiveram AUC do 0,74 (IC de 95% 0,68-0,80), 0,76 (95% IC 0,70-0,82) e 0,78 (IC de 95% 0,73-0,84), respectivamente. O modelo /sonda 17 gene sozinho teve uma AUC de 0,85 (IC 95% 0,81-0,90). Quando combinado com o modelo /sonda 17 gene, modelos clínicos A, B e C tiveram AUC de 0,86 (IC 95% 0,81-0,90), (IC 95% 0,83-0,91) 0,87 e 0,88 (IC 95% 0,84-0,92) , respectivamente. Nós também testamos um modelo de 19 gene que acrescentou TOP2A e survivin (BIRC5) para the17 modelo gene /sonda. A adição desses dois genes não melhorou a previsão de progressão sistêmica no conjunto de treinamento (dados não mostrados)

Foram selecionadas as matrizes para incluir conjuntos de sonda para vários modelos de agressividade da próstata previamente publicados [12] -. [ ,,,0],16]. A Tabela 5 resume as AUC para resultados de expressão matriz para estes modelos de biomarcadores. Figura 2C ilustra as AUC para quatro destes modelos com a comparação adequada com clínica modelo C e com o modelo /sonda 17 gene. Cada um destes modelos gerados AUC que foram menores do que o modelo foi desenvolvido. No entanto vários dos modelos gerados AUC (por exemplo, o Lapointe et al., 2004 recorrência, Yu et al., 2004, e Singh et al., 2002 modelos) que estavam dentro ou perto de 95% dos limites de confiança de nossas estimativas conjunto de treino de AUC.

Teste de modelos no conjunto de validação.

em seguida, aplicou o modelo de 17 gene /sonda e os outros modelos publicados anteriormente à reservados 205 pacientes conjunto de validação (Figuras 2B e 2D). Figura 2E compara o conjunto de treinamento e validação definir AUC da cada um dos modelos gene /sonda. Com a excepção do Glinsky et ai. 2004 Assinatura 1, todos os modelos do gene /sonda tinha AUC significativamente menores no conjunto de validação em relação ao conjunto de treino. Figura 2F compara a formação e validação definido AUC de cada um dos modelos de genes /sonda modelo clínico incluindo C. Enquanto o modelo do gene 17 /sonda e três dos modelos publicados anteriormente (a LaPointe et al., 2004 recorrência, Yu et al., 2004 e Glinsky et al. 2005 modelos) superou o modelo clínico sozinho, as AUC foram significativamente menores no grupo de validação em relação ao conjunto de treinamento.

também comparamos os modelos para a sua classificação de pacientes para a PSA conhecido grupos de controle recorrência e de casos progressão SYS. Tabela S4 resume V-estatística do Cramér [27] dos vários modelos, e inclui um preditor perfeito modelo ( “verdade”) para avaliação direta dos modelos. Resumidamente, V-estatística do Cramér variou 0,38-0,70. V-estatística o menor de Cramer foi entre o verdadeiro estado (previsão perfeita) eo Glinsky et al. 2005 modelo com dados clínicos. valor V a mais alta de Cramer foi entre o nosso modelo de 17 gene /sonda e Singh et al. modelo 2002, ambos com dados clínicos. A maioria dos modelos classificados os mesmos pacientes nos grupos conhecidos (por exemplo, considerar um paciente no grupo de controlo de PSA como uma recorrência de PSA e um paciente no grupo de caso SYS como uma progressão sistémica). Eles também tendem a classificar incorrectamente os mesmos pacientes (por exemplo, considerar um paciente no grupo de controlo como uma progressão de PSA sistémica e vice-versa). O modelo /sonda 17 gene classificou corretamente mais 5-15 pacientes em sua categoria conhecida (controles de PSA ou casos SYS) em comparação com os outros modelos (dados não mostrados).

Análise Secundária

Exploratório estudos de sobrevivência.

Como observado acima, o modelo de 17 genes /sonda e os modelos anteriormente relatados cada classificadas alguns dos casos na categoria SYS bom resultado (por exemplo, para ser recorrências de PSA, não progressores sistémica) e alguns dos os controles de PSA na pobre categoria resultado (por exemplo, para ir para a progressão sistêmica). Nós estávamos curiosos para saber se estes aparentemente falsas classificações tido qualquer biológica ou relevância clínica.

Dezessete homens no grupo de controle PSA (que tiveram ambos array e dados do modelo C clínica) passou a ter progressão sistêmica além de 5 anos no momento do último acompanhamento. Destes 17 pacientes, 9 foram previstos para ter um mau resultado pelo modelo /sonda 17 gene. Dos 179 pacientes que não têm qualquer progressão sistêmica, 38 foram classificados na categoria pobres resultado pelo modelo (valor p = 0,0066, teste exato de Fisher). Figura 3A ilustra a sobrevivência livre de progressão sistêmica para os bons e maus grupos resultado nos controles de PSA. controles de PSA com um tumor classificados como tendo um mau resultado tinha aumentado significativamente o risco para o desenvolvimento de progressão sistêmica além de 5 anos (log rank valor p = 0,00050) (HR = CI 4.7, 95%: 1,8-12,1).

a) Systemic sobrevida livre de progressão para os pacientes classificados nos pobres categoria resultado e para aqueles na boa categoria resultados do grupo-17 gene modelo de controle de PSA /sonda. sobrevida global específico do cancro B) da próstata para os pacientes classificados nos pobres categoria resultado e para aqueles na boa categoria resultados do grupo-17 gene modelo de caso de SYS /sonda.

Deixe uma resposta