PLOS ONE: variações genômicas número de cópias no genoma de Leucócitos Predict Prostate Cancer Outcomes

Clínica

Abstract

previsão precisa de cursos clínicos de câncer de próstata permanece indefinida. Neste estudo, foi realizada a análise do número de cópias do genoma inteiro em leucócitos de 273 pacientes com câncer de próstata utilizando chips Affymetrix SNP6.0. variações no número de cópias (CNV) foram encontrados em todos os cromossomos do genoma humano. Uma média de 152 fragmentos de CNV por genoma foi identificado nos leucócitos de pacientes com cancro da próstata. As distribuições de tamanho de CNV no genoma de leucócitos foram altamente correlativa com a agressividade do cancro da próstata. Um modelo de previsão de resultados do cancro da próstata foi desenvolvido baseado em grande proporção de tamanho de CNV a partir dos genomas de leucócitos. Este modelo de previsão gerado uma taxa média de previsão de 75,2%, com sensibilidade de 77,3% e especificidade de 69,0% para recorrência do câncer de próstata. Quando combinado com Nomograma e o estado de transcrições de fusão, a taxa de previsão média foi melhorada para 82,5% com sensibilidade de 84,8% e especificidade de 78,2%. Além disso, o modelo de previsão de leucócitos era de 62,6% de precisão na previsão de curto antigénio específico da próstata tempo de duplicação. Quando combinado com o grau de Gleason, Nomograma eo status de transcrições de fusão, o modelo de predição gerado uma taxa de previsão correta de 77,5%, com sensibilidade de 73,7% e 80,1% de especificidade. Para nosso conhecimento, este é o primeiro estudo que mostra que CNVs em leucócitos genomas são preditivos de resultados clínicos de uma doença maligna humana

Citation:. Yu YP, Liu S, Huo Z, Martin A, Nelson JB, Tseng GC , et ai. (2015) variações genômicas número de cópias no genoma de Leucócitos prever os resultados clínicos do cancro da próstata. PLoS ONE 10 (8): e0135982. doi: 10.1371 /journal.pone.0135982

editor: Zoran Culig, Innsbruck Medical University, ÁUSTRIA

Recebido: 24 Abril 2015; Aceito: 28 de julho de 2015; Publicação: 21 de agosto de 2015

Direitos de autor: © 2015 Yu et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Disponibilidade de dados: Todos os dados relevantes estão dentro do papel e seus arquivos de suporte de informação. informações de SNP6.0 a partir dessas amostras de dados em bruto foram depositados em Gene Expression Omnibus (GEO, número de acesso GSE70650)

Financiamento:. Este estudo foi apoiado por uma bolsa da National Cancer Institute para JHL (SR1 CA098249) e uma bolsa da Universidade de Pittsburgh Cancer Institute. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

o câncer de próstata é uma das principais causas de morte para os homens nos Estados Unidos. Ele tem uma heterogeneidade considerável na agressividade biológica e prognóstico clínico [1-3]. Uma vez que a execução do teste de PSA no soro, a taxa de detecção clínica do cancro da próstata tem sido substancialmente aumentada, devido principalmente à identificação de cancros de grau baixo pequenas, que provavelmente não seria o progresso [1]. No entanto, cerca de 30.000 pacientes morrem de câncer de próstata anualmente [4]. previsão precisa do comportamento agressivo de câncer de próstata permanece indefinida.

Atualmente, várias opções de tratamento estão disponíveis para pacientes com câncer de próstata, incluindo espera vigilante, radiação, hormonal /quimio-terapia e prostatectomia radical. Gleason de classificação sozinhos ou em combinação com outros indicadores clínicos como a próstata soro níveis de antígeno específico e estadiamento patológico ou clínica tem sido a ferramenta de orientação na selecção dessas opções de tratamento. Um número significativo de pacientes com cancro da próstata, no entanto, experimentou de recorrência após a ressecção cirúrgica da glândula prostática. Há claramente uma necessidade de uma melhor previsão do prognóstico do câncer de próstata. citogenética anterior e outros estudos do genoma sugeriu uma ligação clara entre as alterações do genoma e câncer de próstata [5-21]. Análises recentes do número de cópias do genoma do câncer de próstata, tecidos benignos adjacentes às amostras cancerosas e de sangue de pacientes com câncer de próstata sugeriu que a eliminação do genoma e amplificação de certas regiões em amostras de câncer de próstata foram associados com resultados clínicos pobres [14; 22]. genoma inteiro e sequenciamento do transcriptoma revelou transcrições de fusão no cancro da próstata preditivo de recorrência do câncer de próstata [23]. Neste estudo, foi realizada número de cópias do genoma inteiro analisa em leucócitos de pacientes com cancro da próstata. variações significativas no número de cópias (CNV) foram identificados no genoma de leucócitos de pacientes com cancro da próstata. Descobrimos que tamanhos de CNVs em leucócitos de amostras de cancro da próstata foram altamente correlativo a recorrência de câncer de próstata. modelos de previsão foram construídos para prever resultados de câncer de próstata com base no tamanho de CNVs dos leucócitos.

Materiais e Métodos

O protocolo do estudo foi aprovado pela Universidade de Pittsburgh Institutional Review Board.

processamento de tecidos, extração de DNA, geração de amplicon, rotulagem, hibridação, lavagem e varredura de SNP 6,0 fichas

amostras de câncer de próstata foram obtidos a partir de University of Pittsburgh Medical Center Tissue Bank. Estas amostras foram coletadas de 1998-2012. Duzentos e setenta e três amostras de revestimento buffy de pacientes com câncer de próstata foram analisados. Entre estas amostras, 143 amostras foram seguidos, pelo menos, 90 meses, 35 pacientes eram não-recorrentes durante 90 meses ou mais, 55 pacientes que experimentam a recorrência com curta PSADT (PSA duplicação tempo 4 meses) e 53 doentes com recidiva com longa PSADT (PSA tempo 15 meses) após a prostatectomia radical (S1 Tabela). pontuações de todas as amostras de câncer de próstata do Gleason foram reavaliados pelo UPMC patologistas antes do estudo. O seguimento clínico foi realizado pelo registro exame escritório, pesquisa PSA no sangue e acompanhamento radiográfico. Estes acompanhamentos foram realizadas para até um período de 15 anos após o paciente teve uma prostatectomia radical. O protocolo foi aprovado pela “University of Pittsburgh Institutional Review Board”. Quinhentos ng de ADN genómico foram digeridos com Sty1 NSP1 e durante 2 horas a 37 ° C. O ADN digerido foi purificado e ligado com adaptadores de iniciador /a 16 ° C durante 12-16 horas. Amplicões foram gerados através da realização de PCR utilizando iniciadores fornecidos pelo fabricante (Affymetrix, CA) sobre os produtos de ligação usando o seguinte programa: 94 ° C durante 3 min, depois 35 ciclos de 94 ° C de 30 segundos a 60 ° C durante 45 seg e 65 ° C durante 1 minuto. Isto foi seguido por extensão a 68 ° C durante 7 min. Os produtos de PCR foram, em seguida, purificado e digerido com DNAseI durante 35 min a 37 ° C, para fragmentar o ADN amplificado. O ADN fragmentado foi depois marcado com nucleótidos biotinilados através de desoxinucleótido transferase terminal para 4 horas a 37 ° C. Duzentos e cinquenta microgramas de ADN fragmentado foram hibridadas com uma pré-equilibrada Affymetrix SNP chip de 6,0 a 50 ° C durante 18 horas. Procedimentos de lavagem e varredura de SNP 6,0 fichas seguiu os manuais fornecidos pela Affymetrix, Inc. Raw informações de dados de SNP6.0 a partir dessas amostras foi depositada no “Gene Expression Omnibus” (GEO, número de acesso GSE70650).

a análise estatística

análise Copiar número variação.

arquivos CEL foram analisados ​​com Genotipagem Console para análise de controle de qualidade. As amostras com chamada QC acima de 80% e taxa de contraste QC acima de 0,4 foram admitidos na análise. Para analisar CNV, arquivos CEL foram importados para Partek GenomeSuite 6.6 para gerar número de cópias entre intensidade crua. Para traçar a histogramas, deleção ou amplificação de genomas foram analisados ​​em primeiro lugar limitar às regiões com valor-p inferior a 0,001. As regiões seleccionadas foram subsequentemente filtrado, limitando às regiões com, pelo menos, 10 marcadores e 2 kb de tamanho. As regiões foram então mapeado com genes conhecidos. As frequências de amplificação e exclusões foram plotados ao genoma correspondente aos locais de genes (Fig 1A). Para cada gene, o teste exato de Fisher foi aplicado para testar a associação entre o envolvimento CNV e estado recorrência amostra. Em seguida, os valores de p menos log foram plotados no gráfico Manhattan com suas localizações cromossômicas gene correspondente para gerar Fig 1B. -Hochberg Benjamini método (BH) foi aplicado para corrigir os valores de p. As vias enriquecidas CNV-gene foram seleccionados por teste de Kolmogorov-Smirnov sobre os valores p ajustados de genes. p-valores via também foram corrigidas pelo método de BH.

(A) Histograma de frequência de amplificação (vermelho) ou exclusão (azul) de sequências do genoma de leucócitos (painel superior, n = 273) de pacientes com câncer de próstata . (B) de Manhattan parcelas de valores de p em associação com a recorrência do câncer de próstata de cada gene CNV a partir de leucócitos. Status de

métodos de aprendizado de máquina para prever recorrentes e fast-recorrente.

construídos modelos de previsão para dois tipos de comparações clínicas: (1) não recorrente contra o recorrente; (2) recorrente não-rápido (ou seja, não-recorrente ou recorrentes, mas ter específico da próstata dobrando antígeno tempo [PSADT] ≥15 meses) versus fast-recorrente (PSADT≤ recorrente 4 meses). Para cada comparação, os modelos foram construídos com pontuação de Gleason (G), pontuação Nomograma (N), estado transcrição de fusão (F) ou sangue informações CNV (L) separadamente. Para Gleason score discriminação, usamos previsão binário (0 significado Gleason score ≤ 7 e 1 significado Gleason score 7). Para pontuação Nomograma, a probabilidade de sobrevivência sete anos obtido a partir https://www.mskcc.org/nomograms/prostate foi utilizado [24]. Para o status de fusão, foram aplicados oito transcrições de fusão (TRMT11-GRIK2, SLC45A2-AMACR, MTOR-TP53BP1, LRRC59-FLJ60017, TMEM135-CCDC67, KDM4-AC011523.2, MAN2A1-FER e CCNH-C5orf30) previamente identificados e validados, de estudo multicêntrico [23]. Uma pontuação de fusão binária foi utilizada (0 nenhum dos oito fusões detectados significado; 1 significa um ou mais transcrições de fusão detectado). Para previsão usando gene CNV de leucócitos, encontramos pouco poder de previsão da associação com base em genes (Fig 1B). Como resultado, foi desenvolvido um modelo em grande proporção de tamanho (LSR) com base na suposição de que as aberrações da CNV não segmentados em sangue desempenhou um papel significativo na predisposição para tumores da próstata agressividade. Como mostrado na Fig 2A, LSR foi definida como a proporção de grande tamanho CNV identificados no genoma de sangue de um determinado paciente, em que o tamanho grande foi definida por δ limiar. Em cada intervalo de duas vezes de validação cruzada, as amostras foram aleatoriamente e dividido igualmente em dois conjuntos de dados. No primeiro conjunto de dados tratados como dados de treino, o melhor parâmetro δ no modelo de LSR e os melhores pontos de corte de pontuações nomograma e LSR foram seleccionados através da maximização da maior AUC (área sob a curva) e índice de Youden (isto é, a sensibilidade + especificidade-1). Os modelos foram, em seguida, aplicada ao segundo conjunto de dados como dados de teste. A validação cruzada foi então repetido utilizando o segundo conjunto de dados como dados de treino e o primeiro conjunto de dados como dados de teste. Curvas ROC foram plotados, variando os cortes, tanto no treinamento e teste conjuntos de dados. A precisão, a sensibilidade, especificidade, índice de Youden correspondente em geral e AUC foram calculados para avaliar o desempenho. A validação igual-splitting foi repetido por 14 vezes e parte superior 2 e inferior 2 divisão com a maior ea menor soma de AUC foram removidos para evitar a atribuição acidentalmente extrema treinamento /teste. Os restantes 10 resultados de validação cruzada foram finalmente média (Tabela 1 e Tabela 2). ROC e Kaplan-Meier curvas de sobrevivência nas figuras 3-6 são os resultados representativos das 10 previsões mais próximas dos valores médios.

(A) Diagrama esquemático do modelo LSR de leucócitos CNV. (B) LSRs de leucócitos estão associados ao comportamento recorrência do câncer de próstata agressivo. Painel superior: Correlação de LSRs de genomas de leucócitos com cancros da próstata que eram recorrentes; painel inferior: Correlação de LSRs de genomas de leucócitos com cancros da próstata que eram não-recorrente de 90 meses após a prostatectomia radical. (C) a partir de LSRs leucócitos estão associados com PSADT curto. Painel superior: Correlação de LSRs de genomas de leucócitos com cancros da próstata que tinham antigénio específico da próstata recorrente soro tempo de duplicação (PSADT) 4 meses ou menos; painel inferior: Correlação de LSRs de genomas de leucócitos com cancros da próstata que não foram recorrente ou recorrentes, mas tendo PSADT 15 meses ou mais

(A) LSR derivada de leucócitos genoma CNV prevê recorrência do câncer de próstata.. curva de funcionamento do receptor (ROC) analisa usando LSRs derivados de leucócitos CNVs como parâmetro de previsão (vermelho) para prever a recorrência de câncer de próstata, contra Nomograma (azul), o grau de Gleason (verde) e o status de 8 transcrições de fusão [14] (amarelo). As amostras foram igualmente divididos aleatoriamente em treinamento e testes define 10 vezes. A análise ROC representa os resultados da divisão mais representativa. (B) Combinação de LSR (L), o grau de Gleason (G), Nomograma (N) eo status de transcrições de fusão (F) para prever a recorrência de câncer de próstata. análise ROC de um modelo que combina LSR, transcrições de fusão, Nomograma e grau de Gleason usando LDA é indicado por preto. análise ROC de um modelo que combina transcrições de fusão, Nomograma e grau de Gleason usando LDA é indicado pelo vermelho. análise ROC de um modelo que combina LSR, transcrições de fusão e grau de Gleason usando LDA é indicado pelo azul. análise ROC de um modelo que combina LSR, transcrições de fusão e Nomograma usando LDA é indicado pelo verde. análise ROC de um modelo que combina grau LSR, Nomograma e Gleason é indicado pelo amarelo. splits aleatórios semelhantes de treinamento e teste conjuntos de dados foram realizados a partir de (A).

A análise de Kaplan-Meier em pacientes previstos pelo LSR baseado em CNV de leucócitos dos pacientes como recorrente provável contra provavelmente não recorrente (parte superior esquerda). sobrevida semelhante análises também foram realizadas em segregações de caso com base em notas de Gleason (média superior), de probabilidade Nomograma (canto superior direito), o status de 8 transcrições de fusão (canto inferior esquerdo), ou de um modelo, combinando LSR, Nomograma e estado transcrição de fusão usando LDA (média baixa), ou um modelo combinando LSR, Nomograma, Gleason grau e status de transcrição de fusão usando LDA (inferior direito). Número de amostras analisadas e os valores de p são indicados.

LSR derivada de leucócitos genoma CNV prevê PSADT 4 meses ou menos. análise ROC usando LSRs derivados de leucócitos CNVs como parâmetro de previsão (vermelho) para prever PSADT 4 meses ou menos, contra Nomograma (azul), o grau de Gleason (verde) e o status de 8 transcrições de fusão [14] (amarelo). As amostras foram analisadas pelo mesmo procedimento que na Fig 3. (B) Combinação de LSR (G), grau de Gleason (L), Nomograma (N) e o estado de transcrições de fusão (F) para predizer o cancro da próstata PSADT recorrente 4 meses ou menos . análise ROC de um modelo que combina LSR, transcrições de fusão, Nomograma e grau de Gleason usando LDA é indicado por preto. análise ROC de um modelo que combina transcrições de fusão, Nomograma e grau de Gleason usando LDA é indicado pelo vermelho. análise ROC de um modelo que combina LSR, transcrições de fusão e grau de Gleason usando LDA é indicado pelo azul. análise ROC de um modelo que combina LSR, transcrições de fusão e Nomograma usando LDA é indicado pelo verde. análise ROC de um modelo que combina LSR, Nomograma e grau de Gleason é indicado pelo amarelo.

análise de Kaplan-Meier em pacientes previstos pelo LSR baseado em CNV de leucócitos dos pacientes mais propensos recorrente e tendo PSADT 4 meses ou menos contra propensos não recorrente ou recorrente, mas tendo PSADT 15 meses ou mais (parte superior esquerda). sobrevida semelhante análises também foram realizadas em segregações de caso com base em notas de Gleason (média superior), de probabilidade Nomograma (canto superior direito), o status de 8 transcrições de fusão (canto inferior esquerdo), ou de um modelo, combinando LSR, Nomograma e estado transcrição de fusão usando LDA (média baixa), ou um modelo combinando LSR, Nomograma, Gleason grau e status de transcrição de fusão usando LDA (inferior direito). Número de amostras analisadas e os valores de p são indicados.

Para testar se a combinação de múltiplas informações de dados melhora o resultado da previsão, aplicou-se a análise discriminante linear (LDA) para combinar dois ou mais fatores preditivos. Todos foram realizadas combinações possíveis. Os modelos que utilizam (1) L + N + F (2) L + N + L (3) N + F + G (4) G + F + G (5) L + N + F + G são mostrados nas Figuras 3 e 5.

Kaplan-Meier análise da curva

para a avaliação de sobrevivência (figuras 4 e 6), combinamos a validação dupla cruz de “Formação = Testing”. resultado para comparar o desempenho de diferentes métodos, com exceção de pontuação Gleason que usamos (≤7 VS 7 como ponto de corte para toda a amostra). As curvas de Kaplan-Meier foram truncados em 90 meses de acompanhamento. -Rank log teste foi realizado para calcular o valor de p entre as curvas de sobrevivência de dois resultados previstos. Para avaliar se a diferença de sobrevivência para um modelo foi significativamente melhor do que o outro, nós definimos uma estatística de teste U como a diferença absoluta das estatísticas de teste de log-rank dos dois modelos. Teoricamente sob a hipótese nula (dois modelos eram não-discriminante), a estatística de teste U seguido de uma distribuição de diferença absoluta de dois qui-quadrado independente (grau de liberdade = 1) distribuições. Como resultado, foram amostrados 10.000.000 vezes a partir da diferença absoluta de duas distribuições qui-quadrado independentes para formar a distribuição nula e avaliar os valores de p.

Copiar

Resultados

Genome anormalidades são alguns dos marcas para câncer de próstata. No entanto, pouco se sabe sobre as anormalidades cópia de genoma em tecidos não cancerosos de pacientes com câncer de próstata. Para a análise das regiões de amplificação e deleção no genoma de leucócitos de pacientes com cancro da próstata, 273 de crostas inflamatórias a partir de doentes com cancro da próstata foram analisados ​​para a CNV em todo o genoma usando Affymetrix SNP6.0. Usando os critérios de corte de tamanho ≥2 Kb, número marcador ≥ 10 e p 0,001, um total de 41589 fragmentos de CNV foram identificadas, incluindo 24213 segmentos de eliminação e 17376 de amplificação, envolvendo 17865 genes com base na anotação gene Partek (Fig 1A ). Isto traduz-se numa média de cerca de 152 CNVs por amostra. O tamanho médio de CNV no genoma dos leucócitos é de cerca de 147 Kb. Em média, 256 genes foram encontrados para ter qualquer cópia ganho número ou perda por genoma. Entre as amostras de sangue de 273, 143 amostras de sangue têm mais de 90 meses de acompanhamento clínico em termos de recorrência do câncer de próstata. Curiosamente, quando categorizar as amostras de sangue com base no estado de recorrência do câncer de próstata, CNV de leucócitos de pacientes que apresentaram recorrência após prostatectomia radical teve uma média de 3,2 vezes maior do tamanho do CNV contra CNV de pacientes que não tiveram recorrência por pelo menos 90 meses. Dois lados teste t mostrou uma forte correlação entre o tamanho de CNV nos leucócitos e recorrência de cancro da próstata (p = 2,2 x 10

-16), o que sugere que o tamanho da linha germinal CNV pode desempenhar um papel significativo na predisposição de cancro da próstata para cursos clínicos agressivos. No entanto, não específica (FDR = 0,05) gene envolvido na CNV fragmento de genoma atinge o limiar que se diferencia do cancro da próstata recorrente versus aqueles de não-repetição (Figura 1B). Juntos, os resultados indicam que o modelo de previsão com base em genes é improvável ter sucesso na leucócitos análise CNV, mas distribuição de tamanho de CNVs pode ser preditivo.

Para examinar se a linha germinal CNV é preditivo de recorrência do câncer de próstata, um algoritmo utilizando rácios de o número de grandes fragmentos de tamanho foi desenvolvido. Tal como ilustrado na figura 2A, para cada amostra, uma grande proporção de tamanho (LSR) é definida como a proporção de fragmentos de CNV cujos tamanhos são maiores do que um limite de exclusão de tamanho (δ) sobre o número total de fragmentos de CNV. Por exemplo, 3 dos 7 detectado CNVs na figura 2A são encontrados “grandes fragmentos de tamanho” (tamanho ≥ ô) e o LSR deste paciente é calculado como 3/7 = 0,43. Na figura 2B, a distribuição de LSR de doentes que sofreram recorrência do câncer de próstata mostraram valores significativamente mais elevados do que aqueles que não tiveram recorrência. De modo semelhante, a distribuição de LSR de pacientes com recidiva rápido (PSADT≤ 4 meses) era significativamente mais elevada do que as de doentes recorrentes não rápido (não recorrentes ou recorrentes mas possuindo PSADT≥ 15 meses, a Fig 2C). No modelo de LSR, o δ limite de tamanho é determinado através da maximização da AUC. Quando os valores ô foram otimizados (S1 Fig, δ = 10

4,5 = 31622 pb para modelo de previsão recorrente e 1B selecionado δ = 10

5,7 = 501187 pb para uma rápida previsão recorrente), que prevê a recorrência de câncer de próstata com precisão de 77,6%, com sensibilidade de 80,4% e especificidade de 68,6%, enquanto a recorrência rápida com precisão de 62,4%, com sensibilidade de 72,9% e especificidade de 54,1%.

Para validar este modelo, 143 amostras de sangue (S1 tabela) a partir de pacientes com câncer de próstata foram divididos aleatoriamente em um conjunto de treinamento (72 amostras) e um conjunto de testes (71 amostras). O δ de corte de grande tamanho otimizado e LSR-corte foram obtidos a partir da análise de treinamento, maximizando o índice de Youden. Os parâmetros foram então aplicados aos dados de ensaio estabelecidos para avaliar a precisão da previsão. A validação foi então repetido 14 vezes e o melhor 2 e pior 2 foram removidos para evitar extrema randomização. Os restantes 10 resultados destas análises de formação e de ensaio foram em média (Tabela 1). Como mostrado na Fig 3A (análise representativa em S2 Tabela) e a Tabela 1, a precisão do modelo de formação de LSR na previsão de recorrência de cancro da próstata atinge 76,5%, com sensibilidade de 77,8% e especificidade de 72,4%. Quando os parâmetros foram aplicados ao conjunto de testes, a precisão da previsão atinge 73,9%, com sensibilidade de 76,8% e especificidade de 65,6%. Estas taxas de predição são melhores do que os de Nomograma (66,0% de precisão para a formação e 61,3% para o ensaio, a Tabela 1), e são significativamente mais elevados do que os de Gleason grau de com corte simples (40,3% para a formação e 39,4% para o ensaio; p = 8.6×10

-3 para a formação e p = 5.8×10

-3 para o teste por comparação ROC, ver Quadro 1 e S3 Tabela).

para examinar se a combinação de diferentes modalidades irá melhorar a previsão modelo, LSR sangue, Nomograma, grau de Gleason eo status de 8 transcrições de fusão (TRMT11-GRIK2, SLC45A2-AMACR, MTOR-TP53BP1, LRRC59-FLJ60017, TMEM135 -CCDC67, KDM4-AC011523.2, MAN2A1-FER e CCNH-C5orf30 ) [23] nas amostras de câncer de próstata foram combinados por meio de análise discriminante linear (LDA) para treinar o modelo de previsão no conjunto de treinamento. Esse modelo gerou uma precisão da previsão de 87,9%, com sensibilidade de 88,8% e 85,4% de especificidade para a recorrência de câncer de próstata no conjunto de treinamento, e precisão de 75,7%, com sensibilidade de 81,7% e 64,0% de especificidade no conjunto de testes (Fig 3B e Tabela 1). Curiosamente, a combinação de LSR, Nomograma eo status de transcrições de fusão parece produzir os melhores resultados de previsão: 86,4% de precisão no conjunto de treino e precisão de 78,6% no conjunto de testes. Estas taxas de predição parecem significativamente melhor do que os que são gerados a partir de qualquer modalidade única (Tabela 1). Para avaliar a contribuição de cada uma destas modalidades para o modelo de combinação, a subtracção de um de cada modalidade de cada vez foi feita no modelo para avaliar os impactos respectivamente. Como mostrado na Figura 3B e Tabela 1, subtração de LSR modalidade parecia ter o impacto mais significativo sobre a previsão de recorrência do câncer de próstata: As taxas de precisão previsão de cair de 87,9% para 75,1% (ROC p = 0,044, consulte S3 Table) na conjuntos de treinamento e de 75,7% para 64,0% (ROC p = 0,037) nos conjuntos de testes. Isto foi seguido por genes de fusão (p-valor entre as duas curvas ROC foi de 0,109 para a formação e 0,159 para o teste). Por outro lado, a subtração do grau Nomograma ou Gleason não teve impacto significativo no desempenho de previsão do modelo (Tabela 1, Fig 3 e S3 Tabela).

Para examinar o desempenho de previsão de pontuação LSR na PSA sobrevida livre de pacientes com câncer de próstata, de Kaplan-Meier foram realizadas análises em 143 pacientes que tinham informação clínica definitiva (S1 tabela). estatuto de recorrência para testar amostras foram previstos pelo modelo de formação do conjunto de treinamento, eo modelo de predição de amostras de treinamento foi treinado desde conjunto de testes. As duplas resultados de previsão de validação cruzada incorporadas foram utilizados para dividir os 143 pacientes em grupo recorrente previsto e grupo não-recorrente. Como mostrado na Fig 4, quando os pacientes foram previstos por LSR como de alto risco de recorrência do cancro da próstata, apenas 12,1% dos pacientes sobreviveu por 90 meses sem recorrência, enquanto que mais de 52,3% dos pacientes com modelo LSR previsto para ser provavelmente não recorrente sobreviveram 90 meses sem qualquer sinal de câncer de próstata recorrente (média p = 9,9 x 10

-5 pelo teste de log-rank, Fig 4 e S4 Tabela). Em contraste, a pontuação de Gleason não conseguiu produzir resultados diferentes estatisticamente significantes para recorrentes e grupos não-recorrentes (p = 0,113 pelo teste de log-rank). Nomograma, no entanto, gerou melhores resultados clínicos estatisticamente significativa (33,9% versus 18,4% de taxa de sobrevivência e p = 0,0038 para o teste de log-rank) quando os pacientes foram segregados com base no previsto recorrente versus não-recorrente por Nomograma. Quando transcrições de fusão, LSR leucócitos genoma e Nomograma foram combinadas, melhorou os resultados da previsão do cancro da próstata para a sobrevivência de PSA livre de 58,1%, se eles foram previstos para ser não recorrente pelo modelo contra 16,9%, se eles foram previstos como recorrente provavelmente pela o modelo combinado (p = 2.9×10

-6 para as duas curvas de sobrevivência). Este modelo de modalidade combinada supera significativamente qualquer modelo de previsão única modalidade (p = 6.6×10

-3 contra LSR, p = 1.8×10

-5 contra Gleason, p = 3.5×10

-4 contra Nomograma, p = 0,017 contra transcrições de fusão, consulte S5 Tabela). Quando Gleason classificação foi adicionado ao modelo, ele não melhorou a precisão da previsão, mas melhorou as curvas de sobrevivência.

Morte

O câncer de próstata relacionado está intimamente associada com o aumento da velocidade de PSA seral recorrente. PSADT curta ( 4 meses) tinha sido usado como um substituto para o cancro da próstata morte relacionada para os últimos 15 anos [25; 26]. Para examinar se LSR no genoma de leucócitos também é preditiva de curta PSADT, amostras de sangue (S1 tabela) foram divididos aleatoriamente em formação (65 amostras) e ensaios (64 amostras) sets. Processos similares foram realizados nestas amostras como descrito na previsão recorrência. Como mostrado na Tabela 2, o modelo de LSR nos conjuntos de dados de treino e de teste produziu uma precisão de previsão de PSADT = 4 meses a 67,7% e 57,5%, respectivamente. A curva ROC do modelo de LSR contra a linha diagonal (palpite aleatório) tem valor p = 0,016 para o conjunto de treinamento e 0.017 para o conjunto de testes (Fig 5, Tabela 2 e S6 Tabela). A previsão com base na pontuação de Gleason rendeu% de precisão de 42,3 por conjunto de treinamento, e 44,5% para o conjunto de dados de teste. Por outro lado, Nomograma gerou uma precisão da previsão de 67,8% e ROC p-valor de 0,0082 no conjunto de treino e precisão de 64,5% e 0,0014 p-valor ROC no conjunto de testes. O status de transcrições de fusão nas amostras de câncer de próstata produziu uma precisão de 68,8% e 68,4% na formação e dados de testes conjuntos, respectivamente. Estes 4 métodos não pareceu ser significativamente melhor do que o outro, quando foram realizados testes proporção emparelhadas. No entanto, quando todos os 4 métodos foram combinados, ela produziu uma precisão de 83,0% (ROC p = 5,3 x 10

-9) para o (-4 ROC p = 1.3×10

) conjunto de treinamento e 72,0% para o conjunto de testes. Estes resultados foram melhores do que qualquer outra modalidade de previsão em termos de precisão, a AUC e valores do Índice de Youden (Tabela 2). Para investigar o impacto de cada uma destas modalidades no modelo de previsão, cada modalidade foi subtraída individualmente a partir do modelo de previsão combinada. Os resultados de predição mostrou uma gama de 72,8-82,5% de precisão no conjunto de dados de treino e 65,0-73,6% de precisão no conjunto de dados de teste, quando uma modalidade foi subtraído. Curiosamente, quando um LSR sangue ou estatuto transcrição de fusão câncer foi subtraído, os modelos combinados não produziram significativamente melhores previsões do que qualquer previsão modalidade única excepção (S7 Table) de Gleason, o que sugere que o status LSR sangue e transcrição de fusão foram as contribuições mais significativas na combinadas modelo de previsão.

Para analisar o impacto da previsão PSADT curto no cancro da próstata sobrevivência livre de PSA, Kaplan-Meier foram realizadas análises em amostras segregado em função da previsão PSADT pelo LSR leucócitos genoma. Como mostrado na Figura 6 e S8 Mesa, quando as amostras previstas por LSR sangue para ter meses PSADT≤4, a taxa de sobrevida livre de PSA foi de 17,1% em 90 meses após a prostatectomia radical, enquanto que a taxa de sobrevivência melhorou para 41,5% para aqueles previstos ter meses PSADT≥15 ou não-recorrente (teste log-rank p = 0,0039, ver figura 6 e S8 Tabela). Em contraste, as curvas de sobrevida previstos pelo escore de Gleason terminou com taxa de sobrevida semelhante em 90 meses, e o valor de p entre duas curvas era 0,0816 pelo teste de log-rank. Nomograma teve a taxa de sobrevida livre de PSA de 21,4% quando os pacientes foram previsto para ter meses PSADT≤4. Esta taxa de sobrevivência foi de 31,5% quando os pacientes foram previstos para ser não-recorrente (p = 0,0021 pelo teste de log-rank). No entanto, quando o modelo combinando Gleason, Nomograma, transcrições de fusão e LSR sangue foi aplicada, a taxa de sobrevida livre de PSA foi de apenas 7,9% quando os pacientes foram previsto para ter meses PSADT≤4, enquanto a taxa de sobrevivência foi de 52,1% quando os pacientes eram previsto para ter PSADT 4 meses ou não-recorrente (p = 1,6×10

-7). O modelo combina 4 modalidades superou significativamente os modelos de previsão com base em Gleason grau (p = 1,5×10

-6) ou Nomograma (p = 3,0×10

-5) ou LSR (p = 1.9×10

-5 ) ou transcrições de fusão (p = 0,0018) sozinho (S9 Tabela). Estas análises indicam claramente que os tamanhos de cópia variação do número de leucócitos humanos são correlativos com o comportamento clínico de câncer de próstata. A combinação do genoma CNV dos leucócitos com informações clínicas dos pacientes com câncer de próstata renderia tanto modelos de previsão de melhoria para o comportamento do câncer de próstata.

Discussão

presença extensiva de CNV é uma das características importantes do malignidades humanas. CNV em tecidos normais de indivíduos saudáveis ​​também foi bem documentada [14; 27; 28]. Uma vez que a análise CNV é largamente insensível a contaminação pequeno, pode requerer mais do que 25% de contaminação para detectar uma alteração do número de cópias no genoma. Pequena contaminação da corrente sanguínea pelas células cancerosas da próstata é geralmente sem ser detectado. O CNVs detectado das crostas inflamatórias em nosso estudo provavelmente representam o genoma CNVs a partir de leucócitos. Nossos estudos sugerem que os tamanhos de CNV de leucócitos de pacientes com câncer de próstata são altamente correlativo com os resultados clínicos de câncer de próstata. Estes CNVs se espalha por todos os cromossomos. A maioria destes CNVs se sobrepõem com a sequências de codificação do genoma do gene. Curiosamente, nem fragmento específico CNV nem gene envolvido por estes CNVs é significativamente associada com o resultado do câncer de próstata, sugerindo que o impacto das CNVs sobre o câncer de próstata é de natureza coletiva. cross-validations).

doi:10.1371/journal.pone.0135982.s017

(DOCX)

Acknowledgments

We

Deixe uma resposta