PLOS ONE: Geração de “virtual” Grupos de Controle para Trials único braço Prostate Cancer adjuvantes

Sumário

É difícil construir um grupo de controle para ensaios de terapia adjuvante (Rx) de câncer de próstata após prostatectomia radical (RP) devido a questões éticas e aceitação do paciente. Utilizamos 8 modelos de ajuste de curvas para estimar o tempo para 60%, 65%, 95% … possibilidade de sobrevivência livre de progressão (SLP) com base nos dados obtidos a partir Kattan pós-RP nomograma. Os 8 modelos foram sistematicamente aplicado a um conjunto de treinamento de 153 casos pós-RP sem adjuvante Rx para desenvolver 8 subconjuntos de casos (conjuntos de casos de referência) cuja vezes PFS observados foram previstas com mais precisão por cada modelo. Para preparar um grupo de controle virtual para um julgamento Rx de braço único adjuvante, primeiro selecione o modelo ideal para os casos de teste com base na distância euclidiana ponderada mínima entre o caso julgamento marcado eo caso de referência fixado em termos de características clínicas, e em seguida comparar os tempos de PFS virtuais calculados pelo modelo ideal com o PFSS observada dos casos de teste pelo teste logrank. O método foi validado utilizando um conjunto de dados independente de 155 pacientes pós-RP, sem Rx adjuvante. Em seguida, aplicou o método aos pacientes em um ensaio de Fase II de adjuvante químico-hormonal Rx pós RP, que indicou que o adjuvante Rx é altamente eficaz no prolongamento da PFS após RP em pacientes com alto risco de recorrência do câncer de próstata. O método pode gerar com precisão grupos de controle para de braço único, pós-RP ensaios adjuvante RX para câncer de próstata, facilitando o desenvolvimento de novas estratégias terapêuticas

Citation:. Jia Z, Lilly MB, Koziol JA, Chen X, Xia XQ, Wang Y, et al. (2014) Geração de “virtual” Grupos de Controle para Trials único braço Prostate Cancer adjuvante. PLoS ONE 9 (1): e85010. doi: 10.1371 /journal.pone.0085010

editor: Stephanie Filleur, Texas Tech University Health Sciences Center, Estados Unidos da América

Recebido: 21 Abril, 2013; Aceito: 24 de novembro de 2013; Publicação: 21 de janeiro de 2014

Direitos de autor: © 2014 Jia et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este estudo foi apoiada por Estados Unidos Institutos Nacionais de Saúde concede NCI UO1CA11480 e NCI UO1CA152738 a D. Mercola e da Universidade de Desenvolvimento Award California Irvine Faculdade Carreira e Chao Família Comprehensive Cancer Center Seed Grant a Z. Jia. M. McClelland foi apoiado em parte pelo Prêmio Número P30CA062203 do Instituto Nacional do Câncer e W81XWH-08-1-0720 do CDMRP. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:. Yipeng Wang é funcionário de AltheaDx Inc., e Zhenyu Jia é um consultor para AltheaDx Inc. Este não altera a adesão dos autores para todas as políticas de PLoS One sobre os dados e materiais de compartilhamento.

Introdução

prostatectomia oferece excelente controle da doença para a maioria dos pacientes com câncer de próstata clinicamente localizado Câncer. No entanto, para os doentes com um elevado risco de recidiva, terapia adicional (adjuvante) pode ser necessário para evitar a recorrência da doença. Inscrever grupos de controle em estudos exploratórios de fase precoce de novos regimes adjuvantes é problemática devido a questões éticas e aceitação do paciente. A comparação de novos tratamentos com controles históricos pode produzir resultados tendenciosos, porque as diferenças na seleção de pacientes pode facilmente confundir os resultados. O melhor controle seria os próprios pacientes se eles não foram tratados com terapia adjuvante. Portanto, uma alternativa aos grupos de controle simultâneos ou históricas pode ser a construção de um grupo de controle “virtual” para um conjunto de pacientes por meio da estimativa de sobrevida livre de progressão (PFS) com base em sua pós-prostatectomia radical (pós-RP) características clínicas. Os PFS estimados para o grupo de controlo virtual será comparado com o PFS observada para o grupo tratado utilizando o teste de logrank [1], [2] para avaliar a eficácia da terapia. Tais controles provavelmente seria mais estreitamente alinhados com os sujeitos do estudo do que seria um conjunto de controles históricos que apenas aproximadas as características da população de estudo. Assim, o passo chave para a geração de um grupo de controlo prevista é para estimar os tempos de PFS com base em características clínicas pós-RP dos pacientes.

nomogramas preditivo na oncologia são representações gráficas de fórmulas matemáticas ou algoritmos que incorporam observações para características clínicas relevantes, a fim de prever um ponto final particular. Tais nomogramas são normalmente baseados em métodos estatísticos tradicionais, como a regressão logística multivariada ou Cox análise de riscos proporcionais [3] – [5]. O nomograma “Kattan” foi originalmente apresentado em 1999 [6], e foi atualizado em 2005 [7] e 2009 [8]. Estes nomograms utilizar parâmetros específicos do paciente para calcular uma série de probabilidades de ser livre de progressão em vários momentos seguintes prostatectomia. Todas as versões são igualmente precisos em prever a possibilidade de pós-RP PFS, com concordância-índices entre 0,7680 e 0,7859 [9]. Embora nomogramas foram usados ​​para estimar as probabilidades de PFS, por vezes arbitrárias [10], a versão on-line disponível do Kattan pós-RP nomograma [6] prevê apenas PFS

probabilidades

para cada paciente em um número de pontos no tempo, por exemplo, no ano 2, 5, e 7, após a cirurgia. Estes valores de probabilidade Kattan discretas não pode ser utilizado para a análise de logrank; eles precisam ser convertidos primeiro a uma medição de tempo único para cada paciente.

Aqui nós apresentamos um novo método que envolve 8 modelos para a conversão dos valores de probabilidade Kattan para medições de tempo estimados, com cada modelo representado por um conjunto caso de referência que tem um nível diferente de risco de recaída. coortes de teste com maior risco de recaída requerem modelos de rigor mais elevados. O modelo ideal é selecionado para a coorte julgamento por cuidadosamente combinando o caso 8 de referência define a coorte julgamento com base em características clínicas pós-RP dos pacientes.

Materiais e Métodos

conjuntos de dados de pacientes

formação e conjuntos de dados de validação.

casos prostatectomia radical para a formação e validação foram identificados a partir de práticas dos autores e bancos de dados de pesquisa. Estes assuntos não tinha recebido nenhuma forma de adjuvante ou terapia de resgate. Todos os conjuntos de dados utilizado um limiar de PSA 0,2 ng /mL, ou da nova aparência de lesões radiográficas consistentes com metástases, para definição de recaída. Frequência de monitoramento radiográfico e PSA foi deixada ao critério dos médicos que tratam. Nós obtivemos a aprovação da UC Irvine IRB. consentimento escrito foi dada pelos pacientes, incluindo a sua informação normalmente armazenada na base de dados do hospital para ser utilizado para a investigação. casos de alto risco exibiu uma ou mais das seguintes características: 1) de PSA pré-operatório 15 ng /ml, 2) Pontuação de Gleason ≥8, 3) extraprostático, 4) invasão das vesículas seminais, 5) de metástases linfáticas , 6) margens cirúrgicas positivas, 7) persistentemente detectáveis ​​PSA ≥0.2 ng /mL mais de 45 dias após a cirurgia. A maioria dos casos teve dois ou mais desses recursos. Para cada fonte de formação e validação de conjuntos de dados, todos os casos que atendiam as definições necessárias, e que tiveram todos os dados pertinentes, foram utilizados. dados necessários incluídos tipo de operação, a data da operação, nível de PSA pré-operatório, a idade no momento da cirurgia, prostatectomia pontuação de Gleason, estado vesícula seminal, status do nó de linfa, status da margem, o estado da extensão extraprostática, um ou mais PSA valores ≥45 dias após cirurgia data, status de recaída, data de avaliação do estado de recaída, e pelo menos 1 ano de tempo de acompanhamento.

Nós criamos um conjunto de treinamento de 153 casos de câncer de próstata que consistem em pacientes com uma ampla gama de riscos de recaída após prostatectomia radical. A maioria consistia de 112 casos de RP na praia VA Hospital Longa (Long Beach, CA) a partir de Dezembro de 1990 a Junho de 1998. Para aumentar a proporção de casos de médio e de alto risco, nós adicionamos 41 casos a partir do registo UCI SPECS de 1.220 casos . As especificações (parceiros estratégicos para a Avaliação de Câncer assinaturas) projecto de consórcio foi um estudo que procurou identificar biomarcadores preditivos para recidiva precoce após a prostatectomia NIH /NCI-financiado [11] – [15].

Um conjunto de dados de validação de 155 casos foi construída com 62 casos da Universidade da Califórnia, em Irvine (UCI), 32 casos de Loma Linda University (OLL), e 62 casos adicionais a partir do registo UCI SPECS utilizados exclusivamente para validação (SPECS (2)). Nenhum destes casos SPECS posteriores (SPECS (2)) foram usados ​​no conjunto de dados de treino. Porque nós antecipamos o uso do nosso método com o de braço único estudos de terapia adjuvante, foram utilizados apenas os casos de médio e de alto risco na validação definida para imitar a população provável que estariam envolvidos em tais estudos. Características dos conjuntos de treino e de validação podem ser encontrados na Tabela 1.

adjuvante terapia conjunto de dados.

Entre 2001 e 2006, 20 pacientes com câncer de próstata de alto risco foram tratados com abertas RP seguido por terapia adjuvante multimodalidade (HR, MBL) [16]. Todos os sujeitos eram de alto risco de recorrência de cancro da próstata, com base em uma ou mais das seguintes características clínicas: pT3 ou doença pT4 (80%), a pontuação de Gleason 8-10 (60%), extensão extraprostática (65%), positiva margens cirúrgicas (55%), do tumor em vesículas seminais (35%) ou nódulos linfáticos (75%), ou de elevado nível de PSA pré-operatório ( 15 ng /mL; 40%). Os pacientes receberam docetaxel e terapia de estramustina de acordo com o regime de Petrylak, et al [17], para uma média de seis ciclos, começando pouco tempo (média de 2 meses) após a cirurgia. Eles também receberam a terapia de privação de andrógeno concorrente (ADT) por uma mediana de 4,3 anos. Os sujeitos foram monitorizados quanto a recorrência da doença por medições em série dos níveis de PSA, bem como pelos parâmetros clínicos padrão. Tempo de recaída foi definida como o tempo desde a cirurgia para o primeiro nível de PSA de 0,2 ng /ml ou mais, após o componente de tratamento de quimioterapia. Estes pacientes foram acompanhados por uma média de 7,5 anos, com um máximo de 11,0 anos.

Nomograma

A aplicação web (https://www.mskcc.org/cancer-care /adulto /próstata /predição-tools) com base na Kattan nomograma de 1999 [6] foi usado para calcular as probabilidades PFS aos anos 2, 5 e 7 após a prostatectomia com base em variáveis ​​clínicas, incluindo a idade, o status da margem, estágio do tumor, Gleason score primária , Gleason score secundário, nível de PSA pré-operatório, estado vesícula seminal, estado de linfonodos e ano da prostatectomia.

métodos estatísticos

Para cada paciente, nós montados os valores de probabilidade Kattan PFS discretos no ano 0 (assumido como sendo 100%), 2, 5 e 7 após RP com uma curva de Loess [18], [19] ou Spline [20] (ver detalhes no Suplemento e suplementar Figura S1 em S1 Arquivo). A curva ajustada foi utilizado para estimar o tempo para endpoints variáveis,

ou seja

, o tempo para 10%, 15%, …, ou 95% de chance de sobrevivência, aqui denominado

modelo

s (modelo 0,10, model.15, …, model.95). Neste estudo, nós só usamos 8 modelos, todos acima de risco médio,

ou seja

model.60, model.65, model.70, model.75, model.80, model.85, model.90, e model.95 porque estamos interessados ​​principalmente em estudos envolvendo pacientes com alto risco de recorrência.

o passo chave para o nosso método é a seleção do modelo adequado para um determinado conjunto de casos de teste (pacientes tratados). Nós inicialmente esperado que model.50 (hora de 50% de chance de sobrevivência) seria ideal. No entanto, este modelo foi insuficiente para prever PFS, especialmente para casos de grupos de maior risco. Por conseguinte, explorou modelos adicionais com maior rigor. Foram identificados subconjuntos dos casos de treinamento (caso de referência denominado define) para cada um dos 8 modelos, onde as vezes PFS observados estão mais estreitamente previstos por cada modelo específico. Os casos de teste foram então comparados aos 8 conjuntos de referência baseados na similaridade das características clínicas para determinar o melhor modelo para a geração de controles virtuais para os casos de teste.

Construção de conjuntos de referência.

A processo de construção de 8 conjuntos de referência para os modelos 8 está representada na Figura 1 (parte superior). Os 153 casos de treinamento (casos sem terapia adjuvante) foram classificados do curto espaço de tempo PFS ao longo tempo PFS baseada no PFS observado os resultados para esses pacientes. Para cada modelo (model.60, model.65, … model.95), começamos com um subconjunto inicial de 30 casos e, em seguida, adicionou casos adicionais, a fim de a piscina de classificação dos casos de treinamento, até que todos os 153 casos haviam sido utilizados. Como cada caso adicional foi adicionado, calculou-se repetidamente um grupo comparador PFS utilizando cada um dos modelos de 8, e comparou estes tempos calculados PFS para os tempos reais de PFS. O acordo entre os tempos de PFS observados e calculados para um subconjunto dos casos de treinamento foi quantitativamente avaliada pela estatística qui-quadrado do teste logrank. Se os tempos de PFS calculados gerados pelo modelo acordado com os tempos reais de PFS, as duas curvas de Kaplan-Meier devem sobrepor. A estatística do qui-quadrado do teste logrank, então, seria menor do que 3,84 que se traduz em value≥0.05 ap na distribuição qui-quadrado com grau de liberdade 1. No entanto, ifthe duas curvas de Kaplan-Meier separaria, as estatísticas qui-quadrado faria ser maior do que 3,84. Para qualquer modelo, um subconjunto de casos que produziu a estatística de qui-quadrado mínimo teriam as características clínicas óptimas para a utilização com esse modelo. Portanto, para cada modelo, as estatísticas do qui-quadrado de análise de logrank foram representados graficamente contra o número de casos adicionadas (figura 2). O conjunto de casos que produziu o mínimo de Qui-quadrado estatística, indicando concordância máximo de vezes PFS calculados e tempos PFS observados, foi escolhido como “ótimo” para esse modelo particular.

Seleção de o melhor modelo.

para determinar o melhor modelo para os casos de teste de tratamento, uma série de variáveis ​​clínicas foram combinados usando a distância euclidiana ponderada dos parâmetros clínicos, entre os casos de teste e cada conjunto de casos de referência (Eqn . 1). As variáveis ​​clínicas consideradas no cálculo da distância incluíram idade, status da margem, estágio do tumor patológico, Gleason score principal, Gleason score secundário, nível de PSA pré-operatório, estado vesícula seminal, status do nó de linfa. Nós colocado mais peso no variáveis ​​contínuas do que em variáveis ​​binárias no cálculo da distância,

ie

, 17%, 5%, 17%, 17%, 17%, 17%, 5%, 5%, respectivamente, para estes 8 variáveis ​​clínicas. A distância euclidiana ponderada com base nos 8 variáveis ​​clínicas é definido como: (1) onde é a distância euclidiana ponderada para o modelo

m

, é peso para

i

variável clínica th, é a mediana valor da

i

variável clínica th para os casos de teste de tratamento, e é o valor médio do

i

variáveis ​​clínicas th do

m

th caso de referência definido (

m

= 1, …, 8). O modelo de referência cujos casos tinha a distância Euclidiana ponderada mínima para os casos de teste foi então seleccionado para a geração do grupo de controlo através da estimativa do tempo de recaída (ou tempo PFS “virtual”) para cada um dos casos de teste. Os tempos de PFS observados para os casos de teste foram então comparados aos estimados vezes PFS para esses mesmos pacientes (controles virtuais) através do teste logrank, chegar a uma conclusão clínica. O processo é mostrado na Figura 1 (parte inferior).

Todas as análises foram realizadas no programa estatístico R (https://www.R-project.org/) e escrito em linguagem R. Uma aplicação web para implementar o método proposto é publicamente disponível em https://mercola.hs.uci.edu/singlearm/. O observada global e previu PFSS para os pacientes tratados foram resumidos pelo método de Kaplan-Meier [21]. O teste logrank [1], [2] foi utilizado para comparar as curvas de Kaplan-Meier.

Resultados

Validação utilizando casos de testes independentes

Para demonstrar o desempenho do método , foi utilizado um conjunto de validação completamente independente de 155 casos (Materiais e Métodos). O modelo ideal (model.75) foi identificado para o conjunto de teste. A comparação

via

o teste logrank indicaram que os tempos PFS previstos concordou com os tempos PFS observados muito bem (= 0,094 e

p

valor 0,05; Figura 3).

Para explorar ainda mais o desempenho do método criamos 6 menores conjuntos de validação dos pacientes de validação 155. O primeiro e segundo subgrupos consistem em pacientes que tiveram a cirurgia nos anos 2000-2004 e anos 2005-2011, respectivamente. Os terceiro e quarto subgrupos são compostos de pacientes com classificação de Gleason 6-7 (3 + 4) e 7 (4 + 3) -10, respectivamente. Os quinto e sexto subgrupos representam os pacientes com PSA inicial ≤9 e pacientes com PSA inicial 9, respectivamente. As comparações entre os tempos de PFS observar e os valores calculados PFS

via

o teste logrank para estes conjuntos de validação estão resumidos na Figura 4A-4F. Os tempos de PFS calculados concordou com os tempos PFS observados muito bem ( ‘s 3,84 e valores 0,05)., Demonstrando que o método de previsão foi robusto através de um espectro de características clínicas, tipos de operações, e as datas de operação

Painel A: cirurgia 2000-2004; Painel B: cirurgia 2005-2011; Painel C: Gleason 6-7 (3 + 4); Painel D: Gleason score 7 (4 + 3) -10; Painel E: PSA pré-operatório ≤9; Painel F:. PSA pré-operatório 9

Aplicação de estudos de fase II adjuvante

Temos realizado um estudo de fase II de quimioterapia adjuvante e ADT para os indivíduos com alto risco de recaída após prostatectomia radical [16]. Para determinar se o regime é activo no prolongamento PFS, utilizou-se como um grupo de comparação, os tempos esperados de PFS derivadas do paciente agregado dados Kattan pelos métodos acima. A correspondência de oito parâmetros clínicos de nossos pacientes com os 8 casos conjuntos de referência mostrou que model.60 seria o melhor modelo para calcular os valores de PFS “virtuais”. Pelo modelo selecionado, convertemos as probabilidades previu-nomograma ao tempo PFS estimada para cada um dos 20 pacientes (PFS como se eles não receberam terapia adjuvante) e comparou o PFSS observado com o PFSS previsto pelo método de Kaplan-Meier. O PFS observada diferiu significativamente do PFS estimados com = 19,3 e valor de p 0,0001 pelo teste de logrank (Figura 5A). Esta comparação tinha poder de 97% para detectar uma diferença na sobrevivência dadas as taxas de sobrevivência de 10 anos em dois grupos são 80% e 20% (aproximada a partir de curvas de Kaplan-Meier da Figura 5), ​​respectivamente. O cálculo de energia em vários cenários com base na fórmula simplificada de Rubenstein [22], [23] é dada na Tabela Suplementar S1 no arquivo S1, indicando que nossa análise foi devidamente alimentado para detectar discordância entre o PFSS calculados e do PFSS observado.

Painel a: Comparação do previsto e observado PFS para uma série de terapia adjuvante (n = 20) receberam terapia quimio-hormonal pós-operatório. Painel B: análise de Kaplan-Meier de PFS para pacientes de terapia adjuvante (n = 20) e combinados controles históricos (n = 20) a partir do conjunto de treinamento

Como uma confirmação adicional de que este regime de terapia adjuvante. está ativo, comparamos a PFS observada com controles históricos – um conjunto de 20 casos clinicamente pareados que foram selecionados manualmente a partir dos casos de treinamento 153 (ver Tabela 1). Nenhum destes comparadores receberam terapia adjuvante. No entanto, PFS para o nosso grupo de controlo tratado foi significativamente melhor do que a observada para os históricos, sujeitos clinicamente combinados do grupo combinado (Figura 5B). No total estes dados mostram que o método de grupo de controle virtual identifica esquemas de terapia adjuvante que são capazes de melhorar a endpoint significativa, PFS.

Discussão

É crucial para a construção de um grupo de controle para avaliar a eficácia de uma terapia pós-prostatectomia adjuvante quando se inscrever grupos de controle torna-se impraticável. Comparações com

controles

históricos podem dar resultados anómalos devido à amostragem viés. Portanto, o melhor controle seriam os próprios pacientes se eles não foram tratados com terapia adjuvante. Nomogramas foram utilizados para construir um braço de controlo com base nos dados históricos do paciente a tratar com os ensaios de braço único (apenas braço de tratamento). Por exemplo, Gulley et al. utilizado o nomograma Halabi [24] para estimar a sobrevivência mediana para cada paciente, e, em seguida, comparou a sobrevivência estimadas para a sobrevivência observada (sobrevivência pós-tratamento) usando o teste de logrank [1], [2]. O nomograma Halabi foi derivado de pacientes com câncer de próstata metastático resistente à castração, e, portanto, não é apropriada para o pós-RP estudos de terapia adjuvante. nomogramas pós-prostatectomia também têm sido utilizados para gerar grupos de comparação para os ensaios de terapia adjuvante. Kibel et ai. Realizamos um estudo de docetaxel adjuvante de fase II em pacientes de alto risco [25]. A fim de comparar com a observada PFS, usaram uma versão modificada do nomograma Kattan [6] para prever progressão de cada paciente, e em seguida a média das probabilidades em cada tempo de evolução entre pacientes [25]. estratégia semelhante foi utilizada para avaliar a eficácia e segurança do pertuzumabe num ensaio de fase II, o cancro da próstata [10]. Este método aplica-se quando a estimativa nomograma de PFS está disponível em horários arbitrários. No entanto, a versão online do Kattan pós-RP nomograma [6] prevê apenas PFS

probabilidades

para cada paciente em 3 pontos no tempo, ou seja, anos 2, 5 e 7. Assim, são necessários novos enfoques para estender a aplicação da versão online do Kattan pós-RP nomograma de dados de ensaios com um único braço. métodos baseados em modelos foram propostos para dados do estudo de braço único de fase II [26]; no entanto, esta abordagem tem sido aplicada apenas à situação em que ponto no tempo único é considerada, por exemplo, a previsão da probabilidade de sobrevivência de 2 anos.

A nossa expectativa inicial era de que model.50 (hora de 50% de chance de recorrência) seria o modelo ideal para a maioria dos casos de teste. Inesperadamente, model.50 desempenho foi abaixo do ideal,

i.

Os tempos PFS calculados foram significativamente mais do que os tempos de PFS observados, indicando que model.50 (ou mediana PFS) pode superestimar o PFS para pacientes de alto risco. Por isso, estudaram o impacto de características clínicas sobre o desempenho de 8 modelos adicionais (model.60, model.65, model.70, model.75, model.80, model.85, model.90, model.95). Neste estudo, foi desenvolvido um novo método baseado em nomograma de Kattan [6] e que permitiu cálculo preciso dos tempos PFS previstos para ensaios com composições de pacientes distintos.

Quando nós construímos conjuntos de referência para os 8 modelos, tinha notado que o modelo ideal para a construção de um grupo de controle variou com base nas características clínicas dos casos usados. Model.60, model.65, model.70 e model.75 formada uma classe de modelos (classe 1) que se encaixavam pacientes de risco moderado. Em model.80 contraste, model.85, model.90 e model.95 formou outra classe de modelos (classe 2) que funcionavam melhor para pacientes de alto risco. Esse fenômeno provavelmente resulta da ponderação de variáveis ​​usadas no algoritmo de cálculo nomograma. Para o desenvolvimento de casos de referência para os modelos destas duas classes, utilizamos diferentes subconjuntos de partida. Para os modelos da classe 1, começamos com os primeiros 30 (longo PFS) casos no conjunto de treino, e depois acrescentou casos sequencialmente em uma progressão PFS longo para o curto até que todos os 153 casos haviam sido utilizados. Para os modelos da classe 2, que começou com os últimos 30 (de curto PFS) casos no conjunto de treino, e depois acrescentou casos sequencialmente em uma progressão risco a curto e longo PFS até que todos os 153 casos haviam sido utilizados. Os esquemas de seleção do subconjunto de partida são devido à dimensão limitada do conjunto de treinamento. Se foram selecionados 30 longas-PFS casos como o subconjunto de partida para os modelos na classe 2, a curva do qui-quadrado estatísticas aumentaria sem atingir um nadir (estatísticas mínimos qui-quadrado). Da mesma forma, se nós selecionamos os últimos 30 casos (casos de curto PFS) como ponto de partida subconjunto para os modelos da classe 1, não haveria um nadir para a curva de estatísticas qui-quadrado. A Figura 2 apresenta a população de estatísticas de qui-quadrado, em comparação com o número de casos utilizados, para cada uma das 8 modelos. Note-se que, como nós examinamos sequencialmente model.60, model.65, model.70 e model.75 (Figura 2A-2D) e tivemos de adicionar mais e mais casos de curto-PFS para o conjunto inicial de 30 casos de longo PFS . A progressão continuada para os próximos quatro modelos, embora nós aqui começou com 30 casos de curto PFS (Figura 2E-2H). Para model.80 tivemos de adicionar um grande número de longas-PFS casos para minimizar as estatísticas qui-quadrado. No entanto, para model.95 nós adicionamos muito poucos casos, com as pessoas, principalmente os pacientes de curto PFS. Note-se que pode haver vários conjuntos de casos, com características que podem ser analisadas por um modelo bem particular. Estes podem ser representados graficamente por ampla para baixo-apontando picos (em vez de picos) de estatísticas de Qui-quadrado, ou por múltiplos nadirs discretos. Em todos os nossos exemplos, entretanto, houve um “melhor” da população (conjunto de referência) paciente discreta para um determinado modelo.

No curso de desenvolvimento de conjuntos de referência de processos para 8 modelos, utilizamos o teste logrank clássica [1], [2] para comparar o PFS observada e os PFS “virtuais” estimados por diferentes modelos. O teste de logrank é amplamente usado em ensaios clínicos para estabelecer a eficácia de um novo tratamento em comparação com um tratamento de controlo, quando a medição é a hora de eventos, tais como o tempo de recidiva biológica em doentes com cancro da próstata. Se observações censuradas não estão presentes nos dados, em seguida, o teste de Wilcoxon [27] deve ser usado em vez disso. A estatística do qui-quadrado com um grau de liberdade 1 e seu associado

p valor

pode ser facilmente calculado para o teste Logrank. estatística qui-quadrado superiores a 3,84 (

p

valor 0,05) indicam que há discrepância significativa entre o PFS observado eo calculado PFS; Pelo contrário, as estatísticas do qui-quadrado inferior a 3,84 (valor de P 0,05) é a favor da hipótese nula de que sugere acordo entre o PFS observada e o calculado PFS. O teste Logrank não podem ser simplesmente substituídos por índice de concordância [28] ou receptor operacional (ROC) métodos característicos baseados em curva [29] porque esses métodos não são apropriados para comparação de dois grupos de dados de sobrevivência de tempo de medição envolvendo censura. Estas estatísticas alternativos são mais adequados a situações em que um modelo de risco-preditiva é estabelecidos e precisão da previsão precisa ser avaliada.

As comparações entre bancos de dados de pacientes previstos e observados PFSS na formação e conjuntos de validação utilizados derivados de múltiplas cirurgiões usando operações abertos e laparoscópicos, ao longo de um período de tempo de 21 anos, em várias instituições, com variáveis ​​padrões de acompanhamento. Apesar destas variáveis, o nosso método tem funcionado bem para calcular com precisão PFS em uma grande série de casos de validação, bem como os subconjuntos de casos escolhidos com base no ano de cirurgia, escores de Gleason e PSA inicial. No entanto vieses poderia ser problemático com séries menores, que são susceptíveis de ser a norma para ensaios de terapêutica piloto adjuvantes. diferenças intrínsecas no tipo de operação ou a habilidade ou o cirurgião pode levar a resultados distorcidos. A versão histórica do nomograma Kattan [6] utilizaram dados, principalmente derivados de casos prostatectomia aberta, enquanto os casos laparoscópicos são mais comuns agora. Além disso, sabe-se que o nomograma Kattan pode subestimar o risco de recaídas em algumas populações [9], potencialmente um desafio a atribuição modelo no estudo. Além disso, o uso comum de um ng PSA limiar ≥0.2 /mL para a definição de recaída pós-prostatectomia pode aparecer para dar um PFS mais pobres do que pode ser predito por um algoritmo baseado no nomograma Kattan, que usou um limiar de PSA de 0,4 ng /mL ou mais para definir a recaída. Estas preocupações teóricas pode ser superado usando conjuntos de referência que são desenvolvidos a partir de conjunto de treino de tamanho significativamente maior e complexidade do que usado neste relatório. Estamos atualmente envolvidos nestes estudos.

Diferentes conjuntos de dados têm tempo de cirurgia variável. Por exemplo, casos Ahlering robô (UCI) eram 2002-2009, casos Long Beach VA eram 1990-1998, Loma Linda University (OLL) quimioterapia adjuvante /casos hormônios estavam 2001-2006, casos OLL robô (Ruckle) eram 2007-2010, casos SPECS eram 2000-2010. Na verdade, ano de prostectomy é uma variável importante, uma vez que são responsáveis ​​por mudanças nas técnicas de diagnóstico e terapêutica ao longo do tempo. Dada amostras suficientes, pode-se subgrupo amostras com base no ano de cirurgia (variável categórica), e conjuntos de referência de trem dentro de cada subgrupo. Desta forma, o efeito do tempo de prostectomy será bem abordado. No entanto, devido ao tamanho limitado de amostras de treinamento no estudo atual, não temos energia suficiente para identificar o efeito do tempo de cirurgia. No entanto, nós fizemos testar o desempenho do modelo atual nas amostras de pacientes que tiveram a cirurgia durante diferentes períodos de tempo, isto é, um 2000-2004 e 2005-2011. O modelo funcionou muito bem em ambos os conjuntos de ensaio (Figura 4). modelo avançado será desenvolvido com base no aumento da base de amostra.

Como os números Kattan pode ser calculado para cada paciente, não há dificuldade na obtenção de um grupo de comparação combinado específico para a população em estudo. A aplicação do novo método para o nosso estudo de fase II adjuvante demonstraram que a intervenção terapêutica adjuvante melhorado significativamente PFS nesses pacientes, em comparação com o PFS esperado sem terapia. Tal resultado não seria de todo surpreendente, pois 75% dos nossos pacientes tinham doença pN1. ADT adjuvante sozinho foi mostrado para melhorar significativamente livre de progressão, específica da doença e sobrevida global em pacientes pós-prostatectomia com linfonodos positivos [30]. Além disso, parece que o adjuvante ADT sozinho é associado com uma excelente PFS globais em de alto risco sujeitos pós-prostatectomia [31]. Nossos pacientes todos receberam quimioterapia adjuvante, além de ADT, que pode ter fornecido um benefício de nossos pacientes pN0 e contribuiu para a diferença global, altamente significativo no PFS observados e previstos PFS para os nossos pacientes.

Em diferentes sujeitos grupos, tanto da radioterapia pós-prostatectomia adjuvante ou privação de andrógeno pode ser eficaz em melhorar significativamente livre de progressão, específica da doença ou sobrevida global. No entanto, nem o tratamento é óptima. Radiação aumenta efeitos secundários, tais como estenoses e incontinência, bem como lesões rectais. Supressão androgénica pode ser permanente, e leva a uma variedade de efeitos colaterais indesejáveis, tais como a disfunção síndrome metabólica, e impotência eréctil, e perda acelerada da massa óssea.

Deixe uma resposta