PLOS ONE: Desenvolvimento e Avaliação preliminar de um Índice de Ensaio multivariada para ovário Cancer

Abstract

Fundo

A maioria das mulheres com uma apresentação clínica consistente com cancro do ovário têm condições benignas. Portanto, os métodos para distinguir as mulheres com cancro do ovário a partir daqueles com condições benignas seria benéfico. Nós descrevemos o desenvolvimento e avaliação preliminar de um ensaio multivariada à base de soro de câncer de ovário. Este estudo orientado a hipótese de examinar se um padrão informativo pode ser detectada em doença Eu estágio que persiste através de fases posteriores.

Metodologia /Principais Achados

Sera, recolhidos ao abrigo de protocolos uniformes de várias instituições, o que representa 176 casos e 187 controles de mulheres que se apresentam para a cirurgia foram examinadas usando high-throughput, imunoensaios multiplexados. Todas as etapas e subtipos comuns de câncer epitelial de ovário, e as condições de ovário benignos mais comuns foram representados. Um painel de 104 antígenos, 44 auto-imune e 56 marcadores de doenças infecciosas foram ensaiadas e combinações informativos identificados. Usando um conjunto de treino de 91 conjuntos de fase I de dados, representando 61 amostras individuais, e um número equivalente de controlos, um perfil 11 para a substância analisável, constituído por CA-125, CA 19-9, EGF-R, a proteína C-reactiva, a mioglobina , apolipoproteína A1, apolipoproteína CIII, MIP-1α, IL-6, IL-18 e tenascina C foi identificado e parece informativo para todas as fases e subtipos comuns de cancro do ovário. Usando um teste de um conjunto de 245 amostras, aproximadamente duas vezes o tamanho do conjunto de construção do modelo, o classificador tinha 91,3% de sensibilidade e especificidade de 88,5%. Embora estes resultados preliminares são promissores, mais refinamento e validação extensiva do classificador em um ensaio clínico é necessário para determinar se o teste tem valor clínico.

Conclusões /Significado

Nós descrevemos um sangue- ensaio baseado usando 11 analitos que podem distinguir as mulheres com cancro do ovário daqueles com condições benignas. A avaliação preliminar do classificador sugere que tem potencial para oferecer cerca de 90% de sensibilidade e especificidade de 90%. Embora promissor, o desempenho deve ser avaliada em um estudo de validação clínica cego

Citation:. Amonkar SD, Bertenshaw GP, Chen T-H, Bergstrom KJ, Zhao J, Seshaiah P, et al. (2009) Desenvolvimento e Avaliação Preliminar de um Índice de Ensaio multivariada para o cancro do ovário. PLoS ONE 4 (2): E4599. doi: 10.1371 /journal.pone.0004599

editor: Ewout W. Steyerberg, University Medical Center Rotterdam, Holanda

Recebido: 21 de novembro de 2008; Aceito: 14 de janeiro de 2009; Publicação: 25 de fevereiro de 2009

Direitos de autor: © 2009 Amonkar et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Todos os autores são empregados por Sistemas Correlogic, Inc.

Conflito de interesses: Todos os autores são empregados em tempo integral de Correlogic Systems, Inc. e ter direitos de opção de ações. Correlogic Systems, Inc. entrou com pedidos de patentes sobre os aspectos deste trabalho.

Introdução

O câncer de ovário é o mais mortal de câncer ginecológico nos Estados Unidos [1]. Em 2008, cerca de 21.650 novos casos de câncer ovariano serão detectados. O diagnóstico precoce é associada com uma taxa de sobrevida em 5 anos de 92%, mas apenas 19% dos cancros do ovário são detectados precocemente [1], [2]. A maioria dos casos detectados são a doença de estágio avançado, onde as taxas de sobrevida em 5 anos para as mulheres com doença maligna regional e doença à distância são 71% e 30%, respectivamente. Como resultado, mais de 15.000 mulheres morrem de cancro do ovário em os EUA a cada ano [1].

Os primeiros sintomas do câncer de ovário, que incluem dor pélvica e abdominal, urgência e frequência urinária, inchaço abdominal, e dificuldade para comer são inespecíficos e comuns a muitas condições não-cancerosas e benignos [3]. Portanto, o diagnóstico normalmente não ocorre até que o desenvolvimento de qualquer uma quantidade significativa de fluido abdominal ou uma massa pélvica, detectadas por exame físico ou com avaliação radiológica [4]. Um relatório recente sugeriu que uma combinação única de sintomas, se plenamente documentadas para cada paciente, pode ser mais informativos do que anteriormente reconhecido, embora os resultados continuam a ser validado [5]. Muitos relatórios indicam que as técnicas de imagem mais comumente usados ​​- sonografia transvaginal (TVS), tomografia por emissão de pósitrons (PET), ressonância magnética (MRI), radioimmunoscintigraphy e tomografia computadorizada (CT) carecem de especificidade suficiente para distinguir entre a doença de ovário benignos e malignos [6]. Alguns estudos recentes têm sugerido que o ultra-som por si só, ou em combinação com outras variáveis ​​de prognóstico pode ser significativamente mais informativo nas mãos de um especialista em ultra-som ovariano especializado [7], [8], no entanto, muitos pacientes não têm acesso às habilidades de tais especialistas. Além disso, o diagnóstico claro geralmente requer, no mínimo, intervenção cirúrgica na forma de laparotomia ou laparoscopia. Portanto, uma precisa, informativa, ainda não-invasivo, teste seria de valor clínico.

Não há biomarcadores aprovados pela FDA para o diagnóstico de câncer de ovário, ou para a triagem de mulheres com suspeita de câncer de ovário . Apesar do seu uso disseminado, o antígeno do câncer 125 (CA-125) só é aprovado pelo FDA para monitorar a recorrência e resposta terapêutica [9] – [11]. Em estudos de mulheres com câncer de ovário conhecida ou suspeita, as sensibilidades relatados de CA-125 na detecção de fase I e II cancros variam amplamente de 29-75% e 67-100%, respectivamente. No entanto, o CA-125 é elevada em uma ampla variedade de condições normais, benignas e malignas [12] – [14] e 86% de mulheres que apresentam anormais CA-125 testes de resolver em 3-6 meses [15]. Muitas abordagens têm sido tomadas para melhorar o valor preditivo de CA-125 através de medições de série [16], [17] ou em combinação com marcadores adicionais [18] – [21]. No entanto, uma ferramenta de rastreio do cancro do ovário simples e clinicamente prática permanece indefinida

Um estudo recente [22] descreveram um painel de seis marcadores -. CA-125, a prolactina, a leptina, fator inibidor de macrófagos (MIF), osteopontina e insulina-like growth factor II (IGF-II), que, quando combinada apresentou sensibilidade muito elevada (95,3%) e especificidade (99,4%). O ensaio é concebido como uma tela em mulheres de alto risco, no entanto, as características finais de desempenho não foram avaliadas em mulheres de alto risco e incluiu amostras também usados ​​para construir modelos que podem ter resultado em sobre-avaliação do desempenho do classificador. Além disso, os critérios de inclusão e exclusão para os participantes não foram claramente definidos, e as amostras cancerosas e controle foram coletadas em diferentes ambientes clínicos, que podem levar a um viés no conjunto da amostra. Prolactina e IGF-II, foram notificados para ser individualmente mais informativa do CA-125, neste estudo, mas isso é inconsistente com relatórios sobre outros conjuntos de amostras independentes [23], [24]. Em outro estudo, Moore e seus colegas utilizaram regressão logística para encontrar combinações de marcadores capazes de diferenciar entre condições benignas e malignas em mulheres com massas pélvicas [25]. Ao combinar HE-4 e CA-125, a sensibilidade de 76,4% e especificidade de 95% foi alcançada. Embora promissor, apenas 67 dos 233 amostras eram de indivíduos com cancro do ovário e apenas 15 dos de mulheres com estágio I e II cancros. Além disso, informou desempenho foi baseada em resultados de validação cruzada que não tinham um conjunto de validação independente de amostras.

O câncer de ovário é um conjunto de diversas entidades com mais de 30 subtipos de doenças malignas, cada um com histologia distintiva, patologia e comportamento clínico [26]. A diversidade e baixa incidência de câncer de ovário dificulta a busca de biomarcadores. Em um estudo separado, post-hoc, de um subconjunto das amostras utilizadas no presente estudo, não fomos capazes de identificar um único marcador capaz por si só de prever com precisão a presença de câncer de ovário [24]. No presente estudo, descrevemos o desenvolvimento e avaliação preliminar de um perfil de múltiplos analitos que podem classificar as mulheres com suspeita de câncer de ovário, para aqueles com e sem câncer de ovário.

Métodos

Amostra coorte

Tudo, mas 20 amostras foram a partir do repositório de tecido-banking do Grupo de Oncologia ginecológica National Cancer Institute-financiados (GOG; Columbus, OH; Tabela 1; Tabela S2). Foi obtido consentimento escrito pela GOG para todos os participantes e o Institutional Review Board GOG (IRB) aprovou o uso das amostras em nosso estudo. Estas amostras foram coletadas de vários sites, no âmbito de protocolos aprovados pelo IRB GOG. Os pacientes elegíveis eram mulheres agendadas para cirurgia com suspeita de ter um câncer ginecológico ou agendados para cirurgia profilática por causa do aumento do risco de cancro do ovário (1º ou 2º grau com a doença). Todas as amostras, incluindo aqueles classificados como normais, pós-cirurgia, foram recolhidos antes de qualquer intervenção diagnóstica ou terapêutica. alíquotas de soro encaminhadas para Correlogic Systems, Inc. ® (Rockville, MD) tinha sido de-identificadas e codificadas com um identificador único GOG. Cada amostra foi acompanhada por um relatório completo clinicopathology, idade do paciente e raça, e um código de identificação-de denotando o local de coleta. Patologia foi revista e confirmada por patologistas GOG para garantir a consistência. As amostras foram selecionados a partir da coleção GOG para equilibrar a distribuição a idade do paciente, data da recolha de soro, e representação de casos e controles em todos os locais de coleta. O soro remanescente consistiu em 20 amostras de indivíduos com condições benignas de uma colecção Correlogic prospectivo, que utiliza um protocolo de recolha de soro semelhante. consentimento por escrito foi obtido de todos os participantes. amostras “potenciais” do Correlogic estão a ser recolhidos em fase de aprovação IRB para apoiar o desenvolvimento de um teste clínico para câncer de ovário. A população do estudo é que as mulheres com sintomas de câncer de ovário e programado para a cirurgia. Como tal, o estado da doença é confirmada pela patologia após a cirurgia. As 20 amostras foram retiradas da coleta prospectiva de forma a evitar a introdução de qualquer viés para a coleção restante e como tal, não foram deliberadamente seleccionados para representar qualquer determinada população. O estudo foi aprovado pelo IRB Ocidental (Olympia, WA) e pelo IRB de cada site participante.

Processamento de Soro, armazenamento, manipulação e Expedição

As amostras de sangue (5- 20 ml) foram recolhidas em tubos Vacutainer de vidro de topo vermelho (Becton-Dickinson, NJ), coagulado por 30-180 minutos a 4 ° C, e em seguida centrifugado a 3500 g durante 10 minutos a 4 ° C. O soro foi decantado para tubos criogénicos, e armazenado imediatamente a -80 ° C. Alíquotas de armazenamento foram enviados para Correlogic em gelo seco e armazenado imediatamente a -80 ° C. As amostras congeladas foram aquecidos suavemente à mão até quase descongelado, completado em gelo, agitada em vórtice, aliquotadas em volumes de 150 ul e novamente congelada a -80 ° C. Finalmente, as amostras foram enviadas em gelo seco para Medicina baseada em regras, Inc. (RBM; Austin, TX). Um documento de acompanhamento fornecido um número de identificação da amostra codificados e uma ordem específica de análise. O site analítica RBM foi completamente cegos para todos os detalhes de amostras, incluindo o estado da doença.

Multiplex imunoensaios

Os imunoensaios multiplexados são descritos em outro lugar [24]. Resumidamente, duas rodadas de imunoensaios multiplexados foram conduzidos a RBM em seu laboratório certificado pela CLIA baseado em Luminex. Os analitos foram quantificados por referência a curvas de calibração de ponto 8 e o desempenho da máquina foi verificada utilizando três amostras de controlo de qualidade (CQ) para cada analito. As amostras de QC foram distribuídos de forma relativamente uniforme em toda a gama dinâmica do ensaio em níveis baixos, médios e altos e geralmente tinham coeficientes de variação inferiores a 15%. Os padrões de calibração e as amostras de QC foram em uma matriz à base de plasma complexo para coincidir com o fundo da amostra e foram analisadas em duplicado. Em uma rodada, um total de 204 analitos representando 104 antígenos, 44 auto-imune e 56 moléculas de doenças infecciosas foram medidos em 147 amostras epiteliais do cancro do ovário (40 na fase I, 23 de fase II, 67 estágio III, 12 estádio IV, cinco unstaged) e 149 amostras de controlo (104 condições benignas, 29 normais saudáveis, 14 outros cancros e dois baixo potencial maligno), utilizando imunoensaios multiplexados de propriedade (Tabela S1). Uma segunda ronda de análise foi realizada 86 dias após a primeira volta de análise, sobre os 104 antigénios, utilizando uma segunda aliquota de soro que tinha sido submetido a uma história de congelamento /descongelamento idêntica como as amostras utilizadas na primeira rodada. Devido a restrições de volume de amostra, 27 amostras não foram reanalisados ​​na segunda rodada. Assim, em dois, 132 amostras redondas do cancro do ovário (30 na fase I, 21 de fase II, 65 estágio III, 11 estádio IV e cinco unstaged) e 135 controles (94 condições benignas, 28 normais saudáveis, 13 outros tipos de câncer) foram novamente analisadas. Além disso, mais 69 amostras, não incluídas na primeira rodada, foram analisados ​​(21 a fase I, oito estágio II, 36 benigna, três normal e saudável e um cancro do cólon). Para ambas as fases de análise, a ordem da análise foi estabelecido para evitar qualquer distorção sequencial devido à presença ou ausência de doença, subtipo ou fase da doença, idade do paciente, idade ou da amostra de soro. Geralmente, as amostras alternadas entre casos e controlos.

Manuseamento dados

Uma vez que os soros foram analisados ​​a uma diluição previamente optimizado, superior a qualquer amostra, a concentração máxima da curva de calibração foi atribuído arbitrariamente a concentração do mais elevado nível, enquanto que aqueles ensaiadas abaixo da concentração mínima da curva de calibração foi atribuído o valor 0,0. Um único ensaio (IL-1α) que mostraram nenhuma variação na expressão em todas as amostras foi considerada invariante /não informativo e removido do conjunto de dados extraídos. Os dados restantes foram então escalados pela escala biweight; um mecanismo de escalonamento robusto e eficiente, que representa a variação dentro de cada um dos ensaios individuais [27]. A única escala para cada ensaio foi determinada de forma ponderada da população. Qualquer ensaio dando um factor de escala de zero foi removido a partir do conjunto de dados. Os dados resultantes foram então exportados para arquivos individuais, onde cada arquivo representados os resultados de todos os ensaios qualificados para uma única amostra

Modelagem -. “Out-of-Bag” Estimativa de erros e Bootstrap Validação

para minimizar o viés conjunto de amostras e para auxiliar na avaliação dos modelos intermediários, empregamos um terço (OOB) estimativa de erro “out-of-bag” e um de 100 vezes a validação de inicialização externo com 10% bootstraps holdout. Estas estimativas de bootstrap nos permitiu avaliar o valor potencial de muitos modelos usando apenas os dados de treinamento. Desta forma, foram capazes de manter a independência do conjunto de teste hold-out de amostras. Só depois de um classificador específico tinha sido trancado em um sistema de gestão documental rastreável (DMS) foram o conjunto de teste hold-out de dados utilizados para testar o desempenho do modelo selecionado

Modelagem -. Prova de Princípio Classificador

Inicialmente, a modelagem foi realizada com dados gerados em uma rodada (Figura 1) usando uma modificação do código aleatório Floresta do Breiman [28]. O método foi melhorado, permitindo a automação do lote, adicionando uma camada externa de bootstrapping, proporcionando maior controle sobre os parâmetros de execução, e personalizar a saída. As árvores resultantes foram salvos e uma rotina de propriedade foi usada para amostras de pontuação e de informações de amostra de saída, resultados de probabilidade, e resultado da classificação. Quarenta fase I cancro do ovário e 40 amostras de controlo foram utilizados para a construção de modelos. Os controlos foram seleccionados para assegurar que o conjunto de modelagem representadas as mesmas proporções de condições normais, benignas e outras cancerosas como o conjunto de controlo, no entanto, dentro de cada uma destas categorias, as amostras foram seleccionadas aleatoriamente. Modelagem foi otimizado variando tanto as contagens de árvores (50, 100, 500 e 1000) em uma floresta, e o número de biomarcadores (5, 10, 15, 20, 25, 30, 35, 40, 45, 50) explorado cada ponto de ramificação, resultando em 40 modelos. A partir destes modelos, os 20 analitos mais informativos foram identificados usando o valor de importância variável. No segundo passo, uma série de modelos foram construídos que foram restringidos ao mais importante analito (modelo de 1-analito), os dois analitos mais importantes (Modelo 2-analito) e assim por diante a um modelo de 20 analito, um total de 20 modelos. O OOB e erros externos de bootstrap, e os seus desvios padrão, foram tabeladas para cada um destes modelos. A partir destes resultados determinou-se que era necessário um mínimo de sete analitos para conseguir a classificação mais precisa. A final, único, modelo foi construído sobre estes sete analitos e depositado na DMS como um modelo “fechado”

Modelagem -. Final Classificador

A modelagem final incorporou todas as fases I dados de câncer de rodadas um e dois, incluindo as duplicatas – um total de 91 estágios conjuntos I de dados, o que representa 61 amostras originais e um número idêntico de controles, pareados como antes, e equilibrado na mesma rodada a rodada de duas proporções (Figura 1). Apenas esses conjuntos de dados (ou seja, o conjunto de treinamento) foram utilizados na construção e na selecção do modelo. A análise do padrão foi realizada usando um algoritmo único, com patente pendente, Knowledge Discovery Motor-VS (KDE-VS ™). KDE-VS utiliza um grupo de estruturas de voto semelhantes a árvores de decisão com um método exclusivo de construir e definir os valores de corte dentro de cada estrutura de votação, usando não só o valor medido de uma substância, mas também a estimativa de erro baseado em laboratório associado com que a medição, derivada das medições de controle de históricos de cada analito. O usuário pode variar o valor fracionário da estimativa de erro incorporadas em um classificador durante a modelagem. O resultado é um classificador robusta que pode resistir a perturbação significativa de valores de pontos determinados experimentalmente de concentrações de analito. Durante a construção do modelo, cada nó terminal na estrutura de voto é atribuído a um determinado estado – ou câncer de ovário ou câncer não-ovariano. Para marcar um desconhecido, o nosso software extrai os valores para os analitos de interesse para determinar qual nó da amostra cai.

Dois modelagem corridas diferentes, com valor fracionário de limites de erro dos 1.0 e 3.0, foram realizadas utilizando dados para os ensaios de antigeno 104. Os 20 analitos mais robustas foram determinados para cada ensaio e estes foram, em seguida, montados em um conjunto exaustivo de modelos de 7 marcadores. No entanto, todos os modelos foram obrigados a conter um núcleo invariante dos três analitos mais robustos e informativo, a saber, o CA-125, proteína C-reactiva e de EGF-R, o que reduziu o espaço de busca de 2380 combinações. Para ambos os níveis de tolerância a erros foram identificados os dez mais sensível e dez modelos mais específicos – dando um total de 40 modelos. A frequência de utilização de ambos os analitos individuais e várias combinações de analito em todos os 40 modelos, levou à identificação de 11 analitos, que apareceu em conjunto robusta e informativa. Finalmente, um único modelo foi construído sobre estes 11 analitos e trancada no DMS. Só depois de bloquear o modelo foram os dados restantes, não utilizado no treinamento, marcado para testar o modelo (Figura 1).

Análise de Dados

Os intervalos de confiança foram calculados utilizando o método Newcombe [29] .

resultados

Avaliação preliminar do classificador Prova de Princípio

o primeiro conjunto de dados, gerados em 147 cancro do ovário e 149 amostras de controle do câncer de ovário não foi usado para explorar a possibilidade de utilizar uma plataforma de imunoensaio multiplex alto rendimento como uma ferramenta de descoberta. Nossa hipótese é que um padrão de classificação para o câncer de ovário estágio I persistiria por todas as doenças fase posterior, para que apenas amostras de câncer de fase I foram utilizados para o desenvolvimento do modelo. Essa abordagem também em relação a idade média dos casos e controles pacientes, a remoção de viés relacionado com a idade durante a modelagem (Tabela 1). Através de várias rodadas de enriquecimento para os biomarcadores mais informativos, impulsionado pela avaliação dos erros de bootstrap para o conjunto da amostra de desenvolvimento do modelo, um modelo de 7 analito evoluiu, consistindo de CA-125, EGF-R, proteína C-reativa, apolipoproteínas CIII e A1, IL-18 e tenascina C. Esta fase I perfil específico foi bloqueado no DMS. Somente depois que o modelo foi bloqueado no DMS foi os dados para as amostras de teste (quem não utilizadas na modelagem) acessados ​​e marcou pelo modelo para dar os resultados descritos abaixo (Figura 1)

.

Uma vez que todos estágio I dados gerados na primeira rodada de ensaios foram utilizados na modelagem, não havia dados independentes a sensibilidade fase de teste que eu. Contudo, a estimativa de 100 vezes de bootstrap de sensibilidade fase I foi de 87% (Tabela 2). A estimativa de bootstrap para a especificidade, com base nos controles usados ​​no desenvolvimento do modelo foi de 82,3%. O classificador foi então avaliada utilizando redondos uma amostras de teste, um conjunto de amostras independentes não utilizadas em qualquer aspecto do desenvolvimento do modelo. O classificador tinha 95,3% de sensibilidade e especificidade de 70,6%. Desempenho para amostras benignas foi menor (67,1%) do que os outros controlos. Não houve subtipo único de câncer que marcou significativamente diferente dos outros e quando discriminadas por etapa, a sensibilidade variou pouco (94,0-100%), apoiando a hipótese de que a I padrão de estágio pode persistir por todas as fases da doença. Após a segunda rodada de ensaios, todos os dois dados redondas foram marcados neste modelo bloqueado. As amostras comuns a uma rodada apresentou um desempenho reprodutível com 97,1% de sensibilidade (IC 95%, 91,0-99,2%) e 74,5% de especificidade (IC 95%, 64,7-82,4%). As 69 amostras adicionais, não previamente analisados, desde um segundo conjunto de testes e resultou em sensibilidade de 85,7% para a fase I, 100% de sensibilidade para a fase II e 67,5% de especificidade.

Avaliação Preliminar do classificador final

O classificador de prova de princípio confirmou nossa hipótese de que usando apenas estágio I de dados para o desenvolvimento e avaliação de modelo que poderia identificar um padrão informativo que pode existir e persistir por fases posteriores do cancro. Por isso, procurou-se desenvolver o modelo de estágios I ainda utilizar todas as fases amostras I disponível. A mesma estratégia de modelação foi repetido com duas modificações importantes. Em primeiro lugar, um algoritmo diferente, proprietária foi implementado, e em segundo lugar, toda a fase I através de ambas as amostras analisadas rodadas um e dois foram usadas para aumentar o tamanho do conjunto de dados de desenvolvimento do modelo (Figura 1). A estratégia de modelagem passou por várias etapas iterativos para enriquecer os biomarcadores mais informativo, com base numa avaliação única de dados de treinamento estágio I antes de culminar em uma pesquisa quase-exaustiva de combinações de biomarcadores que gerou 2380 modelos. Quarenta modelos foram selecionados com base em sua sensibilidade e especificidade de inicialização no conjunto de fase I amostra. Ao comparar as combinações de biomarcadores nestes 40 top models (Tabela 3), e tendo em conta o equilíbrio que eles mostraram na precisão de bootstrap, a sensibilidade, especificidade e desvios-padrão, foram identificados um conjunto final de 11 biomarcadores informativos. Determinadas combinações de analitos eram comuns em muitos modelos, e foram claramente “” padrões de substituição em que um analito diferente ou combinação de analitos poderiam produzir modelos equivalentes. Os biomarcadores 11 – CA-125, proteína C-reactiva, EGF-R, CA 19-9, apolipoproteínas A1 e CIII, mioglobina, MIP-1 a, IL-6, IL-18 e tenascina C – foram reunidos em um modelo final usando o algoritmo KDE-VS e trancado na DMS como o modelo final (Figura 1).

como um teste preliminar do desempenho do classificador, todos os dados não utilizados no desenvolvimento do modelo foram marcados, rendendo 91,3 % de sensibilidade e especificidade de 88,5% (Tabela 4, Figura 1). Notavelmente, a sensibilidade fase II foi de 83,9% e desempenho nas amostras benignas melhorou para 90,4%. Amostras adicionais fase I não estavam disponíveis, na época, para o teste desta performance. Contudo, a estimativa de bootstrap de sensibilidade para o conjunto de treino foi 83,4% para a doença de fase I e 84,2% (± 12,5%) especificidade (Tabela 4). Como um exercício separado, todos os dados duplicados da segunda rodada não utilizadas no desenvolvimento do modelo foram marcados. Tal como previsto a partir dos resultados anteriores, o desempenho foi semelhante com sensibilidade de 96,1% (CI de 95%, 89,7-98,7%) e 88,1% de especificidade (IC de 95%, 80,8-93,0%) com amostras benignas marcando 87,0% (IC de 95%, 76,2-93,5%). Para fornecer um quadro de referência, comparamos o desempenho do modelo ao de uma decisão clínica baseada em níveis de expressão de CA-125. Uma vez que o valor de cut-off de 35 UI /ml já está estabelecida, o conjunto de dados completo foi utilizado para avaliar o valor preditivo de CA-125. Com este valor de cut-off, o CA-125 deu 94,9% de sensibilidade e especificidade de 58,6% (Tabela 5). Para amostras de fase I sozinho, a sensibilidade caiu para 88,5%.

Nós implementou dois métodos para estimar a importância dos diferentes analitos ao classificador geral. Primeiro, avaliou-se o desempenho do modelo quando todos menos um analito foi mantido constante nos ficheiros de dados, com o valor do analito escolhido ao acaso. Isto foi repetido sequencialmente para cada analito. O valor relativo de cada analito foi então classificados por determinação de quais analito classificação de desempenho causada a declinar mais quando randomizados. Observamos que biomarcador importância tendem a se agrupar. Especificamente, o CA-125 foi o biomarcador mais importante, seguido de um grupo consistindo em proteína C-reactiva, CA 19-9 e EGF-R, seguido por MIP-1α, seguido de mioglobina, apolipoproteína CIII, apolipoproteína A1, IL-18 e IL-6 e, finalmente, tenascina C. Como um segundo método de estimar analito importância, foram analisados ​​os pontos de ramificação das estruturas de voto. Em todos os pontos de ramificação das estruturas de voto, CA-125 foi envolvido o mais frequentemente (15,8%) seguido por CA 19-9 (12,1%), mioglobina (11,1%), proteína C-reactiva (10,8%) e EGF-R (9,9%). CA-125 foi utilizado em 80% dos pontos de ramificação de nível superior, que representa o primeiro exemplo de particionamento principal, seguido de proteína C-reactiva (11,2%), o EGF-R (5,0%) e CA19-9 (1,8%). Na segunda camada, utilizou-se CA19-9 mais frequentemente (20,3%) seguido por EGF-R (18,8%), o CA-125 (11,4%), mioglobina (9,8%), tenascina C (8,0%), IL-18 (7,2%), e apolipoproteína A1 (6,9%). Os marcadores de fase aguda MIP-1 e IL-6 foram vistos apenas 6,2% e 1,3%, respectivamente, a este nível.

Discussão

Neste estudo identificamos um padrão de classificação para câncer de ovário na proteoma do soro de pacientes com doença em estágio I, que continua a ser evidente através doença fase posterior. Os soros de pacientes com condições confirmou-patologista – quer com ou sem cancro epitelial do ovário – foram perfilado usando uma abordagem de perfil multi-analito baseadas em esferas. Os analitos coberta uma ampla gama de estruturas e funções biológicas, incluindo antigénios de cancro, hormonas, factores de coagulação, factores de modelação do tecido, constituintes de lipoproteínas, proteases e inibidores da protease, marcadores de risco cardiovascular, factores de crescimento, citocinas /quimiocinas, formas solúveis de cell- sinalização receptores, e reagentes de fase aguda e inflamatórias, bem como marcadores para a auto-imunidade e infecção (Tabela S1). Duas amostras independentes de análises foram realizadas 86 dias de intervalo. Houve várias mudanças lote de reagentes e em lote durante este período, proporcionando um desafio do mundo real para a robustez dos ensaios subjacentes e do modelo.

Quatro componentes principais foram fundamentais para o sucesso deste estudo. Primeiro, foi essencial para identificar um conjunto de amostras altamente consistente, bem documentada e clinicamente representativa de casos e controles confirmados. No cancro do ovário, a confirmação só pode vir de exame patológico de tecido retirado cirurgicamente. Nós selecionamos amostras de soro de coleções bem caracterizadas de mulheres já programadas para a cirurgia. A maioria substancial dos controles nesta população com doenças benignas confirmou-patologia, que com base na análise univariada, deve representar um desafio maior para a classificação de soros de mulheres não-sintomáticos (Figura 2; [24]). Em segundo lugar, utilizou-se um painel de, alto rendimento plenamente qualificado, imunoensaios que medem uma ampla diversidade de moléculas, incluindo auto-imune e marcadores de doenças infecciosas, e uma ampla gama de proteínas de soro bem caracterizados, incluindo aqueles anteriormente implicado no cancro do ovário. Em terceiro lugar, foi utilizada uma abordagem de modelagem multivariada romance para identificar um padrão robusto de moléculas informativas para câncer de ovário. O algoritmo proprietário (KDE-VS) melhorou o desempenho de classificação em comparação com aleatória Floresta e outros algoritmos de classificação através da construção de limites de decisão robustos nas suas estruturas de voto, que incorpora variabilidade experimental do mundo real para os dados que está sendo modelado. Finalmente, houve uma clara separação entre as amostras utilizadas para desenvolver e identificar um único modelo informativo, e as amostras utilizadas para avaliar que os modelos de desempenho

Para cada substância, as parcelas box-suiça mostrar:. O menor observação, menor quartil, valor médio, quartil superior e maior observação. Todas as análises, incluindo duplicados são mostrados. CA-125 – um câncer de ovário, 11 benignos e cinco amostras normais abaixo menor valor de calibração; CA 19-9 – 14 cancro do ovário, 18 outras quatro amostras de câncer benigno, nove normais e abaixo menor valor de calibração; proteína C-reativa – 93 cancro do ovário, 21 benigna, dois normal e duas outras amostras de câncer acima mais alto valor de calibração; IL-6-82 cancro do ovário, 161 benigna, 28 normais e 14 outras amostras de câncer abaixo do nível de calibração mais baixo; MIP-1α – 50 cancro do ovário, 53 benigna, 10 normal e outras quatro amostras de cancro abaixo menor nível de calibração; tenascina C – dois cancro do ovário e uma amostra do nível de calibração acima mais benigna. OVCA, câncer de ovário; Ca, câncer; Apo, apolipoproteína; CA-125, CA-125 antigénio; CA 19-9, 19-9 antigénio do cancro; EGF-R, receptor do factor de crescimento epidérmico (forma solúvel); IL, interleucina; . MIP-1a, proteína inflamatória de macrófagos 1 alfa

O nosso estudo incidiu sobre a análise da doença em estágio inicial com 50% do conjunto de amostras de câncer representando as fases I e II da doença (Tabela 1). Consistente com a literatura, a idade média dos pacientes no momento do diagnóstico correlacionada com o estádio da doença no diagnóstico (Tabela 1; [22]). A distribuição de subtipos era representativo da população dos Estados Unidos, com uma proporção maior de serosa (42%) e endometrióide (26%) de carcinoma (Tabela 1). As amostras de controlo eram predominantemente a partir de indivíduos com condições comuns benignos do ovário (75%), bem como para outros cancros ginecológicos e não ginecológicos (8%), e um pequeno número de amostras não-doentes (17%), de acordo com a necessidade para um teste clínico para mulheres sintomáticas (Tabela 1).

a nossa lógica para se concentrar em estágios iniciais da doença era duplo. Em primeiro lugar, o câncer de ovário fase precoce é considerada curável, mas em muitos casos os sintomas são sutis e difíceis de detectar.

Deixe uma resposta