PLOS ONE: Medição de fosfolípidos podem melhorar a precisão diagnóstica no ovário Cancer

Abstract

Fundo

Mais de dois terços das mulheres que se submetem a cirurgia por suspeita de neoplasia de ovário não tem câncer. Nossos resultados anteriores sugerem fosfolipídios como potenciais biomarcadores de câncer de ovário. Neste estudo, foram medidos os níveis séricos de vários fosfolipídios entre as mulheres submetidas à cirurgia por suspeita de cancro do ovário para identificar biomarcadores que melhor prever se uma massa de ovário é maligno.

Metodologia /Principais Achados

amostras de soro obtidas no pré-operatório de mulheres com suspeita de câncer de ovário inscritos através de um sistema de rápida apuração prospectivo, de base populacional. As amostras foram analisadas a partir de todas as mulheres nas quais foi confirmado o diagnóstico de câncer epitelial de ovário (EOC) e de casos de doenças benignas selecionados aleatoriamente a partir dos restantes amostras (não-EOC). Medimos biologicamente fosfolipídios relevantes usando espectrometria de massa por ionização por cromatografia /electrospray líquido. Nós aplicamos uma abordagem poderosa de aprendizagem estatística e máquina, híbrido huberized máquina de vetores de suporte (HH-SVM) para priorizar fosfolipídios para introduzir os modelos de biomarcadores, e usou de validação cruzada para obter estimativas conservadoras de taxas de erro de classificação.

Resultados

O modelo HH-SVM usando as medidas de combinações específicas de fosfolipídios complementa a medição CA125 clínica e melhora a precisão do diagnóstico. Especificamente, a medição de fosfolipídios melhorou a sensibilidade (identificação de casos com níveis de CA125 pré-operatórios abaixo de 35) entre os dois tipos de casos em que o desempenho CA125 é historicamente pobres – casos precoces e as de histologia mucinoso. Medição de fosfolipídios melhorou a identificação de casos em estágio inicial de 65% (com base no CA125) para 82%, e os casos mucinoso de 44% para 88%.

Conclusões /Significado

Os níveis de específico fosfolipídios séricos diferentes entre mulheres com câncer de ovário e aqueles com condições benignas. Se validado por estudos independentes no futuro, estes biomarcadores podem servir como um complemento no momento da apresentação clínica, para distinguir entre as mulheres com cancro do ovário e aqueles com condições benignas com sintomas e características comuns

Citation:. Shan G, Chen YA, Davis G, Han G, W Zhu, Molina AD, et ai. (2012) Medição de fosfolípidos podem melhorar a precisão diagnóstica no cancro do ovário. PLoS ONE 7 (10): e46846. doi: 10.1371 /journal.pone.0046846

editor: Anthony WI. Lo, da Universidade Chinesa de Hong Kong, Hong Kong

Recebido: 26 Outubro, 2011; Aceito: 10 de setembro de 2012; Publicado: 17 de outubro 2012 |

Direitos de autor: © Shan et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este estudo foi financiado pela Sociedade americana do Câncer (TINTEIRO-00-196), o Instituto Nacional do Câncer (R01-CA106414), Departamento de Defesa DAMD17-98-1-8659 ea Fundação Celma Mastry do cancro do ovário. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

Conflito de interesses:. Os autores leram a política da revista e tem as seguintes conflitos: 1) Os autores e instituições afiliadas detêm patentes sobre os fosfolipídios analisados ​​para esta publicação e 2) um ou mais autores são empregados por uma empresa comercial. As seguintes patentes foram arquivadas como um resultado da pesquisa realizada: Método para o cancro Detecção Usando LPA como um marcador, Serial # 61 /189.495, Data do arquivo 08/20/08. Licenciado 01/09; Método para o cancro Detecção Usando plasmalogens como marcadores, série nº 61 /199.565, Data do arquivo 11/18/08. Licenciado 01/09; Método para a detecção ou monitorização cancro utilizando LPC como um marcador (LPC 14:00), PCT /US2008 /012483, data de arquivo 11/05/08. Licenciado 01/09; Lisofosfatidilcolina como um biomarcador de câncer de ovário, Patente # US6248553 B1, Arquivo Data 5/13/05. Na época desta pesquisa foi realizada eo manuscrito foi escrito dois co-autores, Lain Shan e Lorelei Davis, foram empregados por uma empresa comercial com o nome de Frantz Biomarkers, LLC. Frantz Biomarkers, LLC não é mais uma empresa comercial que opera. Isto não altera a adesão dos autores para todas as políticas de PLoS One sobre os dados e materiais de compartilhamento.

Introdução

Os dados sugerem que entre as mulheres com câncer de ovário recém-diagnosticado, aqueles cuja cirurgia inicial é realizada por um oncologista ginecológica têm menor morbidade e mortalidade e aumento da sobrevida global [1], [2]. No entanto, até à data em os EUA, a cirurgia inicial por suspeita de cancro do ovário é frequentemente realizada sem referência a esses especialistas [1]. Isto é em parte porque não há nenhuma maneira precisa de saber com antecedência da cirurgia se uma massa pélvica suspeita de ser câncer de ovário é, de fato, o câncer. Como resultado, mais de dois terços das mulheres que se submetem a cirurgia por suspeita de neoplasia de ovário não tem câncer [3] – [5]. Uma vez que estima-se que 5-10% das mulheres norte-americanas serão submetidos a um procedimento cirúrgico por suspeita de neoplasia de ovário durante sua vida, este é um problema com impacto significativo para a saúde pública [6].

Atualmente, é difícil adequadamente mulheres triagem com uma massa pélvica para ginecológicas oncologistas com base em um alto índice de suspeita de câncer de ovário, uma vez que existem ferramentas limitadas para realizar essa avaliação. Um novo exame de sangue, OVA1, recebeu recentemente a aprovação do FDA como um adjuvante na avaliação pré-cirúrgica de massas anexiais [7]. O biomarcador do cancro do ovário única bem validado em uso clínico, CA125 no soro, é elevado em apenas cerca de metade do cancro do ovário fase epitelial precoce (EOC) e não é elevada em cerca de 20% de todos os EOC fase, tornando-o insuficientemente sensíveis [8] [9] .O valor de referência CA125 mais comumente relatados que designa um teste de triagem clinicamente positivo é de 35 unidades /ml, embora CA125 também é elevada em muitas doenças ginecológicas benignas, incluindo muitas condições associadas com massas pélvicas. Um dos primeiros estudos de rastreio que combinam CA125 e ultra-som tem mostrado que a utilização de CA125 no soro como no primeiro teste de linha e ultra-sonografia como um teste secundário tem elevada especificidade (99,9%) e valor preditivo positivo (26,8%) para a detecção do cancro do ovário [10 ]. Em uma análise retrospectiva de mulheres de alto risco, o uso de medidas repetidas de valores de CA125 incorporados em modelos estatísticos longitudinais mostrou uma sensibilidade melhorada de 70% para 86%, mantendo a especificidade de 98% [11]. Um recente grande estudo prospectivo (UK Collaborative Trial of Screening ovário [UKCTOC]), avaliando a triagem multimodalidade (screening CA125 anual interpretados usando um algoritmo para o risco de câncer de ovário, juntamente com ultra-sonografia transvaginal como um segundo teste de linha) sugere que a multimodalidade tem significativamente maior especificidade (99,8%) do que utilizando ultra-sons isoladamente (98,2%) para a detecção de cancros do ovário e trompas primários, embora nenhuma diferença estatisticamente significativa na sensibilidade foi encontrado [12]. Na próstata, pulmão, colo e julgamento rastreio do cancro do ovário, um estudo randomizado, os resultados através de quatro rondas de rastreio do cancro do ovário mostrou que a maioria dos casos detectados na triagem foram em estágio final [13], que apoia a necessidade de métodos adicionais e estratégias para alcançar a detecção precoce. Assim, uma ferramenta ou biomarcador permitindo a classificação precisa dos pacientes em grupos de alto e baixo risco para malignidade ovário iria melhorar a capacidade de forma adequada para pacientes de triagem oncologistas ginecológicas. Além disso, em casos individuais de massa pélvica, onde suspeita clínica de malignidade não é alta, é possível que a avaliação biomarcador pode facilitar a espera vigilante e resultar em menos e /ou menos urgentes cirurgias.

fosfolipídios previamente analisadas circulantes, incluindo o ácido lisofosfat�ico (LPA), lisofosfatidilcolina (LPC) e espécies afins, por seu potencial para discriminar entre as mulheres com controles EOC e saudáveis, com resultados promissores [14]. Em outro trabalho recente, identificamos plasmalogens como outro grupo de substâncias que circulam com potencial como biomarcadores de câncer de ovário [15]. No presente estudo, buscamos expandir nosso trabalho anterior para a validação desses biomarcadores promissores para aplicação clínica no diagnóstico de câncer de ovário. Medimos os níveis séricos de várias espécies de lípidos, incluindo espécies particulares de LPA, LPC e plasmenylphosphoethanolamine (PPE), a fim de avaliar o seu desempenho na discriminação entre EOC e doença benigna em comparação com, ou em combinação com, medição clínica de CA125 em amostras pré-operatórios obtidos prospectivamente a partir das mulheres que se apresentam com suspeita de câncer de ovário

Alguns dos desafios computacionais gerais para estudos de biomarcadores incluem o seguinte:. identificar métodos estatísticos poderosos, a seleção de marcadores preditivos de um (grande) grupo de potenciais candidatos, avaliando a articulação efeitos de vários marcadores, e evitando modelo superajuste devido à complexidade de modelos computacionais não lineares. máquina de vetor de suporte (SVM) foi mostrado para ter um desempenho superior em termos de exactidão de classificação e tem sido identificada como um dos métodos de aprendizagem estatística e máquina mais poderosas para analisar os dados de alta-dimensional, tal como o derivado de expressão do gene e estudos de biomarcadores [16], [17]. Em nosso estudo, nós empregamos SVM. Para priorizar os marcadores que entram no modelo, utilizado pela primeira vez híbrido huberized máquinas de vetores de suporte (HH-SVM), que seleciona automaticamente variáveis ​​e estimar a sua importância com custo computacional eficiente [18]. Para evitar modelo overfitting, usamos uma técnica de reamostragem comum, cinco vezes validação cruzada, para obter taxas de erro mais objectivos [19]. Resumidamente, primeiro equipado usando o modelo 4/5 dos dados ao testar os resultados no restante 1/5 dos dados, e este passo foi repetido 5 vezes de modo a que cada um 1/5 dos dados foi validado uma vez durante o modelo desenvolvimento. Nós desenvolvemos dois tipos de modelos neste estudo, modelos de uma etapa e modelos de duas etapas. Para desenvolver os nossos modelos de uma etapa, CA125 foi incluído junto com os outros biomarcadores medidos como variáveis ​​contínuas sem ponto de corte pré-especificado. Para desenvolver os modelos de duas etapas, primeiro empregou o valor de referência clínica comumente reportados de 35 unidades /ml para CA125 que designa um teste de triagem positivo e então utilizado o algoritmo para os outros biomarcadores medidos, a fim de consultar se um teste adicional adicionado ao este valor de referência de CA125 poderia melhorar a precisão diagnóstica para a classificação, entre as mulheres com um quadro clínico de suspeita de câncer de ovário, entre “casos” (amostras de mulheres nos quais a cirurgia confirmados EOC) e “benigns” (amostras de mulheres nos quais a cirurgia confirmado nenhum cancro do ovário). Mais detalhes para o desenvolvimento do modelo são fornecidos na seção de estatística.

Materiais e Métodos

Assuntos

O protocolo do estudo foi revisto e aprovado pelo Conselho de Revisão Institucional da Universidade of South Florida e todos os participantes forneceram consentimento informado por escrito. Os sujeitos no estudo foram recrutados através de uma investigação de base populacional prospectivo em curso de câncer de ovário em Tampa, Flórida área metropolitana (população de aproximadamente 2 milhões). Através do sistema de apuração rápida do estudo, um total de 1057 mulheres com suspeita de câncer de ovário foram inscritos no pré-operatório entre janeiro de 2005 e março de 2009, sendo responsável por cerca de 75% de todos os casos elegíveis na região geográfica definida. As mulheres com ooforectomia unilateral ou bilateral antes eram inelegíveis, assim como mulheres com história prévia de câncer (exceto para o câncer de pele não-melanoma). Todos os pacientes foram submetidos a exames radiológicos pré-operatório, quer por ultra-sonografia pélvica, tomografia computadorizada e /ou ressonância magnética. Somente os pacientes que se submeteram à cirurgia com base na suspeita clínica de câncer de ovário foram elegíveis e se um paciente foi diagnosticado com EOC, estadiamento cirúrgico foi documentado (incluindo 233 em quem EOC foi confirmada – definida como ovariana primária, trompa de Falópio primária ou cancro peritoneal primário). As amostras benignas foram selecionados aleatoriamente a partir dos restantes amostras (não-EOC); patologias benignas incluem endometriose, cistos ovarianos, e fibroma ovariano. medidas clínicas pré-operatório CA125 no soro foram obtidas de registros médicos. Patologia foi centralmente analisadas por um patologista especialista em câncer de ovário (S.N). Todas as avaliações histológicas foram realizadas cego aos valores laboratoriais dos ensaios de biomarcadores e todos os testes de laboratório foi realizada cegos para o resultado histológico (benigna contra EOC). Amostras de alguns dos sujeitos deste estudo foram independentemente genotipados em um estudo de associação do genoma para identificar a susceptibilidade loci associados com o risco de cancro do ovário [20] e /ou testadas para mutações em genes de susceptibilidade ao câncer de ovário conhecidos [21].

amostras de soro

As amostras de sangue para medições de biomarcadores de estudo foram obtidas por punção venosa de rotina antes da cirurgia. As amostras foram deixadas a coagular e mantida à temperatura ambiente durante o transporte. As amostras foram centrifugadas e o soro aliquotado em criotubos, congelados a -80 ° C no prazo de quatro horas após a coleta da amostra e mantido congelado até a análise laboratorial.

Lipid Extração

Os lípidos foram extraídos usando um Bligh modificado método -Dyer [22], que se segue o procedimento descrito abaixo: foi preparada uma mistura consistindo em 1000 DHPE pmol (1,2-Diheptadecanoyl-

sn-glicero-3

-fosfoetanolamina), 200 pmol de [

13C

16] 16:00 LPA (isótopo pesado de carbono-13 identificada como 1-palmitoil-2-hidroxi-sn-glicerol-3-fosfatídico ácido), e [

13C

3] 14:00 LPC (isótopo pesado de carbono-13 identificada como 1-miristoil-2-hidroxi-sn-glicerol-3-fosfocolina (N, N, N-

13C-trimetil)), que foi adicionado a 200 ul de soro de paciente, como recolhido descrito acima. Estes lípidos adicionados serviu como padrão interno para quantificação de LPA, PPE, e LPC, respectivamente. A mistura foi submetida a vórtice e (v:v) foi adicionado 2 ml de 02:01 metanol-clorofórmio. A nova mistura foi agitada em vórtice novamente e mantidos à temperatura ambiente durante 10 min. e, em seguida, foi centrifugada a 3000 g a 10 ° C durante 10 min. Após centrifugação, duas camadas pode ser visto nesta mistura. A camada superior é uma mistura de água, metanol e clorofórmio, enquanto a camada inferior é um sedimento proteico. A camada de topo líquida foi transferida para outro tubo e secou-se sob azoto. O sedimento seco foi reconstituído em 200 ul de amónio 0,1 M de etilo dissolvido em metanol e transferido para uma injecção inserir dentro de um frasco para injecção.

A cromatografia e espectrometria de massa

A cromatografia líquida espectrometria de massa de electrospray (LC /ESI /MS /MS) As análises dos LPA, PPE, e LPC foram realizadas utilizando um espectrómetro de massa Quattro Micro (Waters, Milford, MA, EUA), equipado com uma ionização por electrospray (ESI) sonda e ligada a um HPLC Shimadzu SCL-10AVP sistema (Shimadzu, Tóquio, Japão).

Para LPA e PPE quantificação, os lípidos foram separadas com um Luna 5μ C18 (2) coluna (50 x 2,0 mm, 5 um de tamanho de partícula, Phenomenex, Torrance, CA, EUA). de amónio 1 mM de solução aquosa de etilo foi utilizado como fase móvel A, enquanto acetato de amónio 1 mM dissolvido em metanol, foi usado como fase móvel B. O tempo total de reacção foi de 15 min e o caudal foi de 200 ul /min. O gradiente usado foi como se segue: A coluna foi equilibrada primeiramente com 20% de B (80% de A), seguido por uma mudança linear de 20% B (80% de A) para 100% B (0% A) no primeiro 3 min . O gradiente foi mantido a 100% de B (0% A) na sequência de 8 min. No restante 4 min, o gradiente foi mudado de volta a 70% de B (30% de A) para re-equilibrar a coluna. Para reduzir a contaminação do espectrômetro de massa, os eluentes entre 0-2,5 min e 13-15 min foram dirigidos em resíduos. 20 ul da amostra foi injectada numa ansa de injecção de 50 ul. Mass análises espectrométricas foram realizadas on-line utilizando espectrometria de massas com ionização por electrospray conjunto no modo negativo múltipla monitoramento de reações (MRM). Os parâmetros são MS: tensão capilar, 3,0 kV; A voltagem do cone, 50 V; temperatura da fonte, 100 ° C; temperatura de dessolvatação, 350 ° C; taxa de gás dessolvatação, 500 L /h de fluxo; taxa de gás cone, 50 L /h de fluxo; resolução em massa de ambos os íons pai e filha, 15,0; multiplicador, 650.

Para LPC quantificação, os lípidos foram separadas com um Hypersil coluna HTS OURO DASH (20 × 2,1 mm, 5 mm de tamanho de partícula, Thermo Electron, Waltham, MA). 0,3% de ácido fórmico em água foi utilizado como fase móvel A, enquanto 0,3% de ácido fórmico em metanol foi utilizado como fase móvel B. O tempo total de reacção foi de 14 min e o caudal foi de 200 ul /min. O gradiente usado foi como se segue: A coluna foi equilibrada primeiramente com 20% de B (80% de A), seguido por uma mudança linear de 20% B (80% de A) para 100% B (0% A) no primeiro 3 min . O gradiente foi mantido a 100% de B (0% A) no 7 minutos a seguir. No restante 4 min, o gradiente foi mudado para 20% de B (80% de A) para re-equilibrar a coluna. Para reduzir a contaminação do espectrômetro de massa, os eluentes entre 0-2,5 min e 11-14 min foram dirigidos em resíduos. 40 ul da amostra foi injectada numa ansa de injecção de 20 ul. Massa análises espectrométricas em linha foram realizadas utilizando espectrometria de massa em tandem com ionização por electrospray no modo positivo múltipla monitorização de reacção (MRM). Os parâmetros são MS: tensão capilar, 4,0 kV; A voltagem do cone, 40 V; temperatura da fonte, 100 ° C; temperatura de dessolvatação, 350 ° C; taxa de gás dessolvatação, 500 L /h de fluxo; taxa de gás cone, 50 L /h de fluxo; resolução em massa de ambos os íons pai e filha, 15,0; multiplicadores, 650.

Medidas Laboratório de Controle de Qualidade

Por causa efeitos lote são um problema potencial nos esforços de descoberta de biomarcadores, nós empregamos várias estratégias para monitorar e conta para esta preocupação, incluindo as normas internas, a qualidade amostras de controlo e calibradores. Os padrões internos são descritos acima (em “Lipid Extraction”). de controlo (QC) amostras de qualidade consistiu de múltiplos 300 mL alíquotas idênticos de soro humano reunido. Uma amostra de CQ foi executado antes de cada 10 amostras clínicas. Calibradores consistiu de várias concentrações de lípidos puros padrões de picos em 4% de albumina de soro humano em tampão de DPBS. Nove diferentes concentrações de calibradores foram feitas a partir da solução estoque e executar antes de cada 100 amostras.

pré-processamento de dados e Normalização

Os dados obtidos a partir das estratégias de controle de qualidade de três acima descritos foram usadas para endereço de executar-se executar variações e proporcionar uma base para a conversão de a área do pico para cromatografia concentração absoluta para cada analito. Foram obtidas as áreas sob os picos de cromatografia de 8 EPIs, 6 APLs, 5 LPCs e suas normas internas correspondentes (marcados por isótopos pesados). As áreas sob os picos dos padrões internos foram usados ​​para estimar a razão de pico entre o analito e os padrões internos. O comportamento de cada analito na geração de pico comparada com o seu correspondente padrão interno foi semelhante, com a excepção de SPC e PAF-C16; estes analitos foram excluídos das análises. Assim, um total de 17 lipídios e CA125 foram incluídos nas análises.

Vamos

R

denotar o rácio máximo entre a área sob o pico cromatográfico para o analito ao longo dos padrões internos, e

C

denotar a concentração. Dada a relação linear observada entre a relação de pico quantificada e concentração conhecida em cada conjunto de dados de calibração, uma regressão linear simples foi realizada para estimar a inclinação da regressão para cada lote, que foi então usado para a conversão de concentração para as amostras clínicas a partir da razão pico Como . Utilizou-se o prazo de amostra QC entre cada 10 amostras clínicas para examinar a variação de qualquer efeito lote potencial. A concentração estimada QC também foi utilizado para calcular as concentrações ajustada ao lote para cada analito de modo a que as concentrações eram comparáveis ​​entre lotes para cada um dos LPAs e EPI. Se a concentração ajustada foi menor do que zero, então zero foi utilizado para a concentração estimada. Para LPCs, não havia nenhuma indicação observável de efeitos de lote. Por isso, foi realizado nenhum ajuste lote.

Desenvolvimento de Modelos Estatísticos

Nós empregamos uma abordagem poderosa estatística e máquina de aprendizagem, SVM [16], [17], para classificar as 211 amostras do pacientes com diagnóstico de EOC (casos) e as 212 amostras benignas (benigns) incluídos na análise. Embora SVM demonstra um desempenho de classificação superior a muitos outros métodos de aprendizagem estatística e máquina, ele também compartilha alguns desafios comuns com outros métodos, ou seja, seleção de variáveis ​​(seleção biomarcador) e o risco de gerar taxas de erro demasiado optimistas devido a modelar overfitting. Usamos HH-SVM [18] para a primeira priorizar marcadores para entrar no modelo de classificação entre benigns e casos. HH-SVM combina a função de perda dobradiça huberized ea pena elástica-net para executar a classificação e seleção de variáveis. Utilizou-se o publicado anteriormente

Código de R

[18] para gerar lotes de peso para priorizar os marcadores com base em sua importância na classificação. Porque CA125 no soro é um biomarcador comum utilizado na prática clínica, construímos os modelos, incluindo CA125 e adicionando os lipídios marcadores candidatos, um por um, com base nos pesos estimados por HH-SVM. Cada uma das SVMs foi montado utilizando a função Matlab

svmclassify

e os parâmetros foram estimados. Nós usamos

K

vezes de validação cruzada (CV) para evitar modelo overfitting [19], em que

K

= 5 em nosso estudo. Os erros estimados usando generalizadas de 5 vezes de validação cruzada é mais objectiva [19] do que as taxas de erro estimadas sem validação cruzada. Os dados foram divididos em

K

(= 5) cerca de partes de tamanhos iguais. Para o

k

th (ou seja, a 5

th) parte, há mais ou menos uma porção igual de caso EOC e amostras benignas (meio a meio) eo modelo foi equipado para o outro

K

-1 (= 4) partes dos dados. O erro de previsão do modelo foi então calculada para o

k

th parte. O procedimento foi realizado para

K

= 1, 2, …, 5, e, em seguida, a estimativa de validação cruzada do erro de predição (erros CV) foi calculado aswhere é a observação contendo parte

i

, e é o valor equipada para observação

i

, calculado com o

th parte dos dados removidos.

Nós desenvolvemos dois tipos de modelos, de uma etapa modelos e dois modelos de passo. Para os modelos de uma etapa, nós não utilizar um ponto de corte específica para valores de CA125 embora os valores de CA125 foram incluídas nos modelos SVM. Para os modelos de duas etapas, desenvolvemos nossos algoritmos para os grupos de alto e baixo risco usando primeiro o ponto de corte CA125 de 35 unidades /ml, uma vez que este é o valor de referência mais comumente relatados usado clinicamente para designar um teste positivo, e tem também sido utilizado em ensaios de rastreio para definir um resultado de teste anormal, incluindo na próstata, pulmão, colo, Screening Trial cancro do ovário [13] .Portanto, foi utilizado o ponto de corte simples de 35 unidades /ml como o primeiro passo na construção do dois modelos de passo. Note-se que todos os pacientes do estudo foram submetidos a exames de imagens radiológicas de diagnóstico, não triagem e informações de imagem não está incorporada no desenvolvimento do modelo.

Para os modelos de uma etapa, para um determinado conjunto de marcadores, o modelo é desenvolvido do mesmo modo em todas as amostras, independentemente do nível pré-operatória CA125. Começamos o desenvolvimento modelo com CA125 sozinho. fosfolípidos candidatos foram classificados pelos pesos gerado usando HH-SVM como descrito acima, e, em seguida, adicionaram-se os modelos de um por um durante o desenvolvimento do modelo. Usando validação cruzada é mais conservadores, quando comparados com os modelos desenvolvidos sem a validação cruzada. Para a prova de princípio, nós desenvolvemos dois modelos com e sem validação cruzada, ilustrando que os modelos com taxas de erro mais objetivos rendimento de validação cruzada.

Para os modelos de duas etapas, as amostras foram classificadas pela primeira vez em alta -CA125 (CA125≥35 unidades /ml) e baixo-CA125 (CA125 35 unidades /mL) groups. Na segunda etapa, foi desenvolvido modelos separados para cada um dos dois grupos, os grupos de alto e baixo-CA125, respectivamente. Especificamente, desenvolveu-se a modelos de dois passos com base no ponto de corte geralmente relatado de CA125 em 35 unidades /ml, como primeiro passo; Nós, então, perguntado se um segundo teste adicionado a este valor de referência de CA125 pode melhorar a precisão do diagnóstico para a classificação de “casos” (amostras de mulheres com EOC) e “benigns” (amostras de mulheres sem câncer).

resultados

o estudo incluiu amostras de todos os participantes nos quais o diagnóstico de EOC foi confirmada (N = 233) e igual número de amostras seleccionadas aleatoriamente a partir de mulheres da mesma coorte diagnosticado com doença benigna. Dois casos foram excluídos devido à indisponibilidade de dados sobre o nível CA125 pré-operatório. A análise preliminar (usando boxplots e histogramas; dados não apresentados) sugeriram que os níveis dos biomarcadores medidos podem potencialmente diferir entre diferentes grupos étnicos, e apenas uma pequena parte das amostras são de indivíduos não-caucasianos. Por isso, limitou a análise com os indivíduos caucasianos. Isto resultou em um total de 211 amostras de EOC e 212 amostras benignas incluídos nas análises. Entre os 211 casos EOC, a média de idade (± desvio padrão) foi de 62 (± 12) anos de idade, com 31 pré-menopausa e 180 na pós-menopausa. Entre os 212 benigns, a média de idade (± desvio padrão) foi de 57 (± 14), entre os quais 65 foram pré-menopausa e 147 na pós-menopausa. Mais detalhes sobre as características dos casos EOC são fornecidos na Tabela 1.

Resultados CA125

Um total de 211 casos e 212 benigns foi incluído na análise. Usando apenas a concentração CA125 com ponto de corte de 35 unidades /ml para classificar as amostras em casos CA125≥35 (unidades /ml) e benigns CA125 ( 35 unidades /ml), a taxa de erro é 29,79% (126/423). A sensibilidade é 84,36% (178/211) ea especificidade é 56,13% (119/212). A taxa de falsos positivos (amostras benignas classificadas como casos) é bastante elevado, como é típico na prática clínica.

One-step modelo resulta

Começamos o desenvolvimento do modelo apenas com CA125, a única comumente usado biomarcador clínico para câncer de ovário. marcadores adicionais foram adicionados para os modelos one-por-um com base nos pesos estimados usando HH-SVM (Tabela 2).

Tal como descrito nos métodos, um conjunto de modelos foram equipados com CV, e o outro sem CV. As taxas de erro estimadas para modelos com 1 a 5 marcadores incluídos encontram-se resumidos na Tabela 3. Tal como se esperava, os modelos sem CV ter estimativas mais optimistas de taxas de erro. À medida que o número de variáveis ​​aumenta, as taxas de erro tornam-se menores. Em contraste, o erro CV dos modelos com dois marcadores, CA125 e 16:00, 18:01, EPI é o mínimo entre os 5 modelos com CV (Tabela 3). À medida que o número de marcadores aumenta de 2 a 5, os erros tornam-se maiores CV (em vez de menor). Os erros CV aumentar à medida que o número de marcadores aumenta e indicam o superajuste como esperado. Os modelos com maior número de marcadores não estão listados aqui. O modelo com erro mínimo CV contém dois marcadores, CA125 e 16:00, 18:01 PPE. A sua melhoria para a classificação em relação ao modelo com apenas CA125 é devido à melhoria na especificidade. A especificidade é 85,38% e a sensibilidade é 70,62%. Para comparar o desempenho do modelo à do ponto de corte de 35 unidades /ml para CA125, definindo a especificidade para 56,13%, a sensibilidade é melhorada a partir de 84,36% para 88,15%. De uma maneira semelhante, usando este modelo, não é comparável a especificidade do diagnóstico de 58,49% (em comparação com 56,13%) neste conjunto de amostras, mantendo ao mesmo tempo a sensibilidade em 84,36%.

em duas etapas Modelo resultados

nos modelos de uma etapa acima, temos mostrado que o desenvolvimento do modelo utilizando validação cruzada é mais conservador. Assim, para os modelos de dois passos, foi utilizada apenas uma abordagem conservadora para desenvolver modelos, a fim de evitar superajuste. Conforme descrito nos Materiais e Métodos de seção, as amostras foram primeiro classificados em alta CA125 (CA125≥35) ou low-CA125 (CA125 35) grupos. Para a segunda etapa, desenvolvemos modelos SVM separadas para os grupos de alto CA125 e CA125 baixo. O HH-SVM como descrito na secção Materiais e Métodos foi usada para priorizar biomarcadores para os grupos de alto e baixo CA125, respectivamente.

Com base na classificação dos marcadores em cada um dos de alta e baixa -CA125 grupos (Tabela 4), os erros de validação cruzada para SVM com 1 a 7 marcadores foram estimados, respectivamente. Para o grupo de baixo CA125, o primeiro modelo SVM contém o marcador topo do ranking, 16:00, 18:01 PPE. O modelo foi equipado primeiro e erro CV foi estimado. O segundo modelo SVM contém um marcador adicional no modelo, 15:00 LPC, para além do original do marcador (melhor classificada), 16:00, 18:01 PPE. Este procedimento de adicionar marcadores um por um para modelos com base nos pesos estimados por HH-SVM é repetido para os modelos com 3 marcadores, 4 marcadores, e até 7 marcadores. À medida que o número de marcadores no modelo aumenta, o aumento dos erros CV indica o superajuste de modelos como esperado, por isso, parou a adição de marcadores. Para o grupo low-CA125, o modelo com a taxa de erro CV menor é o modelo com 4 marcadores: 16:0, 18:01 PPE, 15:00 LPC, 18:02 LPA e 18:00, 22:06 PPE (como parte de todos os 3 modelos da Tabela 5), ​​referidos como “conjunto de 4 marcador” na Tabela 5. para o grupo de alto CA125, os modelos foram equipados da mesma forma. O primeiro SVM contém os modelos de topo do ranking marcador, 16:00, 18:01 PPE, e adicionais com mais marcadores foram construídos adicionando-os um por um. O modelo foi equipado primeiro e erro CV foi estimado. A taxa de erro CV menor é a do modelo com 2 marcadores: 16:00, 18:01 PPE e 14:00 LPC, (como parte do modelo

M3

na Tabela 5). Estes 2 marcadores são referidos como “2 set marcador” na Tabela 5.

O erro de classificação de taxas, especificidades e sensibilidades dos três modelos de duas etapas com combinações de ambos a 2 conjuntos de marcadores e /ou os conjuntos de 4 marcadores estão resumidos na Tabela 3. o primeiro passo da modelagem para todos os três modelos é idêntica, isto é, utilizando a concentração de CA125 de 35 unidades /ml, como o ponto de corte para classificar as amostras em alta e baixa grupos CA125. Diferentes modelos para os grupos de alto e baixo CA125 foram montados separadamente (Tabela 5). O primeiro modelo,

M1

, tem modelos SVM separadas para os grupos de alto e baixo CA125. Os marcadores para cada SVM são as 4 marcadores mencionados acima (16:00, 18:01 PPE, 15:00 LPC, 18:02 LPA, e 18:00, 22:06 PPE), mas os modelos são montados separadamente para cada

Deixe uma resposta