PLOS ONE: Mudando de População-larga para Cancer Personalized Prognosis com Microarrays

Abstract

A era da medicina personalizada para cancro terapêutica deu um importante passo em frente em fazer prognósticos precisos para pacientes individuais com a adoção da tecnologia de microarray de alto rendimento. No entanto, a tecnologia de microarray em diagnóstico ou o prognóstico do cancro tem sido utilizado principalmente para a avaliação estatística de populações de pacientes, e, assim, exclui a variabilidade inter-individual e previsões específicas do paciente. Aqui propomos uma métrica chamada confiança clínica que serve como uma medida de confiabilidade prognóstico para facilitar a mudança de ao prognóstico do câncer personalizado toda a população que utiliza modelos de previsão com base num microarray. O desempenho dos modelos baseados em amostras previstas com diferentes confidências clínicos foi avaliada e comparada sistematicamente usando três grandes conjuntos de dados clínicos que estudam os seguintes tipos de cancro: cancro da mama, mieloma múltiplo e neuroblastoma. As curvas de sobrevida para os pacientes, com diferentes confidências, também foram delineados. Os resultados mostram que a métrica de confiança clínica separa pacientes com diferentes precisão de previsão e os tempos de sobrevivência. As amostras com alta confiança clínica eram susceptíveis de ter prognósticos precisos a partir de modelos preditivos. Além disso, pacientes com alto grau de confiança clínica seria esperado para viver por um tempo notavelmente mais longo ou mais curto se o seu prognóstico era bom ou desagradável com base nos modelos, respectivamente. Conclui-se que a confiança clínica poderia servir como uma métrica benéfico para microarrays utilizando previsão prognóstico do câncer personalizado. Atribuindo um nível de confiança de prognóstico, com a métrica de confiança clínica fornece o clínico um objetivo, com base personalizado para decisões, como escolher a severidade do tratamento

Citation:. Shao L, Fan X, Cheng N, Wu L , Xiong H, fang H, et al. (2012) Mudando de-wide População to Cancer Personalized Prognosis com microarrays. PLoS ONE 7 (1): e29534. doi: 10.1371 /journal.pone.0029534

Autor: Christina Chan, Michigan State University, Estados Unidos da América

Recebido: 20 de junho de 2011; Aceite: 30 de novembro de 2011; Publicação: 25 de janeiro de 2012

Direitos de autor: © 2012 Shao et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este trabalho foi apoiado pela National Science Foundation da China (No. 30801556 e 30830121), National S Projeto principal T (No. 2008ZX09312-001), Science Foundation da Universidade chinesa (No. 2009QNA7031), ea Fundação Zhejiang Provincial Natural Science of China (No. R2080693). Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

Nem todos os indivíduos respondem ao tratamento medicamentoso da mesma forma. Assim, o desenvolvimento de regimes terapêuticos personalizados otimizados para pacientes individuais representa um importante objetivo de 21

medicina do século XXI [1]. ferramentas modernas estão sendo utilizados para ajudar os médicos a tratar eficazmente pacientes como indivíduos e fornecendo intervenção medicamentosa personalizado.

variação inter-individual na resposta ao tratamento medicamentoso é fortemente influenciada pelo estado fisiológico do paciente no momento do tratamento. Este estado pode ser caracterizado por perfis de expressão de gene de [2]. Portanto, a tecnologia de microarray pode orientar a selecção de drogas ou regimes terapêuticos e ser utilizada para avaliar a susceptibilidade de um paciente a determinadas doenças, permitindo um plano personalizado de monitorização e tratamento de prevenção [3]. Os benefícios potenciais da tecnologia de microarray em aplicações clínicas têm sido demonstrado por vários estudos de referência [4] – [7]. modelos de previsão com base num microarray (ou assinaturas genómico) têm mostrado utilidade em associar diferentes subgrupos de cancro da mama com resultados clínicos distintos [8] – [13], como MammaPrint ™ [4], [5], um marco em microarray-based prognóstico para o cancro da mama [14]

O desenvolvimento de um modelo preditivo baseado em microarray para a classificação tumor normalmente envolve duas etapas sequenciais [4], [15] – [17].. Primeiro, o modelo é desenvolvido com base em um conjunto de treinamento de pacientes com rótulos de classe conhecidos dados (por exemplo, estado tumor) e expressão gênica. Em seguida, o modelo de formação é validada através de um conjunto de validação que contém pacientes com rótulos de classe conhecidos. A validade do modelo de formação em desempenho no conjunto de validação tem sido o foco da pesquisa ‘predição de classes “. Para garantir o modelo de formação pode ser usado em aplicações clínicas do mundo real, sugere-se que o modelo deve ser avaliada com um grande número de amostras independentes neste processo de validação externa [18].

É importante note que a estratégia de validação externa acima mencionada avalia o desempenho de um modelo de formação utilizando uma população definida pelo conjunto de validação. O desempenho médio (por exemplo, especificidade, sensibilidade) sobre a população é usada para determinar se o modelo pode ser um teste de diagnóstico ou prognóstico de confiança. Esta estratégia é realizada sob a suposição de que o modelo de desempenho igualmente para todos, sem considerar a variabilidade inter-individual. Assim, o desempenho médio com base em uma população de pacientes não podem garantir a sua capacidade preditiva para pacientes individuais, o que pode resultar em diagnósticos potencialmente não confiáveis ​​ou prognósticos na aplicação no mundo real. Este one-size-fits-all estratégia precisa ser modificado a partir de largura população à medicina personalizada em aplicações baseadas em dados de microarranjos.

Nós propomos uma métrica chamada confiança clínica que mede a confiabilidade do modelo no desempenho de previsão em um base individual. confiança clínica pode ser útil em determinar tratamentos apropriados; por exemplo, os pacientes com elevada confiança e mau prognóstico pode ser dada tratamentos mais rigorosos. Além disso, os pacientes com confidências clínicos menores podem ser os principais candidatos para uma avaliação mais aprofundada das suas condições com métodos alternativos. A precisão da métrica confiança clínica foi investigada em três grandes conjuntos de dados clínicos com um total de seis parâmetros clínicos [19].

Especificamente, primeiro divididas cada conjunto de dados em dois, isto é, a formação e validação set. Para imitar cenários clínicos reais, fizemos o conjunto de validação que contém apenas os pacientes cujos dados microarray foram gerados em uma data posterior do que os do conjunto de treinamento. Nós derivado a confiança clínica do modelo de formação, seguida pela avaliação da sua correlação com a precisão da previsão para o prognóstico eo tempo de sobrevivência dos doentes no conjunto de validação. Para o melhor de nosso conhecimento, esta é a primeira tentativa de fornecer uma medida de confiança para pacientes individuais em pesquisa “previsão classe” à base de microarray, que é um importante passo em frente na medicina personalizada.

Materiais e Métodos

Os conjuntos de dados

Três em grande escala, conjuntos de dados clínicos cancro foram utilizados neste estudo: cancro da mama (BR) [20], mieloma múltiplo (MM) [21], e neuroblastoma (RN) [22]. Um resumo conciso dos conjuntos de dados é dada na Tabela 1. Informações mais detalhadas destes conjuntos de dados podem ser encontradas no papel principal da segunda fase do projeto MicroArray Controle de Qualidade (MAQC-II) [19].

Cada conjunto de dados tem dois endpoints clínicos relacionados ao prognóstico do câncer (incluindo dados de sobrevivência) ou tratamento: BR-PCR e BR-erpos no conjunto de dados da resposta ao tratamento, NB-EFS e MM-EFS no conjunto de dados sobrevida livre de eventos, e NB -OS e MM-oS no conjunto de dados de sobrevivência global (Tabela 1). Estes três conjuntos de dados clínicos foram estudados no projeto MAQC-II liderado pelo FDA [19]. Para emular um cenário clínico do mundo real na aplicação de assinaturas genômicas, duas populações independentes de pacientes para cada um dos três conjuntos de dados clínicos foram definidos pelo Consórcio MAQC como os conjuntos de treinamento e validação usando uma abordagem cronológica em que as amostras nos conjuntos de validação foram gerados em uma data posterior do que nos conjuntos de treinamento. Os tamanhos de amostra para os conjuntos de formação variou entre 130 e 340, e a relação de eventos positivos para eventos negativos variaram de 0,18 a 1,60; Ao mesmo tempo, os tamanhos das amostras nos conjuntos de validação variaram entre 100 e 214, e a relação de eventos positivos para eventos negativos variou entre 0,14 e 1,56.

dois positivos e dois terminais de controlo negativo também foram utilizados neste estudo. Os parâmetros de controlo positivo, isto é, PC e NB-MM-PC, foram derivadas a partir de conjuntos de dados Nb e MM separadamente, com as amostras designadas, por o género. Para os dois terminais de controlo negativo, isto é, NB-NC e MM-NC (que correspondem aos conjuntos de dados e NB mm, respectivamente), as etiquetas de amostra (isto é, os eventos positivos ou negativos) foram gerados aleatoriamente. Usando esses dois controles permitem avaliar o desempenho dos endpoints clinicamente relevantes em relação ao desempenho esperado mínimo e máximo fornecido pelos controles.

confiança Clínica

A confiança clínica mede a confiança de uma amostra sendo atribuído a uma classe específica de um modelo preditivo. Para a amostra

i

, sua métrica confiança clínica () é o nível de confiança de uma amostra em ser correctamente atribuído por um modelo preditivo e é definido como: (1) onde e são as medidas de similaridade entre amostras e amostras em classes 1 e 2, respectivamente. A medida de similaridade varia de acordo com classificadores utilizados. Dois classificadores bem estudadas para dados de expressão gênica foram empregados neste estudo, ou seja, mais próxima-Centróide regra de classificação (

NC

) [4] e

k

-nearest vizinhos (

kNN

,

k

= 5) [23]. Para o

NC

classificador, e foram definidos como os coeficientes de correlação da amostra desconhecida para os centróides das classes 1 e 2, respectivamente. O centróide é definido como vectores de expressão os valores médios. Para o

kNN

classificador, e estão a ser definido o número de vizinhos mais próximas à amostra desconhecida pertencentes à classe 1 e classe 2, respectivamente.

Os valores variam entre 0,5 e 1 em que um valor de 0,5 indica que a predição é devido ao acaso. Cada vez mais os valores maiores correspondem a cada vez maior confiança predição. Por uma questão de simplicidade, toda a análise foi baseada em três níveis de confiança: baixo nível de confiança (LC; 0.5≤≤0.6), a confiança média (MC; 0,6 ≤0.8) e alta confiança (HC; 0,8 ≤1.0 )

A análise estatística

A análise geral do fluxo de trabalho é mostrado na Figura 1.; Detalhes adicionais são fornecidos em Methods S1. O protocolo de análise começa pelo desenvolvimento de uma melhor classificador com base no conjunto de treinamento, e termina com a previsão do conjunto de validação. A classe prevista e confidências clínicos são registradas em matrizes correspondente

L

e

C

, respectivamente. Para assegurar a validade estatística, o procedimento é repetido 500 vezes, resultando em 500 classificadores diferentes dos conjuntos de treinamento e 500 previsões para o conjunto de validação. O desempenho de ambos os modelos de formação e previsões é avaliada por meio do coeficiente de correlação Matthews (MCC) [24], [25].

Detalhes adicionais são fornecidos em Métodos S1.

Uma permutação teste também foi utilizado para comparar precisão da previsão classificador contra acaso [26], [27]. Em cada permutação, o protocolo de análise apresentado na Figura 1 foi repetido com a excepção de que os rótulos de classe no conjunto de treino foram randomizados. Em outras palavras, os modelos construídos com conjuntos de formação ao acaso, foram utilizados para prever os conjuntos de validação. Depois de 500 repetições, o grau de correlação acaso e previsibilidade dos terminais foi calculado com Cohen

d

[28], que mede a diferença padronizada entre dois meios.

Resultados

o desempenho de validação cruzada medida em valores de MCC para todos os modelos de formação juntamente com o desempenho médio de predição sobre os conjuntos de validação estão resumidos na Tabela S1. O desempenho do modelo segue a ordem da NB-PC, MM-PC, BR-erpos, NB-EFS, NB-OS, BR-PCR, MM-EFS, MM-OS, MM-NC e NB-NC. Os dois controles positivos tiveram o melhor desempenho, enquanto os dois controles negativos pior desempenho, o que é consistente com as expectativas do delineamento experimental.

confiança clínica correlaciona-se positivamente com o desempenho

previsão do modelo

O primeiro investigou o modelo desempenho na validação definida para pacientes que caem em diferentes categorias de confiança clínica. Como representado na Figura 2, uma correlação positiva é mostrada entre a precisão da previsão e o nível de confiança para os seis parâmetros clínicos e quatro de controle usando o

kNN

classificador. Entre os seis parâmetros clínicos, o conjunto de dados BR-erpos mostrou a correlação mais forte. Para o BR-erpos, as previsões valor médio MCC com baixo nível de confiança (LC) foi de apenas 0,19, enquanto que o valor médio do MCC marcadamente aumentada para cerca de 0,78 como o nível de confiança aproximou 1. Assim, em comparação com o valor do MCC global (0,71) ( tabela S1), a confiança clínica com êxito poderia explicar a variabilidade inter-individual em discriminar os pacientes com maior ou menor do que a precisão média de previsão.

o Círculo raios são dimensionadas para a percentagem do total de amostras no nível de confiança clínica. Os níveis de confiança são “0,6”, “0,8”, e ‘1’.

É claro que a previsibilidade intrínseca por perfis de expressão de genes varia para diferentes pontos de extremidade, tal como evidenciado pelo decréscimo gradual da declive de desempenho do modelo de seis pontos finais clínicos ao longo de intervalos de confiança diferentes (isto é, as pistas da Figura 2, os dados foram apresentados na Tabela S2) e o número de amostras distribuídas pelas regiões de confiança diferentes (ou seja, o tamanho do marcador na Figura 2). Como mostrado na Figura 3, foi observada uma correlação linear positiva entre o declive obtido a partir da Figura 2 e a previsibilidade inerente (quantificado por Cohen

d

[28]) dos pontos finais clínicos de seis e quatro de controlo. Os pontos finais previsíveis (por exemplo, BR-erpos, NB-EFS) tendem a ter uma porcentagem maior de pacientes (representado como o tamanho do marcador na Figura 2) nas regiões altas de confiança com precisão da previsão de alta do que os endpoints menos previsíveis (por exemplo, MM -EFS, MM-OS). Informações detalhadas sobre a distribuição da amostra em cada região de confiança foi dado na Tabela S3. Estas observações foram posteriormente verificados usando um método diferente padrão de reconhecimento (ou seja,

NC

) (Figuras S1 e S2), e também uma estratégia de divisão da amostra diferente (80/20 divisão, figuras S4 e S5).

as pistas são obtidos a partir da análise de regressão com base na porção linear da curva de confiança-MCC, enquanto Cohen

d

representa a previsibilidade inerente ao conjunto de dados.

a resultados demonstram que a previsibilidade inerente mais elevado de um ponto de extremidade está relacionada com uma maior percentagem de pacientes que se enquadram os níveis de confiança mais elevados quando se utiliza modelos de previsão com base num microarray. Como a correlação de uma assinatura genômica com um resultado clínico raramente é perfeito, a confiança clínica poderia ser útil para separar os pacientes em diferentes grupos para os quais podem ser desenvolvidos procedimentos de tratamento específicos.

A relação de confiança clínica com o paciente de sobrevivência tim

e

Nós também avaliamos se a confiança clínica é preditivo da taxa de sobrevivência para os pacientes no conjunto de validação. Os pacientes foram divididos em dois grupos de prognóstico (ou seja, bom e mau prognóstico) para ambos os conjuntos de dados NB e MM com endpoints OS (sobrevida global) e EFS (sobrevida livre de eventos), respectivamente (Métodos S1). A Figura 4 apresenta as curvas de mínimos para pacientes com diferentes confidences clínicos para ambos os grupos de prognóstico. Pacientes com elevada confiança clínica apresentaram um aumento da taxa de sobrevivência no grupo de bom prognóstico e uma taxa de sobrevivência diminuiu no grupo de prognóstico pobre, o que indica que a confiança clínica melhorada a exactidão de prognóstico derivados dos modelos preditivos. Tomando MM-OS como um exemplo, a taxa de sobrevivência é aparentemente mais elevada para os pacientes do grupo bom prognóstico com alta confiança (HC) em comparação com aqueles com baixa (LC) (-rank log valor de teste p 0,01) e média (MC) queridos (teste log-rank valor p 0,13), especialmente para cada marca dia mais de 1000 dias (Figura 4). Para pacientes com mau prognóstico, mais de 80% das pessoas com baixa confiança clínica vivido tanto quanto 300 dias, enquanto que aproximadamente 30% dos pacientes para aqueles com elevados confidences sobreviveu, naquele tempo, respectivamente. Também foram observadas tendências semelhantes no conjunto de dados NB-OS.

Figura S3, que descreve as curvas do EFS para pacientes com diferentes confidências clínicos, demonstra uma tendência semelhante à das curvas OS apresentado na Figura 4. O positivo correlação de confiança clínica com taxa de EFS é claramente mostrado nas Figuras S3C S3D e para os pacientes com bom prognóstico. No entanto, a correlação é menos significativa para os pacientes com mau prognóstico (Figuras S3a e S3B). Os correspondentes resultados para 80/20 divisão foi mostrado nas Figuras S6 e S7, e conformou-se para estas observações acima mencionadas.

Os resultados demonstram que uma vez que os pacientes foram agrupados em boas ou más grupos prognóstico pelos modelos preditivos , a confiança clínica pode caracterizar ainda mais a taxa de sobrevivência de pacientes individuais em cada grupo de prognóstico.

Discussão

Vários testes de diagnóstico em toda a população /prognósticos baseados na expressão do gene têm sido relatados [4], [6], [7]. Os modelos de base populacional fornecem apenas uma indicação média da população com uma precisão média da população correspondente. Neste estudo, foi demonstrado que a confiança clínica é tanto capaz de separar os pacientes que podem ser previstas de forma mais fiável daqueles que são previstas com menos precisão, e preditivo do índice de sobrevivência para os pacientes após eles são agrupados em diferentes grupos de prognóstico. Assim, atribuindo um nível de confiança de prognóstico, com a métrica de confiança clínica irá fornecer o clínico, uma base objetiva mais personalizado para as decisões quando utilizando biomarcadores derivados de dados de microarranjos.

Especificamente, descobrimos que a confiança clínica proporcionou uma melhor estimativa para o tempo de sobrevivência quando os pacientes foram classificados em diferentes categorias de prognóstico com base em ambos os 70/30 e 80/20 atribuições de amostra. Para os doentes com bom prognóstico, maior confiança clínica foi fortemente correlacionada com o tempo de sobrevida mais longa. Da mesma forma, para os pacientes com mau prognóstico, a taxa de sobrevivência foi significativamente menor para aqueles com altos confidências do que para os outros. Tomando terminais MM-EFS e MM-OS como exemplos, apesar do facto de que elas são bastante difíceis de ser previsto, os pacientes com elevada confiança exibir uma taxa de sobrevivência significativamente maior ou menor quando são agrupados de acordo com bom ou mau prognóstico, respectivamente. É importante ressaltar que todos os pacientes no grupo de confiança em alta sobreviveu a 5000 dias (Figura S3C), demonstrando que a confiança clínica é uma ferramenta informativa prognóstico tempo de sobrevivência.

Um aspecto importante deste estudo é que duas positivas (NB-PC , MM-PC) e dois controle negativo (NB-NC, MM-NC) conjuntos de dados foram envolvidos, o que é essencial para avaliar o desempenho dos endpoints clinicamente relevantes contra o máximo teórico e desempenho mínimo previsto pelos controles. Especificamente, a correlação positiva entre o desempenho do modelo e confiança clínica para os dois conjuntos de dados de controle positivas mostradas na Figura 2 confirmou o potencial de confiança clínica para fornecer uma medida de fiabilidade para medicina personalizada, enquanto o impacto insignificante de confiança clínica nos dois conjuntos de dados de controlo negativo ainda limitada a possibilidade de obtenção de falsos positivos. Assim, a inclusão de conjuntos de dados de controlo positivas e negativas em tal análise seria de grande ajuda para garantir a confiabilidade dos resultados.

Ela permanece enigmática por que alguns dos pontos finais foram mais difíceis do que outros para prever. A Figura 2 e Figura 3 comparam a previsibilidade entre os três conjuntos de dados e correspondente seis terminais. Prontamente endpoints previsíveis têm uma alta porcentagem de pacientes que caem na região de confiança elevado. Por exemplo, a percentagem de pacientes que mostraram alta confiança clínica (74,70%) para o BR-erpos ponto final é muito mais elevada do que a do ponto final MM-EFS (37,51%) (Figura 2), o que pode indicar que o BR-erpos ponto de extremidade contém um sinal mais forte do que a expressão do gene MM-EFS faz. Além disso, a previsibilidade do conjunto de dados (de Cohen

d

) está diretamente relacionada com o coeficiente de correlação entre o nível de confiança e desempenho de previsão MCC (Figura 3).

A capacidade de quantificar confidências clínica pode aumentar consideravelmente os processos de tomada de decisões clínicas baseadas em modelos de previsão baseados em microarrays, especialmente para as opções de tratamento personalizado. Por exemplo, os modelos aqui apresentados podem testar para o potencial de resposta ao tratamento com as previsões de alta confiança e baixa confiança sendo usados ​​de maneiras diferentes. Os pacientes com bom prognóstico e elevados confidences são candidatos à aplicação de protocolos de rotina para evitar a sobre-tratamento, enquanto que as estratégias rigorosas deve ser seleccionado para aqueles com prognóstico pobre e elevados confidences para prolongar o tempo de sobrevivência máximo de tempo possível. No entanto, para os pacientes nas regiões de baixa confiança, deve ser considerada a avaliação adicional usando métodos alternativos.

É importante notar que a estratégia proposta neste estudo enfatizando a mudança de base populacional para prognóstico do câncer personalizado não negar a importância da previsão de base populacional, mas baseia-se em seu sucesso. Se o desempenho de um modelo de previsão não seja informativo, tal como pode ser visto nas duas contraprovas negativas (i.e., MM-NC e NB-NC), a confiança não clínica será preditivo. Assim, os métodos de validação do modelo que incluem validação cruzada e validação externa independente ainda são essenciais para assegurar a validade dos modelos de previsão com base num microarray. No entanto, desde a previsão de base populacional não fornecer uma avaliação precisa para cada paciente no seio da população, a confiança clínica oferece um meio para medir a confiabilidade para as previsões individuais com base na previsão de base populacional.

Os benefícios de personalização medicina nos cuidados de saúde são bem conhecidos [1]. Ele permite que o paciente e para o médico para ser mais conscientes dos benefícios e os riscos de possíveis tratamentos e resultados potenciais afetados pela composição genética ou outras influências ambientais. Assim, informou, sob medida, e as decisões relacionadas com a saúde pode ser feita para cada pessoa [29]. Combinando tecnologia de microarray capaz de perfilar os níveis de centenas de milhares de genes com técnicas de reconhecimento de padrões de expressão tem sido um passo importante em direção individualizado de tomada de decisão [30]. Nós apresentamos exemplos aplicar a avaliação de confiança para prognóstico do câncer e previsão tempo de sobrevivência para os modelos desenvolvidos a partir de dados de microarranjos. No entanto, a abordagem pode ser generalizada para biomarcadores e modelos construídos com base em dados de outras plataformas de alto rendimento. Além disso, o conceito é geralmente aplicável para todas as metodologias de classificação de aprendizagem supervisionada que podem definir uma confiança clínica.

Informações de Apoio

Figura S1.

Previsão MCC como uma função de confiança clínica durante dez conjuntos de dados usando

NC

. raio do círculo são dimensionadas para a percentagem do total de amostras no nível de confiança clínica. Os níveis de confiança são “0,5-0,6”, “0,6-0,8” e “0,8-1 ‘, respectivamente

doi:. 10.1371 /journal.pone.0029534.s001

(TIF)

Figura S2.

correlação entre a taxa de inclinação e Cohen

d

para o

NC

classificador. As pistas são obtidos a partir de análise de regressão com base na porção linear da curva de confiança-MCC, enquanto Cohen

d

representa a previsibilidade inerente do conjunto de dados

doi:. 10.1371 /journal.pone.0029534.s002

(TIF)

Figura S3.

sobrevida livre de eventos (EFS) curvas para pacientes com diferentes confidências clínicos usando

kNN

onde ‘LC’, ‘MC’, e denotam ‘HC’ ‘confiança baixa (0,6)’, ‘confiança médio (0,8) “e” alta confiança (1) ‘, respectivamente.

doi: 10.1371 /journal.pone.0029534.s003

(TIF)

Figura S4.

Previsão MCC como uma função de confiança clínica durante dez conjuntos de dados usando 80/20 divisão e

kNN

. Dos raios do círculo são dimensionadas para a percentagem do total de amostras no nível de confiança clínica. Os níveis de confiança são ‘0,6’, ‘0.8’ e ‘1’

doi:. 10.1371 /journal.pone.0029534.s004

(TIF)

Figura S5.

correlação entre a taxa de inclinação e Cohen

d

para o

kNN

classificador baseado em 80/20 atribuição de amostra. As pistas são obtidos a partir de análise de regressão com base na porção linear da curva de confiança-MCC, enquanto Cohen

d

representa a previsibilidade inerente do conjunto de dados

doi:. 10.1371 /journal.pone.0029534.s005

(TIF)

Figura S6.

sobrevida global (OS) curvas para pacientes com diferentes confidências clínicos utilizando 80/20 divisão e

kNN

, onde ‘LC’, ‘MC’ e ‘HC’ denotam ‘confiança baixa (0,6)’ , “confiança média (0,8)” e “alta confiança (1) ‘, respectivamente.

doi: 10.1371 /journal.pone.0029534.s006

(TIF)

Figura S7.

sobrevida livre de eventos (EFS) curvas para pacientes com diferentes confidências clínicos utilizando 80/20 divisão e

kNN

, onde ‘LC’, ‘MC’, e denotam ‘HC’ ‘confiança baixa (0,6 ) ‘,’ confiança média (0,8) “e” alta confiança (1) ‘, respectivamente.

doi: 10.1371 /journal.pone.0029534.s007

(TIF)

Tabela S1. desempenho

MCC para treinamento e validação conjuntos

doi:. 10.1371 /journal.pone.0029534.s008

(DOCX)

Tabela S2.

Slope e Cohen

d

para cada conjunto de dados

doi:. 10.1371 /journal.pone.0029534.s009

(DOCX)

Tabela S3.

Percentagem de pacientes em baixa confiança (LC), a confiança média (MC) e regiões de alta confiança (HC)

DOI:. 10.1371 /journal.pone.0029534.s010

(DOCX)

Métodos S1.

Construção da melhor classificador e calcular a correlação entre a confiança clínica e taxa de sobrevivência

doi:. 10.1371 /journal.pone.0029534.s011

(DOC)

Reconhecimentos

os autores gostariam de agradecer aos prestadores MAQC de dados para compartilhar seus dados e informações para o Consórcio MAQC. Os pontos de vista apresentados neste artigo não refletem necessariamente as do U. S. Food and Drug Administration.

Referência

1. Loscalzo J, Kohane I, Barabasi AL (2007) classificação da doença humana na era posgenômico: Uma abordagem de sistemas complexos para pathobiology humano. Mol Biol Syst 3: 124.

Ver artigo

PubMed /NCBI

Google Scholar

2. Holmes E, Wilson ID, Nicholson JK (2008) fenotipagem metabólica na saúde e na doença. Celular 134: 714-717.

Ver artigo

PubMed /NCBI

Google Scholar

3. Abrahams E (2009) Medicina Personalizada Percebendo sua promessa. Genet Eng Biotechnol Notícias 29 (15). Disponível: https://www.genengnews.com/gen-articles/personalized-medicine-realizing-its-promise/3025/. Acesso em: 2012 Jan 2.

Ver artigo

PubMed /NCBI

Google Scholar

4. van’t Veer LJ, Dai HY, van de Vijver MJ, Ele YDD, Hart AAM, et al. (2002) perfil de expressão gênica prevê resultado clínico de câncer de mama. Nature 415: 530-536.

Ver artigo

PubMed /NCBI

Google Scholar

5. van de Vijver MJ, Ele YD, van ‘t Veer LJ, Dai H, Hart AAM, et al. (2002) A assinatura gene-expressão como um preditor de sobrevida no câncer de mama. N Engl J Med 347: 1999-2009.

Ver artigo

PubMed /NCBI

Google Scholar

6. Ayers H, Symmans WF, J Stec, Damokosh AI, Clark E, et al. (2004) perfis de expressão de gene prever a resposta patológica completa ao paclitaxel neoadjuvante e fluorouracilo, doxorubicina, ciclofosfamida e quimioterapia no cancro da mama. J Clin Oncol 22: 2284-2293.

Ver artigo

PubMed /NCBI

Google Scholar

7. Iwao-Koizumi K, Matoba R, Ueno N, Kim SJ, Ando A, et al. (2005) Previsão de resposta docetaxel no cancro da mama humano, perfil de expressão gênica. J Clin Oncol 23: 422-431.

Ver artigo

PubMed /NCBI

Google Scholar

8. Sorlie t, Perou CM, Tibshirani R, Aas t, Geisler S, et al. padrões de expressão (2001) Gene de carcinomas da mama distinguir subclasses tumorais com implicações clínicas. Proc Natl Acad Sci U S A 98: 10869-10874.

Ver artigo

PubMed /NCBI

Google Scholar

9. Sotiriou C, Neo SY, McShane LM, Korn EL, Long PM, et al. classificação do cancro (2003) mama e prognóstico baseado em perfis de expressão gênica de um estudo de base populacional. Proc Natl Acad Sci U S A 100: 10393-10398.

Ver artigo

PubMed /NCBI

Google Scholar

10. Sorlie T, Tibshirani R, Parker J, Hastie T, Marron JS, et al. (2003) a observação repetida de subtipos de tumor de mama em conjuntos de dados de expressão de genes independentes. Proc Natl Acad Sci U S A 100: 8418-8423.

Ver artigo

PubMed /NCBI

Google Scholar

11.

Deixe uma resposta