PLOS ONE: Determinação da Formação mínima Tamanho da amostra para Microarray baseado em resultados Cancer Prediction-An Empirical Assessment

Abstract

A promessa da tecnologia de microarray no fornecimento de classificadores de previsão para estimar resultado câncer foi confirmada por uma série de sucessos demonstráveis. No entanto, a confiabilidade dos resultados de previsão baseia-se fortemente na precisão dos parâmetros estatísticos envolvidos na classificadores. Ele não pode ser estimado com segurança com apenas um pequeno número de amostras de treinamento. Portanto, é de vital importância para determinar o número mínimo de amostras de treinamento e assegurar o valor clínico de microarranjos na previsão resultado câncer. Avaliamos o impacto do tamanho da amostra de treinamento sobre o desempenho do modelo amplamente baseado em 3 conjuntos de dados de microarranjos de câncer em grande escala prestados pela segunda fase do projeto MicroArray Controle de Qualidade (MAQC-II). Uma baseada SSNR (escala de relação sinal-ruído) protocolo foi proposto neste estudo para a formação mínima determinação do tamanho da amostra. resultados de validação externas, baseado no mais 3 conjuntos de dados de câncer confirmou que a abordagem baseada em SSNR não só poderia determinar o número mínimo de amostras de treinamento de forma eficiente, mas também proporcionar uma estratégia valiosa para estimar o desempenho subjacente de classificadores com antecedência. Uma vez traduzidos em aplicações de rotina clínica, o protocolo baseado em SSNR que fornece a grande conveniência na previsão resultado do cancro com base microarray na melhoria da confiabilidade classificador

Citation:. Shao L, Fan X, Cheng N, Wu L, Cheng Y (2013) Determinação da Formação mínima Tamanho da amostra para o resultado Cancer Prediction-uma avaliação empírica Microarray-base. PLoS ONE 8 (7): e68579. doi: 10.1371 /journal.pone.0068579

editor: Cynthia Gibas, Universidade da Carolina do Norte em Charlotte, Estados Unidos da América

Recebido: 24 de setembro de 2012; Aceito: 31 de maio de 2013; Publicação: 05 de julho de 2013

Direitos de autor: © 2013 Shao et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este trabalho foi apoiado pela National Science Foundation da China (30830121, 81173465) e Zhejiang Provincial Natural Science Foundation da China (R2080693) .Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito .

competir interesses:. Os autores declararam que não existem interesses conflitantes

Introdução

Os recentes avanços na tecnologia de gene expressão microarray abriram novas oportunidades para um melhor tratamento de diversas doenças [1], [2], [3]. Uma década de intensa pesquisa sobre desenvolvimento classificadores previsão rendeu um número de sucessos demonstráveis, especialmente a capacidade de prever diferentes respostas em potencial para uma terapia [4]. Por exemplo, ele ajudou com a seleção do tratamento para prolongar o tempo de sobrevida e melhorar a qualidade de vida de pacientes com câncer. A aprovação de MammaPrint ™ pela US Food and Drug Administration (FDA) para o prognóstico do cancro da mama clínica [5] ilustra a promessa da tecnologia de microarrays para facilitar o tratamento médico no futuro.

Mais recentemente, MicroArray Controle de Qualidade Projeto II (MAQC II) estudo [6] confirmado mais uma vez que os modelos de previsão baseados em microarray pode ser utilizado para prever pontos finais clínicos se construídos e utilizados correctamente. No entanto, a confiabilidade dos resultados de previsão se baseou fortemente na precisão dos parâmetros estatísticos envolvidos na classificadores microarray, que não pode ser estimado com segurança a partir de um pequeno número de amostras de treinamento. Por isso, seria ajudar a recolher o maior número de amostras clínicas quanto possível. No entanto, considerando o facto de, relativamente raros, amostras de tecido clínicas pode ser utilizado para perfis de transcrição, é um desafio para estimar um número adequado de amostras de formação suficiente para atingir o poder estatístico significativo.

Vários métodos foram sugeridos para a amostra determinação do tamanho, como a regra de parada [7], o algoritmo de análise de energia [8], a modelagem mistura paramétrico combinado com bootstrapping paramétrico [9], procedimento de classificação sequencial baseado no martingale teorema do limite central [10], o modelo de probabilidade paramétrico – metodologia baseada [11], o Monte Carlo combinada com abordagens de aproximação [12], e o algoritmo baseado em montagem ponderada das curvas de aprendizagem [13], etc. a maioria dos estudos anteriores eram de natureza exploratória, e incidiu sobre as relações entre tamanho da amostra, diferença significativa na média, e poder. É bastante possível que esses métodos para produzir tanto um tamanho de amostra subestimada ou superestimada, se foi usada uma variação específica e diferença significativa na média [14]. Além disso, os modelos e /ou índices utilizados nos métodos acima estatísticos são muito difíceis de implementar em aplicações reais, e só são viáveis ​​quando as amostras de treinamento suficientes são coletados. Dobbin et ai. propôs um método de cálculo do tamanho da amostra com base na mudança vezes padronizada, a prevalência de classe e o número de genes ou características nas matrizes [15]. Embora este método é muito simples em comparação com as abordagens anteriores, que só está adaptado para tratar a posteriori determinação de se o tamanho da amostra é adequada para desenvolver um classificador. Desse modo, algumas questões têm de ser tratadas antes de um método simples e eficiente para o tamanho da amostra a estimativa poderia ser desenvolvido.

No início de 2005, Van Niel et al. indicou que o número necessário de amostras de treino deve ser determinado considerando a complexidade do problema a discriminação [16]. mudança vezes padronizado e prevalência classe proposto por Dobbin et al. são também em alguma extensão correlacionada com a classificação complexidade [15]. Popovici et ai. ainda demonstrado que o desempenho de um predictor genómico é determinada em grande parte, por uma interacção entre o tamanho da amostra e a complexidade de classificação [17]. Em resumo, descobrir a relação entre o tamanho da amostra, o desempenho do modelo e da complexidade de classificação é de grande ajuda no desenvolvimento de um protocolo de planejamento tamanho da amostra user-friendly.

Três conjuntos de dados de microarranjos de grande escala com um total de 10 pontos de extremidade fornecida em [6] MAQC-II foram amplamente avaliados para a relação entre o tamanho da amostra de treinamento e do desempenho dos classificadores de previsão construídos neste estudo. Verificou-se que o tamanho da amostra mínima de formação pode ser estimada a partir da previsibilidade intrínseca de pontos de extremidade, e que propuseram um protocolo de estimativa com base escalonada-SERN. resultados de validação externos usando mais três conjuntos de dados em larga escala confirmou a capacidade deste protocolo. Em comparação com métodos anteriores, o protocolo proposto no presente estudo tem as suas vantagens em três aspectos seguintes: Em primeiro lugar, é mais fácil de aplicar e muito mais eficiente para aplicações clínicas; em segundo lugar, menos informação prévia é necessária e, portanto, custo experimental poderia ser melhor controlada; Por fim, ele orienta o desenho experimental, além da ex post facto estimativa do tamanho da amostra de treinamento.

Materiais e Métodos

Conjuntos de dados

Seis conjuntos de dados de câncer de larga escala têm foram recolhidos neste estudo para fins de validação externos estimativa do tamanho da amostra formação e. A Tabela 1 ilustra um resumo conciso dos conjuntos de dados recolhidos, incluindo as informações sobre o tamanho da amostra e distribuição da amostra

Três conjuntos de dados com 10 parâmetros clínicos -. Câncer de mama (BR), mieloma múltiplo (MM), neuroblastoma (NB), fornecidos em [6] MAQC-II foram selecionados e utilizados neste estudo para avaliar o impacto do tamanho da amostra de treinamento sobre o desempenho do modelo. Para o câncer de mama, os terminais BR-erpos e BR-PCR representam estrogênio receptor status e do sucesso do tratamento envolvendo quimioterapia seguido por ressecção cirúrgica de um tumor, respectivamente. Para o mieloma múltiplo, MM-EFS e MM-OS representar sobrevida livre de eventos e sobrevida global após 730 dias após o tratamento do diagnóstico, enquanto NB-EFS e NB-OS representam o mesmo significado após o tratamento 900 dias pós ou diagnóstico. Além disso, os terminais NB-PC e MM-PC, NB-NC e MM-NC também foram incluídos neste estudo como controles positivos e negativos, respectivamente. O NB-PC e MM-PC foram derivados dos conjuntos de dados NB e MM com os parâmetros indicados por sexo, enquanto endpoints para NB-NC e MM-NC foram gerados aleatoriamente.

Outros três conjuntos de dados, incluindo um não linfoma -hodgkin (NHL) [18] do conjunto de dados e dois conjuntos de dados de cancro da mama (BR2 [19] e BR3 [20]) utilizado em estudos de modelação prognóstico anteriormente publicados, foram utilizados neste estudo para fins de validação externa. NHL está relacionada com a sobrevivência de linfoma não-Hodgkin [18] pacientes, enquanto BR2 e BR3 estão relacionados com o estado do receptor de estrogénio (BR2-erpos) [19] e a sobrevivência livre de metástases de 5 anos (BR3-EFS) [ ,,,0],20] de pacientes com câncer de mama.

para simular a aplicação clínica do mundo real dos estudos genômicos, duas populações independentes de pacientes para cada conjunto de dados criado pelo consórcio MAQC ou pelos pesquisadores originais são mantidas neste estudo como o treinamento e validação conjuntos. No caso de BR2-erpos e BR3-EFS, não havia informação para a divisão da amostra. Assim, todas as amostras foram alocados em formação e validação define aleatoriamente neste estudo. Informações mais detalhadas sobre os conjuntos de dados podem ser encontrados no papel principal do [6] MAQC-II e os seus documentos originais correspondente.

Análise Estatística

As informações detalhadas sobre o desenho do estudo foi ilustrada na Figura 1, informações adicionais sobre o procedimento de construção do modelo está disponível em Métodos S1. Um conjunto de dados com um tamanho específico da amostra foi inicialmente recuperado do treinamento inicial definida como amostras de treinamento novos. Após a construção do modelo a partir das amostras de treinamento recuperadas usando a 5 vezes validação cruzada, o obtido

melhor classificador

foi então aplicado para prever o conjunto de validação original. Para garantir o poder estatístico, tal procedimento foi repetido 100 vezes, resultando em 100 conjuntos diferentes de previsões. O resultado médio de predição foi então utilizado como uma indicação do desempenho do modelo correspondente a este tamanho de amostra específica. O número de amostras de treinamento considerados neste estudo varia de 20 com um passo de 20. Três algoritmos de aprendizado de máquina amplamente utilizados, incluindo

NCentroid

(mais próxima-Centróide),

kNN

(

k

-nearest vizinhos,

k

= 3) e

SVM

(Support Vector Machine) foram selecionados neste estudo para avaliar o impacto do tamanho da amostra de treinamento.

fluxo de trabalho para avaliar o impacto de diferentes números de amostras de treinamento.

com base nos resultados de 100 prazo, a tendência de desempenho do modelo (medida pelo coeficiente de correlação de Matthews (MCC) [21] versus o . avanço gradual de tamanho da amostra de formação está ilustrada pela trama suiça (5-95% percentil) o coeficiente de correlação de Matthews (MCC) é definida como: (1) em que é o número de verdadeiros positivos, é o número de verdadeiros negativos, é a número de falsos positivos e é o número de falsos negativos. MCC varia entre -1 e 1 com 0 a corresponder a previsão aleatória.

com base nos valores da MCC-100 são executados, ainda proposto que uma equação para aproximadamente estimativa o valor potencial de aumentar o tamanho da amostra, que considera tanto a melhoria relativa do desempenho do modelo e o custo do aumento do tamanho da amostra. (2)

Aqui e representam o valor MCC obtido a partir do

i

th e

(i-1)

th tamanho da amostra, enquanto que é o número de amostras de treinamento no

(i-1)

th passo (

i = 2, …, n

). valor muito menor do que 1 foi utilizado neste estudo para auxiliar na determinação do classificador perto do ideal. Em outras palavras, o valor combinado com a média ea variância de valores MCC foi finalmente utilizado para determinar o tamanho de quase-óptimo amostra de treinamento.

Escala de Relação sinal-ruído (SSNR)

conjuntos de dados de microarranjos Suponha

X

1 | (

n

1 | amostras e

p

genes) e

X

2

(

n

2

amostras e

genes p

) foram perfilados a partir de amostras na classe 1 e classe 2, respectivamente. A razão sinal-para-ruído para o

i th

gene (,

i = 1,2, …, p

) reflecte a diferença entre as classes relativas aos desvios padrão (SD) dentro das classes, e pode ser apresentado da seguinte forma [22] 🙁 3)

Aqui e denotam os meios e SDs do registro dos níveis do

i

th expressão (

i = 1,2, …, p

) gene na classe 1 e classe 2, respectivamente. não se limita a [-1, 1], com grandes valores de indicando uma forte correlação entre a expressão do gene e a distinção classe. O sinal de estar corresponde positivos e negativos para o

i

th gene a ser mais altamente expresso na classe 1 ou classe 2. SSNR é a escala numérica para todos os genes (

i = 1,2, … , p

) que representa a diferença numérica entre o maior positiva e os valores menores negativa SNR. Assumindo que representa os vetores de valores de SNR para todos os genes em um conjunto de dados, SSNR poderia ser definida da seguinte forma: (4)

Resultados

Treinamento mínimo Amostra tamanho varia com o Endpoint Previsibilidade

Figura 2 demonstra a tendência do desempenho do modelo contra aumento gradual do tamanho da amostra de treinamento para 10 terminais usando

NCentroid

, com valores correspondentes apresentados na Tabela S1. Duas conclusões podem ser tiradas do estudo. Em primeiro lugar, o tamanho da amostra formação exerceu efeitos aparentes no desempenho do modelo para todos os parâmetros, exceto para os controlos negativos. Em segundo lugar, o número mínimo requerido de amostras de formação varia com a complexidade de diferentes pontos finais. Para terminais altamente previsíveis (NB-PC, MM-PC e BR-erpos) com previsão MCC ao redor ou maior do que 0,8, 60 amostras de treinamento são suficientes para atingir os classificadores de predição quase ideais. Enquanto que para endpoints (NB-EFS, NB-OS, BR-PCR) com desempenho de previsão moderada (MCC entre 0,2 a 0,5), são necessários pelo menos 120 amostras de treinamento. Para terminais dificilmente previsíveis (MM-EFS e MM-OS), modelo de previsão baseado em microarray (MCC em torno de 0,1) geralmente não é uma boa opção neste caso. No caso quando 120 amostras são necessários, não faz sentido para recolher quaisquer mais amostras devido à melhoria insignificante. Para controles negativos (NB-NF e MM-NC), modelos de previsão de falha para todos os tamanhos de amostras de treinamento. Tais resultados excluiu a possibilidade de obtenção de resultados falsos positivos. Figuras S1 e S2 obtidos a partir de

kNN

e

SVM

confirmou os resultados acima.

MCC Prediction baseado em um número diferente de amostras de treinamento para 10 terminais que utilizam

NCentroid

.

SERN se correlaciona bem com Endpoint previsibilidade

os resultados acima mostraram que o tamanho mínimo da amostra formação necessária para a construção do modelo variou com previsibilidade endpoint. Assim, é de vital importância para estimar a complexidade endpoint antes da determinação do número mínimo de amostras de treinamento. Propusemos uma SSNR índice neste estudo, e avaliada a sua capacidade como uma indicação de previsibilidade endpoint. A Figura 3 (a) demonstrou a relação entre SERN e desempenho do modelo com base em todas as amostras de formação usando

NCentroid

. Aqui podemos ver que SSNR se correlaciona bem com o desempenho do modelo (valores MCC), com um coeficiente de correlação de Pearson de 0,897. Como uma confirmação, nós ainda trocou conjuntos de treinamento e validação originais, e reavaliada a correlação entre SSNR e previsibilidade endpoint. A Figura 3 (b) ilustra os resultados correspondentes. A correlação de 0,859 confirmou ainda que SSNR se correlaciona bem com a previsibilidade endpoint. Tal conclusão foi ainda apoiada pela correlação de 0,875 e 0,864 para a

kNN Comprar e 0,887 e 0,901 para a

SVM

classificadores como mostrado na Figura S3.

O relacionamento ex post facto entre os valores SERN e previsibilidade endpoint (previsão MCC) com base em (a) normal e (b) modelagem de swap usando

NCentroid

em todas as amostras de treinamento. Aqui verde (a) e colunas de laranja (b) representam os valores SERN obtidos a partir de conjuntos de treinamento e validação originais, enquanto os retângulos enfrentado amarelo são correspondentes valores previsão MCC de modelos em amostras de validação e de formação originais, respectivamente.

SSNR Guias do Determinação da formação tamanho da amostra

os resultados acima confirmou que SSNR era uma estimativa válida de previsibilidade endpoint e serve como a base do tamanho da amostra formação estimação. No entanto, esses resultados foram baseados em análise ex post facto utilizando todas as amostras de treinamento (muito mais do que 60 ou 120 uns), deixando-a um problema sem solução se SSNR poderia guiar tamanho da amostra formação estimativa em aplicações reais. Assim, avaliamos ainda mais a viabilidade da utilização de SSNR como uma orientação do tamanho da amostra formação estimativa dos seguintes dois aspectos: em primeiro lugar, o valor SSNR foi inspecionado com base em 60 ou 120 amostras de treinamento para ver se ele pode diferenciar com sucesso endpoints com diferentes complexidades de previsão; em segundo lugar, a eficácia da SSNR foi verificado para estimar o tamanho da amostra de treinamento mínimo exigido em aplicações reais utilizando três conjuntos de dados de validação externa.

Foram recuperados aleatoriamente 60 ou 120 amostras do conjunto de treinamento original, classificadores de previsão construídos, previu de validação original conjuntos utilizando o classificador, e os correspondentes valores da MCC SERN e previsão, em seguida, gravadas. Para garantir o poder estatístico, tal procedimento foi repetido 100 vezes, resultando em 100 pares de valores SERN e MCC. A capacidade de SSNR na diferenciação de terminais com diferentes complexidades foi então avaliada a partir de correspondentes meios e desvios-padrão (SDS). Figura 4 (a) demonstrou a relação entre os valores SERN e MCC, utilizando 60 amostras de treinamento com base em

NCentroid

. Podemos ver que SSNR poderia diferenciar com sucesso os primeiros três pontos finais mais simples (SSNR≥2) de outros, enquanto não foi observada nenhuma diferença aparente entre os demais. Excluindo-se os três primeiros pontos finais (NB-PC, MM-PC e BR-erpos), avaliamos ainda mais a relação entre SSNR e MCC para o resto 7 pontos de extremidade usando 120 amostras de treinamento. Como mostrado na Figura 4 (b), os cinco pontos de extremidade com SSNR≥1 (NB-EFS, NB-SO, BR-PCR, MM-EFS e MM-OS) foram separadas com sucesso a partir dos outros dois controlos negativos (SERN 1 ) nesse caso. Portanto, foi confirmado que SSNR poderia orientar a determinação do tamanho da amostra de treinamento eficiente. resultados correspondentes obtidos a partir de

kNN

e

SVM

mostrado na Figura S4 confirmou os resultados acima.

A relação entre valores SERN e endpoint previsibilidade (previsão MCC) com base em (a ) 60 e (b) 120 amostras de treinamento usando

NCentroid

, respectivamente. colunas aqui azuis e barras pretas representam as médias e desvios-padrão dos valores SERN em 100 repetições, enquanto rectângulos amarelos e barras vermelhas são meios e SDs de valores MCC.

Nós ainda proposto um protocolo baseado em SSNR para determinação do tamanho de amostra de treinamento neste estudo. Em primeiro lugar, 60 amostras de treinamento foram coletadas e valor SSNR foi avaliada. Se SSNR é maior do que 2, 60 amostras de treinamento tamanho é grande o suficiente para alcançar um modelo de previsão perto do ideal. Caso contrário, pelo menos, 120 amostras de treinamento foram coletadas e valor SSNR foi avaliada novamente; Se o valor SSNR com base em 120 amostras de treinamento foi maior do que 1, 120 amostras de treinamento são suficientes para a construção do modelo neste momento. Caso contrário, o desempenho do classificador previsão seria considerado como muito pobres.

Três conjuntos de dados de validação externos (BR2-erpos, BR3-EFS e NHL) foram ainda utilizados para confirmar o desempenho do protocolo acima referido em aplicações reais. Para BR2-erpos, o valor SSNR com base em 60 amostras de treinamento (100 repetições) atingiu 2,16 ± 0,38 (maior do que 2), e, portanto, 60 amostras foram suficientes acordo com o protocolo. Para BR3-EFS, os valores SERN com base em 120 amostras de 60 e de formação foram 1,55 ± 0,23 ( 2) e 1,18 ± 0,11 ( 1), respectivamente. Portanto, 120 amostras de formação eram necessários para conseguir um modelo quase-óptimo deste tempo. Para NHL, os valores SERN com base em 120 amostras de 60 e de formação foram de 1,42 ± 0,22 ( 2) e 1,25 ± 0,13 ( 1), respectivamente. Quanto BR3-EFS, pelo menos, 120 amostras de treinamento foram necessários. A Figura 5 (a-c), ilustra o desempenho de classificadores de previsão utilizando amostras de número diferente de formação de conjuntos de dados de validação acima. Ele confirmou os resultados acima mencionados e a capacidade do protocolo de determinação do tamanho da amostra proposto neste estudo.

MCC Prediction baseado em um número diferente de amostras de treinamento para três conjuntos de dados de validação externa.

discussão

Os dados Microarray demonstrou excelente superioridade em ajudar o cancro resultado de estimativa, fornecendo classificadores de previsão. A confiabilidade do modelo baseia-se fortemente na precisão dos parâmetros estatísticos estimados a partir de amostras de treinamento. Um pequeno número de amostras de formação não pode fornecer um classificador predição altamente fiável. Portanto, a determinação do número mínimo de amostras de treinamento torna-se uma questão vital para a aplicação clínica de microarrays. A maioria dos métodos atuais são demasiado complexas para ser utilizado para aplicação de rotina. Por isso, propusemos uma abordagem simples baseada em SSNR para a determinação do tamanho da amostra de treinamento neste estudo e ilustrado sua utilidade baseada em três conjuntos de dados de microarranjos de grande escala previstos no MAQC-II. Os resultados sobre três conjuntos de validação externos confirmou que o protocolo baseado em SSNR era muito mais fácil de implementar e mais eficiente para a estimativa do tamanho da amostra em comparação com métodos estatísticos atuais.

Três conclusões importantes Note-se neste estudo. Em primeiro lugar, pode observar-se na Figura 2 que o número de amostras de formação exercida impacto evidente no desempenho do modelo, e o número mínimo de amostras de treino requeridas para a construção de modelos variados com previsibilidade de extremidade. Em segundo lugar, o valor SERN correlaciona-se bem com previsibilidade de extremidade com um coeficiente de correlação de cerca de 0,9 (Figura 3), o que implica a possibilidade de utilizar SERN como uma indicação de previsibilidade de extremidade. Em terceiro lugar, uma função gradual baseado em SSNR foi proposto neste estudo para determinar o número mínimo de amostras de treinamento baseado na relação entre o tamanho da amostra de treinamento, a previsibilidade endpoint, eo valor SSNR. A relação discreta entre o tamanho da amostra de treinamento ea complexidade de endpoints também foi implicado por Mukherjee et al. no início de 2003 [23], um maior apoio à abordagem determinação baseada em SSNR proposto neste estudo. Além disso, verificou-se que a abordagem proposta também pode ser estendido com sucesso para toxicogenómica (ver Figura S5).

Um aspecto importante deste estudo é que a confiança dos resultados acima mencionados, também foi confirmado por ambas as estratégias de validação interna e externa . Para a validação interna, duas positivas (NB-PC, MM-PC) e dois controle negativo (NB-NC, MM-NC) conjuntos de dados foram essenciais para avaliar o desempenho de endpoints clinicamente relevantes em relação ao desempenho mínimo máximo teórico e fornecido pelos controles . Especificamente, os valores SERN muito mais elevados para dois conjuntos de dados de controle positivas mostradas na Figura 4 (a) confirmou a capacidade de utilizar SERN como uma indicação de previsibilidade ponto de extremidade, enquanto o impacto insignificante do tamanho da amostra de formação sobre o desempenho do modelo em dois conjuntos de dados de controlo negativo mais se opõe a possibilidade de obtenção de resultados falsos positivos. Assim, incluindo conjuntos de dados de controlo positivas e negativas em tais análises seria de grande ajuda para garantir a confiabilidade dos resultados finais. Além disso, a confiabilidade de um processo de formação só pode ser verificado por amostras de validação externa. Portanto, os conjuntos de dados de validação externas, juntamente com controles internos têm desempenhado um papel importante na confirmando a capacidade de abordagem determinação do tamanho da amostra de treinamento baseado em SSNR neste estudo.

Os resultados similares obtidos a partir de três métodos de classificação bem conhecidos utilizados em neste estudo (ou seja,

NCentroid

,

kNN e SVM

, com resultados correspondentes previstas na Figura 2 e Figura S1 e S2, respectivamente) confirmou ainda mais a confiabilidade do tamanho da amostra formação estimativa baseada-SSNR abordagem. A razão está fora do âmbito do presente estudo. No entanto, este fenómeno está em conformidade com a ausência de diferenças significativas entre um grande número de métodos de classificação relatados para aplicações de microarray em termos de desempenho de previsão [24]. Uma conclusão semelhante também foi proposta por [6] MAQC-II. Tais resultados impediria a restrição de diferentes algoritmos de classificação, e ampliar ainda mais a aplicabilidade da abordagem de determinação do tamanho da amostra de treinamento baseado em SSNR.

A superioridade ea aplicabilidade da abordagem baseada em SSNR pode ser resumido como se segue. Em primeiro lugar, a partir de um ponto de vista estatístico, não foi influenciada por procedimentos de dedução, evitando cálculos estatísticos sofisticados. Em segundo lugar, no que respeita a aplicações de rotina clínica, é muito mais simples e eficiente, como os únicos requisitos estão a recolher 60 e /ou 120 amostras e calcular valores SERN correspondentes. No entanto, o protocolo baseado em SERN também pode fornecer uma estratégia terapêutica valiosa para estimar o desempenho de classificadores com antecedência. Tomando conjuntos de dados de validação externa mostrado na Figura 5, como exemplo, os valores SERN sendo 2,16 ± 0,38 e 1,18 ± 0,11 para BR2-erpos e BR3-EFS também implicou que o desempenho dos classificadores de previsão finais, neste caso, seria excelente, e moderada , respectivamente.

Conclusões

a tecnologia Microarray combinado com reconhecimento de padrões tem sido demonstrada como uma estratégia promissora no fornecimento de classificadores de predição para o diagnóstico de câncer, prognóstico e resposta ao tratamento estimação e assim por diante. Em comparação com o diagnóstico tradicional baseado em experiência depender de testes complexos bioquímicos e sistemas de imagem diversos, classificadores de predição baseada em microarrays, se confiantemente construídos a partir de amostras de treinamento suficientes, proporcionaria um muito mais objetivo, preciso e representação válida de resultados do cancro. Consequentemente, a amostra de treinamento abordagem determinação do tamanho baseada em SSNR que fornece a grande conveniência para a aplicação clínica de microarrays na avaliação dos resultados de câncer, fornecendo uma maneira simples e pragmática de estimar o tamanho da amostra de treinamento. Além disso, o fato de que os impactos de tamanho de amostra de treinamento do desempenho de classificadores de previsão finais implicou ainda a importância de uma avaliação sistemática de cada procedimento no processo de construção do modelo e desenvolvimento de orientações práticas para análise de comparação de classe baseada em microarray.

Informações de Apoio

Figura S1.

Uma figura adicional para o impacto do tamanho da amostra de treinamento usando

kNN

. Previsão MCC com base em um número diferente de amostras de treinamento para 10 terminais usando

kNN

doi:. 10.1371 /journal.pone.0068579.s001

(TIF)

Figura S2.

Uma figura adicional para o impacto do tamanho da amostra de treinamento usando

SVM

. Previsão MCC com base em um número diferente de amostras de treinamento para 10 terminais usando

SVM

doi:. 10.1371 /journal.pone.0068579.s002

(TIF)

Figura S3.

Uma figura adicional para a relação entre SSNR e previsibilidade endpoint baseado em todas as amostras de treinamento. A relação facto ex post entre os valores SERN e endpoint previsibilidade (previsão MCC) com base na modelagem normal e troca usando

kNN

e

SVM

em todas as amostras de treinamento

doi:. 10.1371 /journal .pone.0068579.s003

(TIF)

Figura S4.

Uma figura adicional para a relação entre SSNR e previsibilidade endpoint baseado em 60 e 120 amostras de treinamento. A relação entre os valores SERN e previsibilidade endpoint (previsão MCC) com base em (a) 60 e (b) 120 amostras de treinamento usando

kNN

e

SVM

, respectivamente

doi:. 10.1371 /journal.pone.0068579.s004

(TIF)

Figura S5.

Uma figura adicional para o impacto do tamanho da amostra de treinamento para dataset toxicogenómicas NIEHS

doi:. 10.1371 /journal.pone.0068579.s005

(TIF)

Tabela S1.

Os valores correspondentes v para o tamanho diferente amostra de treinamento de 10 terminais usando

NCentroid

doi:. 10.1371 /journal.pone.0068579.s006

(DOCX)

Métodos S1 ..

doi: 10.1371 /journal.pone.0068579.s007

(DOC)

Reconhecimentos

os autores gostariam de agradecer aos provedores de dados para compartilhar seus dados e informações para o MAQC Consortium.

Deixe uma resposta