PLOS ONE: valor clínico de assinaturas de expressão de genes prognóstico no câncer colorretal: A Systematic Review

Abstract

Introdução

O sistema de teste tradicional é insuficiente para identificar os pacientes com câncer colo-retal II fase ( CRC) com alto risco de recorrência ou com a fase III CRC de baixo risco. Um número de expressão do gene de assinaturas para prever CRC prognóstico têm sido propostos, mas nenhum é habitualmente utilizado na clínica. O objetivo deste trabalho foi avaliar a capacidade de previsão e potencial utilidade clínica destas assinaturas em uma série de conjuntos de dados independentes.

Métodos

A revisão da literatura identificou 31 assinaturas de expressão gênica que usaram a expressão do gene dados para prever o prognóstico em tecido CRC. A pesquisa foi baseada em banco de dados PubMed e foi restrita a artigos publicados entre janeiro de 2004 a dezembro de 2011. Onze CRC conjuntos de dados de expressão de genes com informação de desfecho foram identificados e baixados de repositórios públicos. classificador Floresta aleatório foi utilizada para construir as listas de preditores de genes. Matthews coeficiente de correlação foi escolhido como uma medida da precisão da classificação e seu p-valor associado foi usado para avaliar associação com prognóstico. Para avaliação utilidade clínica, pós-testes probabilidades positivos e negativos foram computadas no estágio II e III amostras.

Resultados

Cinco assinaturas genéticas mostraram associação significativa com o prognóstico e desde precisão da previsão razoável no seu próprio conjuntos de dados de treinamento. No entanto, todas as assinaturas mostrou baixa reprodutibilidade em dados independentes. análises estratificadas por situação palco ou instabilidade de microssatélites mostraram associação significativa, mas a capacidade de discriminação limitado, especialmente em estágio tumores II. Do ponto de vista clínico, as assinaturas mais preditivos mostrou uma melhoria menor, mas significativa sobre o sistema de estadiamento clássica.

Conclusões

As assinaturas publicados mostram baixa precisão da previsão, mas utilidade clínica moderada. Embora os dados de expressão de genes pode informar prognóstico, melhores estratégias para a validação da assinatura são necessários para incentivar a sua utilização generalizada na clínica

Citation:. Sanz-Pamplona R, Berenguer A, Cordero D, Riccadonna S, Solé X, Crous -Bou M, et al. (2012) valor clínico de assinaturas de expressão de genes prognóstico no câncer colorretal: uma revisão sistemática. PLoS ONE 7 (11): e48877. doi: 10.1371 /journal.pone.0048877

editor: Wayne A. Phillips, Peter MacCallum Cancer Centre, Austrália |

Recebido: 30 de maio de 2012; Aceito: 02 de outubro de 2012; Publicação: 07 de novembro de 2012

Direitos de autor: © 2012 Sanz-Pamplona et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este estudo foi apoiada pela Comissão Europeia conceder FP7-COOP-Saúde-2007-B HiPerDART. Também as bolsas Instituto de Salud Carlos III (FIS PI08 /1635, FIS PI08 /1359 e FIS PI09-01037), CIBERESP CB07 /02/2005, a Associação Espanhola Contra o Câncer (AECC) Foundation Scientific, eo catalão Governo DURSI concessão 2009SGR1489 . Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

o câncer colorretal (CRC) é o terceiro câncer mais comum no mundo e a segunda principal causa de morte por câncer. Durante as últimas décadas, a incidência tem vindo a aumentar, enquanto a mortalidade lentamente tem vindo a diminuir [1]. Uma característica notável do CRC é a diferença no prognóstico dos estágios precoces e tardios da doença: a fase I e II têm risco moderado de recaída após a ressecção cirúrgica, enquanto os pacientes com estágio III têm uma maior probabilidade de recorrência [2]. fatores de risco clínicos reconhecidos para recorrência são apresentação de emergência, tumor pouco diferenciado, profundidade de invasão do tumor e envolvimento de órgãos adjacentes (T4) [3] – [5]. No entanto, esses fatores são insuficientes para identificar os pacientes com estágio II CRC em alto risco de recorrência e metástase posterior ou aqueles pacientes com estágio III CRC de baixo risco [6], levando a potencial sub-tratamento ou excesso de tratamento [3].

metástase do câncer de cólon é um processo rigidamente controlado que requer aberrações na expressão dos genes que permitem as células cancerosas para progredir através de várias etapas até que colonizar um órgão distante [7]. Provavelmente, as alterações necessárias para a recorrência já estão presentes no carcinoma do cólon primário, o que deve permitir identificar assinaturas prognósticos [8] – [10]. ensaios baseados em perfis de expressão genética têm sido bem sucedidas como ferramenta de prognóstico no câncer de mama [11], [12]. No entanto, nenhuma assinatura foi adotado na prática clínica de rotina no CRC, apesar de um grande número de perfil de expressão gênica estudos sobre prognóstico têm sido realizados.

O objetivo deste trabalho foi testar a capacidade preditiva desses assinaturas publicados como marcadores prognósticos em um número significativo de conjuntos de dados independentes, a fim de compreender os seus pontos fortes e fracos e identificar se algum deles pode ser usado clinicamente para orientar as decisões sobre a terapia adjuvante para pacientes com estágio II ou III CRC.

Materiais e Métodos

Publicado Assinaturas e expressão gênica de validação conjuntos de dados

Uma revisão sistemática da literatura foi realizada para identificar estudos que utilizaram dados de expressão de genes para predizer o prognóstico no CRC [13]. A pesquisa foi baseada em banco de dados PubMed e foi restrita a artigos recentes para aumentar a validade (de janeiro de 2004 a dezembro de 2011). Arquivos de S1-S2, Tabela S1 e Figura 1 detalhe o protocolo de seleção e lista de verificação PRISM. Os artigos que forneceram uma lista de genes diferencialmente expressos em amostras de tumores primários associados com CRC prognóstico foram incluídos em nosso estudo. Nós indistintamente se referir a essas listas de genes como “assinaturas” ou “perfis”. Estudos baseados em tissue microarray e os que exclusivamente se concentraram sobre as diferenças entre os estágios ou entre tumor primário e as metástases foram excluídos. Os estudos finalmente incluídas para análise estão descritos na Tabela 1 [14] – [43]. Publicamente conjuntos de dados disponíveis com todo o genoma medidas de expressão de genes em amostras de tumor primário CRC foram identificados e baixados da GEO [44] e ArrayExpress [45] repositórios de dados microarray (Tabelas 2 e 3). Pré-processados ​​matrizes da série originalmente fornecidas pelos autores foram usados ​​em nossa análise.

Porque plataformas e identificadores de recursos diferentes foram usados ​​em assinaturas e conjuntos de dados de expressão gênica, uma tradução para o símbolo oficial Gene foi feito de modo a ter uma anotação comum. Esta tradução foi realizada utilizando o banco de dados Universal anotação Resource Protein [46], o repositório online de Comité de Nomenclatura Gene HUGO [47] e os arquivos de anotação de chips no site da Affymetrix [48]. Inevitavelmente, nenhuma correspondência foi encontrada para algumas características em alguns conjuntos de dados e eles foram perdidos para posterior análise (S3 Arquivo).

Análise Estatística

Desde o tempo de acompanhamento não estava disponível para a maior parte do conjuntos de dados, um resultado binário foi definida como um estado prognóstico (Tabela 2). Sempre que possível, foi necessário um mínimo de três anos de acompanhamento para pacientes sem recorrência do tumor. No entanto, dois conjuntos de dados sem informações de acompanhamento foram incluídos (GSE5206 e GSE10402) para aumentar o tamanho da amostra. Estágio IV indivíduos foram incluídos na análise, como eventos de recorrência como era esperado que as mudanças de expressão específicos em amostras de mau prognóstico permanecem inalterados no tumor primário uma vez que as metástases ocorreu. Quando estava disponível de dados, análise de subgrupo foram realizadas de acordo com palco e microssatélites estado de instabilidade (MSS /MSI).

a capacidade de cada assinatura para predizer o prognóstico foi testado de forma independente em cada conjunto de dados com uma abordagem de classificação binária utilizando o

Aleatório Floresta

classificador conjunto (RF) [49], [50]. Florestas foram cultivadas com um elevado número de árvores (5.000), a fim de assegurar a convergência de erro fora-de-saco. O tamanho mínimo dos nós terminais foi ajustado para um. Para avaliação assinaturas, medidas de precisão, foram calculados a partir de um processo de 10 vezes de validação cruzada (10CV), no qual as partições foram estratificados com base no resultado. Nested neste processo, o número de variáveis ​​candidatos em cada grupo foi seleccionado para minimizar o erro fora-de-saco. Como sugerido em [51], de sub-amostragem foi levada a cabo sem substituição e usando o mesmo número de observações em cada grupo de prognóstico (0,632 vezes menor frequência do grupo). Devido à falta de equilíbrio em grupos de resultado, em alguns conjuntos de dados, RF mostrou uma tendência para classificar preferência para o grupo mais freqüente. Para corrigir esse artefato, o corte de classificação de votação foi modificado de acordo com as frequências do grupo prognóstico correspondentes. Todas estas análises foram realizadas com o pacote de R Floresta aleatória [52].

Para confirmar nossos resultados, um kernel Apoio radial Vector Machine (SVM) classificador com base também foi utilizado [53], [54]. Devido ao desequilíbrio, o mesmo artefato descrito acima foi observada quando se aplica o classificador SVM padrão. Então, nós tentamos corrigi-lo usando uma estratégia sub-amostragem da seguinte forma [55]: i) selecionar todas as amostras do grupo menos frequente; ii) seleccionar aleatoriamente o mesmo número de amostras a partir do grupo mais frequente; III) repetir o processo 25 vezes; iv) definir os rótulos prevista utilizando as frequências do grupo resultado como corte voto proporcional para a regra de classificação. Um processo de 10CV foi realizado para calcular medidas de precisão com um 10CV aninhada para ajuste de parâmetros, ambos estratificada por grupos de resultados. Uma vasta gama de valores para o custo e os parâmetros do kernel radiais foram avaliados durante o processo de ajuste (20 valores equidistantes de 0,001 a 1,000 em escala logarítmica; 11 valores equidistantes que variam de 0,05 ×

p

20 ×

p

, sendo

p

o número de recursos em cada caso). Todas estas análises foram realizadas com o pacote de R

svmpath

[56].

O Coeficiente de Correlação Matthews (MCC) [57] foi escolhido como medida de precisão da classificação [58]. Este índice combina a sensibilidade do teste e especificidade. Ele varia de -1 a 1 e sua interpretação é similar ao coeficiente de correlação de Pearson. No contexto de um problema de classificação espera-se que o MCC varia de 0 (sem capacidade de predição de todo) a um (a predição perfeita) com valores próximos de zero negativos que ocorrem possivelmente em classificadores aleatórias devido à variabilidade da amostra. MCC valores inferiores a 0,3 pode ser considerado como indicativo de baixo valor preditivo como eles correspondem a precisão inferior a 65%, em dados balanceados. Sensibilidade, especificidade e precisão geral taxas também foram computados para fins de interpretação.

A utilidade potencial das assinaturas na prática clínica foi avaliada por meio das razões de probabilidade positivas e negativas (LR +, LR) eo previu positiva e probabilidades negativas pós-teste de recorrência (PPTpr, NPTpr) em estágio II e III amostras separadamente [59].

para resumir o desempenho global da assinatura, cada uma das medidas acima foi reunido através de conjuntos de dados para um índice exclusivo usando pesos proporcional ao tamanho da amostra de cada conjunto de dados. A fim de atenuar a instabilidade e viés nas estimativas de validação cruzada, conjuntos de dados com menos de 10 amostras por grupo e os utilizados na derivação do perfil no estudo original foram excluídos destes cálculos [60].

significado do MCC, precisão, sensibilidade, especificidade, LR +, LR, e as diferenças de PPTpr e NPTpr foram avaliados através de distribuições nulos com base em 100.000 permutações. Cálculos foram feitos no contexto do quadro teórico para testes de permutação [61] como implementados no pacote de R

coin

[62]. Intervalos a 95% foram construídos utilizando a polarização Corrigida e método bootstrap Acelerada (BCA) com 5.000 resamples estratificados por grupo prognóstico [63]. valores influenciam empíricos foram estimados pelo método de canivete habitual. Estes cálculos foram feitos utilizando o pacote de R

boot

[64]. Em todos os casos, permutações e reamostragem foram realizadas directamente sobre os valores previstos previstas pelos modelos originais e não foi feito remodelação. Uma vez que esta estratégia não leva em conta a relação nas previsões impostas implicitamente pelo 10CV, ele poderia manter alguma tendência para recusar hipótese nula nos testes estatísticos quando os efeitos são pequenos [65].

Resultados

global Desempenho Prognosis do Publicado assinaturas

a pesquisa bibliográfica identificou 29 trabalhos relatando 31 assinaturas proposta ferramenta de classificação tumor-resultado multi-gene como válidos (Tabela 1 e S4 arquivo). Quase todas as assinaturas foram baseadas em experiências microarray, com excepção de três assinaturas obtidas a partir de experiências de PCR (

OC10, PL10, SC09

). O número de genes (tamanho da assinatura) variou de 3 a 537.

Apesar das recomendações para fornecer dados brutos para experimentos de microarranjos, conjuntos de dados de treinamento foram publicamente disponível apenas para cinco assinaturas:

ST09, SM09, BD07, LN07 de viajantes e

Vl10

. Seis conjuntos de dados de expressão de genes adicionais com informações sobre a recorrência foram identificadas no GEO e ArrayExpress, para um total de 11 conjuntos de dados disponíveis para análise (Tabela 2).

Para todas as combinações de assinaturas e conjuntos de dados, o MCC e o p correspondente -valor foi calculado. A Figura 2 mostra um mapa de cores de valores de MCC (detalhes fornecidos no ficheiro S5 e Figura S1). Como esperado, os cinco assinaturas para que o treinamento estava disponível mostrou associação significativa e uma precisão da previsão razoável em seus conjuntos de dados de treinamento (células destacou-pretas no quadrante superior esquerdo na trama na Figura 2). Por todas estas assinaturas, os valores da MCC foram superiores a 0,35, exceto para

Vl10 Comprar e conjunto de dados GSE17536 (MCC = 0,32). No entanto, nos conjuntos de dados independentes o desempenho foi heterogênea e nenhuma dessas cinco assinaturas poderia reproduzir o grau de capacidade preditiva mostrado nos conjuntos de dados de treinamento. Quando as 26 assinaturas restantes (aqueles sem formação disponível ajustado) foram avaliados nos 11 conjuntos de dados, foram obtidos resultados semelhantes: algumas assinaturas mostrou uma associação significativa com o desfecho do paciente, mas a precisão discriminação era baixa ou moderada

As linhas correspondem. assinaturas e colunas para conjuntos de dados. Última coluna mostra uma MCC partilhados com conjuntos de dados usando o tamanho da amostra como pesos. linhas pretas delimitar as cinco primeiras assinaturas para que os conjuntos de dados de treinamento foram disponíveis (células destacadas em preto). Células representando assinaturas e conjuntos de dados usados ​​para validá-los são destacadas em azul. escala de cores representa os valores da MCC: quanto mais escura a cor, maior MCC (ver a legenda). Os valores negativos foram recolhidas para zero.

A MCC mundial foi calculado para cada assinatura para resumir sua capacidade preditiva em toda conjuntos de dados (veja a Figura 2). Assinaturas

BT04

e

KN11

emergiu como o mais preditivo, ambos com um valor MCC de 0,25 (95% CI 0,19-0,31 e 0,19-0,30, respectivamente, os valores de p 10

5). Embora quase todas as assinaturas atingiram o nível de significância de 5% nessa estimativa piscina que combina 396 eventos em 1077 pacientes, apenas três assinaturas exceder um 0.20 MCC global. O valor máximo obtido para a proporção de casos corretamente classificados foi de apenas 63% (

BT04,

sensibilidade = 65% e especificidade = 61%) e variou de 52 a 61% para os perfis restantes (Tabela 4, arquivo S6).

Para avaliar a influência da metodologia estatística nos resultados, uma re-análise foi realizada utilizando um método alternativo (SVM). Embora tenham sido observadas algumas variações nas assinaturas ranking de desempenho, resultados semelhantes foram obtidos em termos de pool CCMs (Figura S2 e S7 arquivo)

Subgrupo Análise:. Prognosis Desempenho de assinaturas Publicado estratificada por Palco ou MSI Estado

a fim de avaliar o desempenho dos assinaturas em subgrupos específicos de tumores, uma análise estratificada foi feito de acordo com a fase (fase II /estágio III) eo estado instabilidade de microssatélites (MSS /MSI), quando essa informação estava disponível ( ver Tabela 3). Foram excluídos os conjuntos de dados que contribuem com menos de 10 eventos.

À semelhança da análise incluindo todas as amostras, o desempenho das assinaturas foi heterogênea quando o estágio II e III amostras de tumor foram analisados ​​separadamente (Figuras S3 e S4) . No MCC reunidas, 17 assinaturas na fase II e 22 assinaturas em fase III mostrou uma associação significativa com o prognóstico (p 0,05). Seis assinaturas classificados entre os dez primeiros em ambas as sub-análises. Os valores MCC obtidos na fase II eram muito mais baixos do que aqueles em estágio III. Na fase II, a MCC melhor globais foram alcançados pela

YM06

(MCC = 0,21; IC 95% 0,11-0,31) e

BT04

(MCC = 0,20; IC 95% 0,10-0,31) . Na fase III, os dois melhores assinaturas foram

AJ08

(MCC = 0,42; IC 95% 0,28-0,55) e

Vl10

(MCC = 0,40; IC 95% 0,23-0,55). Tabela 4, Arquivos S5, S6 e S7; e as figuras S3, S4, S5, S6, S7 e S8 conter mais detalhes.

informações de status

MSI estava disponível apenas por dois conjuntos de dados (GSE13294 e GSE18088). Na análise de amostras de MSS, esses valores MCC que atingiram significância foram moderadas (,19-,38) e apenas três assinaturas mostrou associação em ambos os conjuntos de dados (valor-p 0,1). Em relação ao subconjunto MSI, apenas a assinatura

HO09

forneceu uma precisão razoável de classificação (MCC = 0,30) (S5 Arquivo).

valor clínico potencial de assinaturas na Fase II e III Tumores

Apesar da capacidade de discriminação de baixo (mostrada pela sua MCC reunidas), as assinaturas poderia ainda ter utilidade na prática clínica. Resumidamente, um teste clínico útil mostra tipicamente grandes LR + e baixa LR que se traduzem em mais discriminantes pós-teste probabilidades de eventos: alta PPTpr e baixo NPTpr comparação com o

a priori

proporção evento esperado. Assim, até mesmo os testes com baixa capacidade de discriminação de acordo com critérios estatísticos puros ainda poderia ser útil na prática clínica se PPTpr e NPTpr são significativamente longe o suficiente da probabilidade esperada na população quando nenhum teste é realizado. Para explorar esta questão, probabilidades pós-teste positivos e negativos da recorrência foram calculados para as fases II e III. O risco de recorrência antes em pacientes com CRC foi assumida como 20% na fase II e 34% em estágio III [4], [66].

Para a melhor assinatura em estágio II (

YM06

), a probabilidade de recorrência pós-teste para o grupo de alto risco aumentado para 28%, e para o grupo de baixo risco, a previsão era de 12% de probabilidade de recorrência (16% de diferença absoluta, Figura 3A). O melhor perfil no estágio III (

AJ08

) aumentou para 56% a probabilidade pós-teste de recidiva para o grupo de alto risco, enquanto que a probabilidade pós-teste foi de 18% para o grupo de baixo risco (38 % diferença absoluta, Figura 3B). Os resultados detalhados para todas as assinaturas são mostrados em arquivos S6 e S7.

foram assumidas probabilidade Prevalência de recorrência para a fase II e III de ser 20 e 34%, respectivamente. As assinaturas são listados em ordem de pós-testes diferenças de probabilidade diminuindo.

Discussão

A identificação de ferramentas moleculares prognósticos para facilitar as decisões de tratamento é um passo importante para a terapia individualizada paciente [10] . Aqui nós relatamos uma análise exaustiva das publicada multi-genes classificadores prognósticos em câncer colorretal, analisando a sua validade externa em um grande número de conjuntos de dados independentes que totalizam mais de 1.000 pacientes. O presente trabalho é focado em dois objetivos que são abordados pelas duas partes principais da análise: avaliar o desempenho global das assinaturas a partir de um ponto de vista estatístico, no qual foram incluídas todas as fases, e avaliar a sua utilidade clínica potencial, restrito a fase II e III pacientes CRC, através de medidas de precisão adequados (probabilidades pós-teste).

Uma meta-análise de perfis de expressão gênica em estágio II CRC foi previamente relatada por Lu

et al.

[67]. Nesse estudo, resultados promissores foram relatados em relação à precisão de previsão, mas a análise limitou-se aos mesmos conjuntos de dados e previsões utilizadas nos estudos originais. Para nosso conhecimento, nosso estudo é a primeira meta-análise em que precisão da previsão de muitas assinaturas é medida em um grande número de amostras de CRC independentes para avaliar a validade externa e sua utilidade posteriormente potencial em clínicas.

Em termos de desempenho global, nossos resultados indicam que no seu conjunto de dados de treinamento, a maioria das assinaturas mostrou uma associação significativa com o prognóstico e pode razoavelmente prever o resultado. No entanto, nenhuma das assinaturas realizada satisfatoriamente quando a capacidade de previsão foi avaliada em conjuntos de dados independentes. O MCC melhor agrupados foi de 0,25 (

BT04

), que deve ser considerado um valor de classificação baixa. Como referência, o estágio proporciona uma MCC de 0,23 (dados não mostrados).

A seguir, destacamos o desempenho específico de assinaturas na fase II e III pacientes, que poderiam se beneficiar mais de uma previsão de prognóstico exato porque quimioterapia adjuvante poderia ser adaptado para o risco de recorrência previsto. Embora tenha sido observada associação com a evolução de 17 assinaturas na fase II, a sua capacidade preditiva só pode ser considerada pobre do ponto de vista estatístico. Caso contrário, os valores da MCC em fase III foram observados para estar perto de double aqueles em estágio II. No entanto, apenas oito assinaturas alcançado um valor MCC 0,30 reunidas, considerado como indicativo do valor preditivo moderado.

Embora maus resultados foram observados em termos de precisão de classificação, quase todos os perfis (30) mostrou uma associação significativa com o prognóstico quando testado em conjuntos de dados independentes (p-valor 0,05). Repare no entanto que a associação significativa apenas significa que uma predição assinatura não é totalmente aleatória (MCC = 0). Associação não é suficiente para ser útil, uma vez, com tamanho de amostra suficiente, pequenos efeitos podem ser significativos. Melhores indicadores de utilidade potencial do que um significado estão magnitude da sensibilidade e especificidade ou medidas derivadas como os rácios de MCC ou a probabilidade, que medem a capacidade de classificar corretamente os pacientes pelo seu resultado.

Apesar destes resultados decepcionantes de acordo com a estatística pura critérios da capacidade de discriminação, as assinaturas ainda pode ser útil na prática clínica se eles fornecem estratificação de risco adicional dentro de sub-populações conhecidas definidos por variáveis ​​clínicas relevantes. As probabilidades pós-teste positivos e negativos da recorrência foram calculados estratificada por palco para identificar o grau de discriminação prognóstico para além palco. Os resultados para o melhor assinatura em fase de amostras II (

YM06

) moderadamente modificado a 20% a probabilidade de recorrência convento a um 28% e 12% para o resultado pós-teste positivo e negativo, respectivamente. Esta capacidade de discriminação não é totalmente satisfatório, dadas as grandes taxas de falsos negativos e positivos que iria induzir, mas pode contribuir para a identificação da fase II, pacientes com alto risco de recorrência levando a uma melhor indicação da quimioterapia adjuvante [6]. A melhor assinatura para pacientes em estágio III (

AJ08

) resultou em uma discriminação maior de grupos de risco, com uma diferença entre probabilidades pós-teste positivo e negativo de 38%. No entanto, o grupo de baixo risco ainda mostraram uma recorrência relativamente grande probabilidade de 18%, muito alta para recomendar evitando quimioterapia adjuvante tal como é indicado nos dias de hoje.

explicações possíveis para estes resultados modestos deve ser considerada. De um ponto de vista estatístico, problemas técnicos, como o tamanho reduzido da amostra, o número de genes incluídos no classificador, tradução entre plataformas ou heterogeneidade de coorte, entre outros, têm sido relatados como possíveis explicações para a falta de tradução clínica de classificadores genômicos ( ver referências [68], [69], [70]). No nosso caso e para algumas assinaturas, única associação com o prognóstico foi relatado na obra original, assim, os autores reconheceram implicitamente a capacidade de classificação pobres. Nesses perfis que foram relatados para ser altamente discriminativo, a razão pode ser um pobre controle de excesso de montagem na metodologia de formação, uma vez que a validação externa foi realizada apenas em três estudos e os tamanhos de amostras de teste foram pequenos (

JG08

,

WN10 Comprar e

YM06

, ver Tabela 1). A necessidade de mapear as sondas para os genes para as assinaturas que utilizaram diferentes plataformas também podem ter afetado os resultados, uma vez que é sabido que até mesmo várias sondas do mesmo gene na mesma plataforma pode mostrar variabilidade importante. Não foi possível detectar, no entanto, que a plataforma teve um efeito relevante nas estimativas da MCC.

Baixa disponibilidade de informação e heterogeneidade nos dados clínicos é inerente ao uso de conjuntos de dados públicos e este é um grande impedimento para a repetibilidade e integração de estudos de microarranjos publicados [71]. Conjuntos de dados diferem em características dos pacientes, critérios de inclusão e definições de resultados. Uma definição precisa e homogénea do resultado através de conjuntos de dados seria desejável, a fim de se obter uma estimativa exacta da capacidade prognóstico das assinaturas. No entanto, a heterogeneidade de conjuntos de dados permite uma análise mais pragmática e as estimativas devem refletir os resultados esperados quando os perfis foram usados ​​na prática real, uma vez ambientes hospitalares também são heterogêneos. Desde diferentes resultados devem ser altamente correlacionados [72], decidimos priorizar uma disponibilidade mínima tamanho da amostra para obter estimativas mais precisas e evitar a incerteza introduzida por conjuntos de dados com menos de 10 eventos [60]. A exigência de um período de três anos no mínimo seguimento também permitiu maximizar o tamanho da amostra e foi suportada pela literatura: que tem sido descrito que a maioria destes recidivas ocorrem no prazo de 3 anos após a cirurgia e é recomendado para ser utilizado como ponto final nos ensaios clínicos adjuvantes [ ,,,0],73]. regime de terapia seguido por pacientes tratados não foi considerada, já que esta informação não estava disponível para a maioria dos conjuntos de dados analisados.

Os pacientes diagnosticados no estágio IV foram incluídos e considerados eventos recorrentes para avaliar o desempenho global. Isso pressupõe implicitamente que as alterações moleculares que jogam um papel condutor a recidiva da doença permanecem inalterados no tumor primário após o retorno ocorreu. Embora esta hipótese subjacente poderia ser questionável, foi compartilhada por muitos dos estudos originais analisados, que incluiu temas estágio IV em seus conjuntos de dados de treinamento e teste (

AJ08

,

BT04

,

EC05

,

HO09

,

JS09 ​​

,

LN07G

,

LN07NZ

,

PL10

,

SC09

,

SL10

,

SM09

,

ST09

,

Vl10

e

YM06

).

De ponto de vista biológico, esta capacidade prognóstico moderada poderia ser explicada pela heterogeneidade em populações de células tumorais, que pode diluir o sinal molecular prognóstico. É bem conhecido que os tumores de CRC são compostos não apenas por células tumorais epiteliais, mas também por fibroblastos associados ao cancro do estroma (FAC), células endoteliais ou células inflamatórias, entre outros [74]. Além disso, essas células cancerosas na frente invasiva são diferentes daqueles na massa do tumor principal [75]. O problema da heterogeneidade massa tumoral pode ser superado através do isolamento de populações de células específicas pela tecnologia de laser microdissecação [76]. A este respeito, uma das onze conjuntos de amostras utilizadas neste estudo (GSE12945) utilizada esta técnica para hibridar especificamente ARN a partir de células tumorais. espécimes cirúrgicos de outros conjuntos de amostras foram analisadas por um patologista para avaliar o teor mínimo de tumor de 80% (GSE5206, GSE18088, E-MEXP-1245). No entanto, não foram observadas diferenças significativas no desempenho assinaturas sobre o método de enriquecimento de células de tumor utilizado

As listas de genes incluídos neste estudo tinham pouca sobreposição:. De 1.530 genes relatados nos 31 perfis, apenas dois foram compartilhado por quatro assinaturas; 10 foram compartilhados por três assinaturas e 102 estavam presentes em dois perfis. Este resultado não foi inesperado, uma vez que tenha sido previamente relatada [77], [78]. A falta de sobreposição gene é geralmente interpretado como se cada assinatura é amostragem aleatória de um pequeno subconjunto de genes de uma assinatura maior que representam os caminhos envolvidos [79], [80].

cólon e reto tumores têm sido incluídos indiscriminadamente neste trabalho uma vez em um relatório anterior que mostrou que não existem diferenças significativas entre os tumores de cólon e reto a nível transcriptomic [81]. No entanto, esta decisão pode explicar parte do mau desempenho das assinaturas, pois é sabido que a qualidade da cirurgia é um importante fator prognóstico no câncer de reto e menos importante no cólon [82]. Nos dados utilizados neste trabalho, não houve associação significativa foi encontrada entre prognóstico e localização do tumor (dados não mostrados).

A escolha das ferramentas estatísticas para análise era um assunto importante. A intenção desta análise foi para testar o desempenho de assinaturas prognósticos publicados em conjuntos de dados independentes ao invés de tentar reproduzi-los usando a metodologia original. Neste contexto,

Aleatório Floresta

surge como um método eficiente que um desempenho muito bom em comparação com outros concorrentes [49], [83]. Como esperado, as assinaturas ensaiadas no seu conjunto de dados de treino mostraram a mais alta precisão. Além disso, conseguimos reproduzir os resultados de validação de três dos cinco assinaturas para os quais havia dados disponíveis (

SM09

,

Vl10

e

JS09 ​​

). No entanto, a associação com o prognóstico não foi observado para o perfil

ST09

no conjunto de dados GSE12945, e isso só foi observada em um dos três conjuntos de dados de validação independentes que estão incluídos neste trabalho para o perfil de

SL10

, apesar de bom desempenho foi originalmente relatado (ver Tabela 1, Figura 2 e S5 arquivo). A razão pode ser que a metodologia que usamos não capta bem o valor prognóstico de algumas assinaturas, que podem ter sido desenvolvidos com algoritmos mais elaborados para definir a predição de risco no estudo original. Porque esta era uma limitação reconhecida deste trabalho, as análises foram refeitas utilizando um método alternativo (SVM), que forneceu resultados semelhantes (Figuras S2, S5 e S6, S7 arquivo). Em

ST09

perfil, foi utilizada uma abordagem semi-supervisionado, enquanto em

SL10

foi aplicada uma abordagem mais próxima-centróide que não foi adequadamente descrito no documento.

SL10

foi desenvolvido em uma plataforma Agilent eo mapeamento das sondas para diferentes plataformas de validação utilizado na conjuntos de dados pode ser uma fonte de adição de divergência.

Embora alguns trabalhos relataram que os métodos mais simples para supervisionado

Deixe uma resposta