PLOS ONE: Um Modelo Ensemble prognóstico para câncer colorretal

Abstract

O câncer colorretal podem ser agrupados em estágios Dukes A, B, C e D com base em seus desenvolvimentos. De um modo geral, os pacientes mais avançados têm pior prognóstico. Para integrar sistemas de previsão fase de progressão com sistemas de previsão de recorrência, propusemos um modelo de prognóstico conjunto para o cancro colorectal. Neste modelo, cada paciente foi atribuído um máximo possível de palco e um máximo possível de status recorrência. Se um paciente foi previsto para ser paciente recorrência em estágio avançado, ele iria ser classificados em grupo de alto risco. O modelo de conjunto consideradas ambas as fases de progressão e status de recorrência. pacientes de alto risco e pacientes de baixo risco previstos pelo modelo conjunto tinha uma doença diferente sobrevida livre significativa (-rank teste log valor-p, 0,0016) e doença sobrevida específica (teste de valor-p-rank de log, 0,0041). O modelo de conjunto pode distinguir melhor o alto risco e pacientes de baixo risco do que o modelo de previsão palco eo modelo de previsão de recorrência sozinho. Este método pode ser aplicado para os estudos de outras doenças e pode melhorar significativamente o desempenho de previsão por ensembling informações heterogénea

citação:. Li BQ, Huang T, Zhang J, Zhang N, Huang GH, Liu G, et ai. (2013) Um prognóstico Modelo Ensemble para o cancro colorectal. PLoS ONE 8 (5): e63494. doi: 10.1371 /journal.pone.0063494

editor: Jie Zheng, da Universidade de Akron, Estados Unidos da América

Recebido: 04 de fevereiro de 2013; Aceito: 03 de abril de 2013; Publicado em: 02 de maio de 2013

Direitos de autor: © 2013 Li et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este trabalho foi apoiada por doações do Programa Nacional de Pesquisa básica da China (2011CB510102, 2011CB510101), Programa de Inovação de Shanghai Comissão Municipal de Educação (12ZZ087) e a concessão de “a Disciplina de primeira classe de Universidades em Xangai.” os financiadores não tiveram nenhum papel na desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

Conflito de interesses:.. os autores declararam que não existem interesses conflitantes

Introdução

o câncer colorretal (CRC) é um dos cancros mais malignas. A sua ocorrência e progressão envolvem processo evolutivo complicado afectado por vários genes [1]. Na América e na Europa, CRC é o segundo câncer mais frequente que leva à classificação morte abaixo câncer de pulmão [2]. A detecção precoce de CRC pode reduzir a morbidade e melhorar o prognóstico [3].

CRC podem ser agrupados em Dukes A, B, C, D e os estágios com base nos seus desenvolvimentos [4]. carcinomas A Dukes ‘são aqueles confinado à camada mais interna do cólon ou do recto sem invasora nos tecidos extrarectal e sem metástases em linfonodos. carcinomas B Dukes ‘são aqueles que invadiram a musculatura do cólon ou do recto, mas ainda não têm envolvido o sistema linfático. Carcinomas de Dukes ‘C se espalharam para pelo menos um linfonodo regional. Enquanto carcinomas de Dukes ‘D ter metástase para algum outro lugar do corpo, como o fígado ou do pulmão [4]. Em 1954, estágios Dukes B e C foram subdivididos em B1, B2 e C1, C2 pela Astler americanos e Coller [5]. Tipo carcinomas B1 foram aqueles em que as lesões invadiram na muscular própria com nós negativos, mas sem penetrar completamente. Enquanto tipo carcinomas B2 foram aqueles em que as lesões tenham penetrado na muscular própria com nós negativos. Carcinomas do tipo C1 invadiram na muscular própria com linfonodos positivos, mas não penetrou. Enquanto as de tipo C2 ter penetrado através muscular própria com linfonodos positivos. Concebidas mais de 70 anos atrás, sistema de estadiamento do Dukes agora modificado “fornece informação prognóstica adequada para os pacientes da fase A ou D. No entanto, os estágios intermediários B e C não são tão útil em discriminar pacientes bons prognósticos de pobres [6].

até agora, a análise de microarray foi usada em vários estudos em amostras de tumor primário para identificar a expressão gênica assinaturas preditivo da CRC prognóstico [6], [7]. A abordagem geral para a descoberta de assinatura foi analisar pacientes selecionados para bons e maus resultados, seguido de avaliação da assinatura em casos adicionais. No entanto, a descoberta de assinatura baseada em resultados é geralmente confundidos em doentes submetidos a tratamento adjuvante. Portanto, é difícil distinguir marcadores de prognóstico dos de resposta terapia de [6], [7].

tem sido relatado que as diferenças de expressão entre as fases extremas de cancro poderia ser utilizada para prever a recorrência em pacientes de fases intermédias. As vantagens desta abordagem são que não há dados de acompanhamento é exigido na descoberta baseada estágio do tumor e que o efeito de confusão da terapia anterior pode ser evitado selecionando pacientes que não foram submetidos a tratamento adjuvante [8].

Neste estudo, combinando os sistemas de previsão do estágio de progressão e os sistemas de previsão de recorrência, propusemos um modelo de prognóstico conjunto para CRC. pacientes de alto risco e pacientes de baixo risco previstos pelo modelo conjunto tiveram uma sobrevida diferente significativa sobrevida livre de doença e doença específica. O desempenho do modelo conjunto era melhor do que a do modelo de previsão de palco e modelo de previsão de recorrência sozinho.

Materiais e Métodos

Conjunto de Dados

perfis de diferentes estágios CRC expressão génica .

perfis de 290 pacientes de CRC de expressão gênica foram recuperados do NCBI Gene Expression Omnibus (GEO) (número de acesso: GSE14333), em que 44 pacientes pertenciam ao estágio Dukes a, 94 para a fase B, 91 para a fase C e 61 para o estágio D, respectivamente. Os perfis de expressão foram determinados com Affymetrix Human Genome U133Plus matrizes 2,0 interrogar 19621 genes.

perfis de expressão gênica de pacientes com e sem recorrência.

perfis de expressão gênica de 77 pacientes de CRC com recorrência e 121 CRC pacientes sem recorrência foram recuperados do GEO (número de acesso: GSE12032). Os pacientes com e sem recorrência foram indicados como 1 e 0, respectivamente. Os perfis de expressão foram determinados com AceGene Oligo Humano Chip 30K 1 Chip Versão interrogar 10583 genes.

perfis de expressão gênica de pacientes com tempo de sobrevivência.

perfis de expressão gênica de 176 pacientes de CRC com livre de doença sobrevivência (DFS) e sobrevida específica da doença (DSS) foram recuperados do GEO (número de acesso: GSE17538). Os perfis de expressão foram determinados com Affymetrix Human Genome U133 mais 2,0 Matriz interrogar 20068 genes.

Estes três conjuntos de dados contidos totalmente 644 pacientes com CCR interrogar 10166 genes comuns. Todos os conjuntos de dados foram quantil normalizada com o pacote “affy” de R para posterior análise [9].

método mrmr

Foi utilizado o método mínima redundância máxima relevância (mrmr) para classificar a importância de as características [10]. O método mrmr ocupa características tanto de acordo com a sua relevância para o alvo e a redundância entre as características. Uma característica ranking com um menor índice indica que ele tem uma melhor trade-off entre a relevância máxima para o alvo e redundância mínimo.

Ambos relevância e redundância foram quantificados por informação mútua (MI), que estima a extensão para que um vector se relaciona com outro. O MI é definido como:. (1), onde são vetores, é a sua densidade probabilística conjunta e e são as densidades de probabilidade marginais

Suponha que denota todo o conjunto de recursos, denota o conjunto de recursos já selecionada contendo

recursos m

e denota o conjunto de recursos a-ser-selecionados contendo

n

recursos. A relevância entre um recurso e o alvo pode ser calculado pela fórmula: (2)

O redundancybetween o recurso e todos os recursos pode ser calculado por: (3)

Para determinar o apresentam-se com a relevância máximo e um mínimo de redundância, a função mrmr combina equação (2) e a equação (3) e é definido como: (4)

a avaliação recurso mrmr continuará

N

rodadas dado um conjunto de recursos com

N

(

N

=

m

+

n

) características. Após a avaliação recurso mrmr, uma característica SETIS obtido: (5) onde o índice

h

de cada recurso indica em que rodada o recurso está selecionado. Quanto menor o índice de

h

, quanto mais cedo a equação satisfaz recurso (4) e melhor o recurso é.

vizinho mais próximo Algorithm (NNA)

Neste estudo, o vizinho mais próximo Algoritmo (NNA), que tem sido amplamente utilizada em bioinformática e biologia computacional [3], [11], [12], [13], [14], foi adoptada para prever a classe de amostras de tecidos colo-rectais. Nós considerado cada amostra, como um vector com os valores de genes como seus componentes de expressão. NNA calcula semelhanças entre cada duas amostras e faz sua decisão de classificação. Em nosso estudo, a distância entre dois samplesandis definidos como a seguir: (6) onde é o módulo de amostra. indica o produto interno de e. Quanto menor o seja, os mais similares as duas amostras são

Em NNA, dada uma amostra setand uma amostra, será designado para a mesma classe de seu vizinho mais próximo, em, que é a amostra que tenha o menor.: (7)

Cinco vezes Cross-validação do método

Cinco vezes validação cruzada foi muitas vezes utilizado para avaliar o desempenho de um classificador [15]. Em cinco vezes validação cruzada, todas as amostras no conjunto de dados são primeiro divididos igualmente em cinco partes. Posteriormente, cada parte é, por sua vez utilizado para testes e os restantes 4-peças para o treinamento. Assim, cada amostra é testada exatamente uma vez

Para avaliar o desempenho do preditor para os estágios de CRC, a precisão total (ACC) de previsão é calculado a seguir:. (8), onde representa o número de pacientes corretamente classificados para o

i

estágio do câncer -ésimo, e representa o número total de pacientes.

para avaliar o desempenho do preditor de recorrência, a precisão da previsão, especificidade, sensibilidade e MCC (correlação Matthews coeficiente) foram calculados por: (9) onde

TP

,

TN

,

FP

,

FN

identificar o número de verdadeiros positivos, verdadeiros negativos , falsos positivos e falsos negativos, respectivamente.

Seleção de recursos incremental (IFS)

com base nas características classificados obtidos pelo método mrmr, foi utilizado o IFS [16], [17], [18], a abordagem [19] para determinar as características óptimas. Durante o procedimento de IFS, recursos na lista de recursos classificados foram adicionados com um passo a passo de recursos como de maior rank. Um novo conjunto de recursos foi construído quando outro recursos foram adicionados. Totalmente apresentam conjuntos foram compostas a partir das

N

características classificados. O

i

conjunto de recursos -ésima é: (10) onde

N

denota o número total de recursos no conjunto de dados original e

l

é o número de recursos adicionais no cada etapa, o que é um número inteiro positivo. Neste estudo, definimos. Para cada um dos [

N

/

l

] conjuntos de recursos, um classificador NNA foi construído e analisado usando a validação cruzada cinco vezes no conjunto de dados de referência. Uma tabela IFS foi obtido com uma coluna para o índice

i

e as outras colunas para o desempenho de previsão. O conjunto de recursos ideal () foi selecionado, com o qual o preditor produziu o melhor desempenho de previsão.

Quatro diferentes critérios para avaliar o risco

Neste estudo, foram propostas 4 critérios diferentes para avaliar o risco de pacientes de CRC. Na primeira proposta, os pacientes da fase B com recidiva, assim como os da fase C e D independentemente estado recorrência foram considerados de alto risco, enquanto que todos os outros pacientes foram considerados como de baixo risco. Na segunda proposta, foram consideradas apenas estágios do câncer. Os pacientes da fase A foram designados como de baixo risco, enquanto aqueles de fase B, C e D como de alto risco. Na terceira proposta, os pacientes da fase A e B foram considerados como de baixo risco, enquanto aqueles de fase C e D eram de alto risco. Na última proposta, somente as informações de recorrência foi utilizada. Pacientes com recidiva foram considerados como de alto risco, enquanto os pacientes sem recidiva foram considerados de baixo risco. Posteriormente, foi empregado Kaplan-Meier [20] para avaliar a importância de sobrevida livre de doença e sobrevida específica da doença entre os grupos de alto e baixo risco.

Resultados

Modelo para prever estágios CRC

Depois de executar o software mrmr, obtivemos duas tabelas (ver S1 Arquivo). Uma foi chamado MaxRel tabela de classificação dos genes de acordo com a sua relevância para os estágios de amostras. O outro foi chamado recurso de tabela mrmr listando os genes com a relevância máximo e um mínimo de redundância para as fases de amostras.

Com base nas saídas de mrmr, construímos 500 subconjuntos de recursos de acordo com Eq.10. Um preditor NNA para cada subconjunto foi modelado de modo correspondente, o qual foi, em seguida, avaliados por cinco vezes de validação cruzada. O número de recursos utilizados em cada preditor foi 1,2,3, …, tal como descrito na secção Materiais e Métodos. O resultado IFS pode ser encontrada em Informações de Apoio S2. Mostrado na Fig. 1 é a curva IFS traçados com base em Informações de Apoio S2. O eixo x é o número de genes utilizados para a classificação, e o eixo y é a precisão de previsão dos preditores vizinhos mais próximos avaliadas por cinco vezes de validação cruzada. A precisão máxima atingida quando 0,4759 25 genes foram utilizados. Estes 25 genes foram considerados como os biomarcadores ideais para a predição de estágios de CRC (ver os 25 genes na “Tabela mrmr” de S1 Arquivo).

As curvas IFS foram desenhados com base nos dados em arquivo S2 . A precisão global previsão atingiu o auge quando o número de genes foi 25. Os 25 genes assim obtidos foram utilizados para compor o conjunto de genes ideal para o preditor estágio CRC.

modelo de previsão do CRC recorrência

da mesma forma, usando o método mrmr, nós também obtidos tabelas MaxRel e mrmr para predição de recorrência CRC (ver S3 Arquivo). Com base nestas duas tabelas, a 500 subconjuntos de recursos foram construídos de acordo com Eq.10. Um preditor NNA foi modelado para cada subconjunto e foi avaliada por cinco vezes validação cruzada. Mostrado na Fig. 2 é a curva IFS plotado com base nos dados de Informações de Apoio S4. O eixo x é o número de genes utilizados para a classificação, e o eixo y representa os valores da MCC de classificadores avaliadas por cinco vezes de validação cruzada. O MCC foi máxima quando 0,6926 110 genes foram utilizados. Com tal classificador, a sensibilidade previsão, especificidade e acurácia foram 0,8182, 0,8760 e 0,8535, respectivamente. Estes 110 genes eram considerados os biomarcadores ideais para a predição de CRC recorrência (veja o topo 110 genes na “Tabela mrmr” do S3 Arquivo).

As curvas IFS foram desenhados com base nos dados em arquivo S4 . O MCC atingiu o auge quando o número de genes foi 110. Os 110 genes assim obtidos foram utilizados para compor o conjunto de genes ideal para a recorrência preditor CRC.

Comparando o tempo de sobrevivência de quatro critérios diferentes para avaliar risco

Foram utilizados os dois modelos acima mencionados para prever estágios do câncer e status recorrência de pacientes com tempos de sobrevivência. Estes pacientes foram divididos em grupos de alto risco e de baixo risco, de acordo com os quatro critérios diferentes. Os tempos de sobrevivência de pacientes para as quatro propostas foram comparados.

De acordo com a primeira proposta, houve uma diferença significativa na sobrevida livre de doença (DFS) tempo (teste logrank, valor p = 0,0016) e doença sobrevivência específica (DSS) tempo (teste de logrank, p-valor = 0,0041) entre grupos de alto risco e de baixo risco (Tabela 1 e Figura 3). Para a segunda proposta, também há uma diferença significativa em DFS (teste de logrank, p-valor = 0,0021) e DSS (teste de logrank, p-valor = 0,0055) entre grupos de alto e baixo risco. No entanto, não é tão significativo como o da primeira proposta (Tabela 1). Para a terceira proposta, a diferença no DFS (teste de logrank, p-valor = 0,3313) e DSS (teste de logrank, p-valor = 0,2556) não foi significativa entre os grupos de alto e baixo risco (Tabela 1). De acordo com a última proposta, a diferença no DFS (teste de logrank, p-valor = 0,5525) e DSS (teste de logrank, p-valor = 0,5606) entre os doentes de alto e baixo risco não foi significativa, quer (Tabela 1).

(A) doença de sobrevida livre (-rank log teste, valor p = 0,0016). sobrevida específica (B) Doenças (-rank log de teste, p = 0,0041).

Discussão

25 CRC relacionadas estágio genes candidatos

neste estudo, foram identificados 25 genes candidatos que podem ser usados ​​para distinguir pacientes com CCR de diferentes fases (ver o top 25 genes na “Tabela mrmr” de S1 Arquivo). Alguns dos genes já foram relatados para ser relacionada com a CRC. Abaixo, vamos discutir brevemente as suas relações com CRC

ZC3H12A (zinco dedo CCCH tipo contendo 12A), é um MCP1 (CCL2; MIM 158105). Proteína induzida por que age como um ativador da transcrição e provoca a morte celular de cardiomiócitos, possivelmente através de indução de genes associados com apoptose. células de tumor do cólon Recentemente, ZC3H12A tem sido identificada como um dos genes regulados positivamente em S100A8 /A9-activados, cujos produtos promovem o recrutamento de leucócitos, a angiogénese, a migração do tumor, cicatrização de feridas e formação de nichos premetastatic em órgãos metastáticos distal [21].

CADPS codifica uma citosólica romance neural /específicas do sistema endócrino e proteína de membrana periférica necessária para o Ca

2 + exocitose -regulated de vesículas secretoras. Recentemente, foi detectada CADPS para abrigar p.R722W mutação e p.R787 * no carcinoma do cólon [22]. Além disso, este gene foi relatado um aumento da expressão em células de ovário em comparação com omento em 47 amostras analisadas por micromatriz [23].

FZD8 (frizzled-8) é um membro da família do gene frizzled, que são receptores transmembranares de transdução sinais de Wnt com base no preferentemente de forma dependente do ligando para a endocitose mediada por caveolin- ou clatrina [24], [25]. A via de sinalização Wnt tem sido bem documentada para ser relacionada com CRC [26], [27], [28]. Além disso, recentemente FZD8 tem sido proposto para ser um alvo terapêutico putativo no cancro do pulmão humano [29]. Além disso, tem sido mostrado que Frizzled-10, um membro da família de genes rizzled, é sobre-regulada em CRC primário, e é um regulador positivo da via de sinalização Wnt-beta-catenina-TCF [30].

CAV3 (caveolin 3), bem como caveolina-1, -2 são as principais proteínas de caveolae, as invaginações vesicular da membrana plasmática. Estudos sugeriram que caveolinas desempenhou um papel importante na sinalização celular e, possivelmente, na tumorigénese [31]. Recentemente, Caveolina-1, como um membro da família caveolin, tem sido relatado para actuar como uma proteína anti-apoptótica em células de cancro de cólon por ligação a Ku70 e inibir a morte celular Bax-dependente [32]. Além disso, foi demonstrado que a perda de Caveolina-3 pode induzir um microambiente lactogênica que é protector contra a formação de tumor mamário [33].

PACS2 (phosphofurin agrupamento acídico triagem proteína 2) tem sido relatada a ser necessário para apoptose eficiente de linhas celulares colorrectais. PACS-2 é um efetor TRAIL essencial, necessário para matar células cancerígenas do cólon in vitro e viralmente hepatócitos infectados in vivo [34], [35].

SOX11 codifica um membro da família HMG-box relacionados com o SRY de factores de transcrição envolvidos na regulação do desenvolvimento embrionário e na determinação do destino das células. Expressão de Sox4 Sox11 e foi demonstrado que o aumento em muitos tipos diferentes de cancros humanos, incluindo os carcinomas de células basais (BCC) e meduloblastoma. Os carcinomas podem atacar diversos locais no corpo humano, incluindo fígado, próstata, ovário, pulmão, e cólon. Além disso, a sobre-expressão altamente específica do factor de transcrição SOX11 foi detectada em gliomas malignos humanos [36]. Além disso, a expressão SOX11 correlaciona a metilação do promotor e regula o crescimento do tumor em malignidades hematopoiéticas [37].

PRKCDBP codifica uma proteína de ligação da proteína cinase C, delta (PRKCD). PRKCDBP é um supressor tumoral pró-apoptótica que é comumente alteradas em CRC por hipermetilação do promotor, e a sua transcrição do gene é activada directamente por NF-kB em resposta a TNF, o que sugere que PRKCDBP inactivação pode contribuir para a progressão do tumor, reduzindo a sensibilidade celular para TNFa e outras salienta, em particular no âmbito microambiente inflamatório crônico [38].

110 CRC recorrência genes candidatos relacionados

neste estudo, identificamos 110 genes candidatos que podem ser usados ​​para prever CRC recorrência (ver o topo 110 genes na “Tabela mrmr” do S3 arquivo). Alguns dos genes têm sido relatados para ser relacionada com a CRC. Abaixo, vamos discutir brevemente as suas relações com CRC.

SLC26A2 codifica uma proteína pertencente à família portadora de soluto. O transportador de sulfato de displasia diastrófica é uma glicoproteína transmembranar implicada na patogénese de várias condrodisplasias humanos. SLC26A2 foi detectada a ser reprimidos em biópsias de câncer de cólon em comparação com o tecido normal circundante [39]. Além disso, os níveis de SLC26A2 e ARNm SLC6A14 têm sido utilizados como parte de um painel de sete genes produzindo taxas de previsão correcta, a sensibilidade e especificidade mais elevada do que com os índices de diagnóstico anteriormente disponíveis para a colite ulcerativa, doença de Crohn e síndroma do intestino irritável [40] .

SLPI (leucócito secretório inibidor da peptidase) codifica um inibidor secretado que protege os tecidos epiteliais de proteases de serina. Maior expressão SplI transcrição foi detectada em muitas linhas celulares de cancro, incluindo os do ovário, renais e o carcinoma do cólon, utilizando análise de expressão RTQ-PCR [41]. Além disso, uma hipótese tem sido proposto que um anticorpo monoclonal totalmente humano, que neutraliza a actividade de protease do SLPI pode ser terapeuticamente útil para o carcinoma do ovário e do cólon [41].

CLEC4M codifica um receptor transmembranar e é muitas vezes referida como L -sign por causa da sua expressão nas células endoteliais dos gânglios linfáticos e do fígado. CLEC4M tem sido identificada como um dos genes que expresso diferencialmente no cancro do cólon espécimes metástases hepáticas do paciente e a sua xenoenxerto [42]. Além disso, CLEC4M significativamente diferencialmente expressos em tecido da mama maligno contra não-maligno [43].

ISCU codifica as duas formas isoméricas, e ISCU1 ISCU2, da proteína de cluster andaime Fe-S, que são necessários para várias enzimas mitocondriais e outras proteínas dos compartimentos subcelulares. Demonstrou-se que a localização extra-mitocondrial de frataxin e sua associação com ISCU1 desempenhar um papel fundamental na diferenciação de enterócitos do tipo de linha celular humana de adenocarcinoma do cólon de Caco-2 [44]. Além disso, pela segmentação ISCU, miR-210 diminui a actividade das enzimas do ciclo e a função mitocondrial de Kreb, contribui para o aumento da geração de radicais livres em hipóxia, aumenta a sobrevivência das células em condições de hipoxia, induz uma mudança para a glicólise em ambos normóxia e hipóxia, e regula positivamente a absorção do ferro necessário para o crescimento celular. Notavelmente, a análise de mais de 900 doentes com diferentes tipos de tumor, incluindo cancro da mama, mostrou que a supressão da ISCU foi correlacionada com um prognóstico pior [45].

PanK2 codifica uma proteína que pertence à família da cinase e pantotenato é o único membro desta família a ser expressa nas mitocôndrias. Tem sido relatado que a perda de um subconjunto de quinases incluindo PanK2 resultou na diminuição da transcrição β-gato-dependente em células de carcinoma do cólon, representando potenciais genes terapêuticos segmentáveis ​​[46].

A proteína-proteína de interacção entre a etapa referente genes e genes relacionados com recorrência

Nós mapeou os 25 relacionados estágio genes e os genes relacionados 110 recorrência a rede de interação proteína-proteína construída com base em dados de STRING [47]. A partir da Fig. 4, pode ser visto que as ligações estreitas existentes entre palco e genes relacionados com recorrência. Tem sido demonstrado que a RB1CC1 gene relacionado fase (RB1-indutível coiled-coil 1) pode suprimir a progressão do ciclo celular e inibir a proliferação através da activação do promotor e expressão de RB1 gene relacionado recorrência no cancro humano [48], [49], [ ,,,0],50]. Além disso, a interação entre esses dois genes também foi envolvido no prognóstico de pacientes com câncer. Tem sido relatado que RB1CC1 juntamente com RB1 e p53 desempenham papéis importantes na sobrevivência a longo prazo de doentes com cancro da mama japoneses [51]. Além disso, Paun et ai. revelaram RB1CC1 como um novo alvo de mutações frequentes e sobre-regulação aberrante no MSI-H (alto nível de instabilidade de microssatélites) CRC [52]. Portanto, é plausível supor que a interação entre estes dois genes também está implicada na tumorigénese eo prognóstico da CRC. Além disso, a interação entre ZC3H12A gene relacionado palco e relacionados recorrência TANK gene também foi apoiado por uma grande escala de estudo de interação proteína-proteína [53]. No geral, as interações entre esses genes candidatos pode explicar a etiologia da CRC e influenciar o prognóstico.

retângulos redondos amarelos representam genes relacionados palco enquanto elipses vermelhas representam genes relacionados recorrência. 20 dos 25 genes relacionados com estágio e 61 dos 110 genes relacionados recorrência foram apresentados.

Prospect do nosso método

Nos antigos modelos de prognóstico, sem recorrência foi considerada equivalente de baixo risco. No entanto, do nosso ponto de vista, o prognóstico dos pacientes com CCR avançado de estágio C ou D poderia ser pior, embora eles foram previstos para se repitam. Pelo contrário, os pacientes da fase A pode sobreviver qualquer maneira que eles foram preditos a recorrer. Portanto, em nosso estudo, foi proposto um critério novo para avaliar o nível de risco, em que os pacientes previu a recorrer em estágio B, bem como pacientes de estágio C e D estatuto recorrência independentemente foram considerados de alto risco. Todos os outros pacientes foram considerados como de baixo risco. Revelou-se que o tempo de sobrevivência entre os pacientes de alto e baixo risco avaliadas por este critério foi mais significativa do que o derivado de apenas ser considerado o estado de recorrência tumorais ou fases.

Pode ser visto que, quando considerando apenas tumorais fases, os diferença de o tempo de sobrevivência na segunda proposta foi significativo, mas não era o caso no terceiro. A razão pode ser que a classificação exata de pacientes em intermédios-estágios continua a ser problemática. Eschrich et ai. têm demonstrado que as curvas de sobrevivência agrupadas por fases B e C, tanto Dukes ‘pode ser ainda subdividido em bons e maus prognósticos grupos (Ref Fig. 2) [6]. É por isso que a diferença de tempo de sobrevivência foi significativa quando apenas os pacientes da fase A foram designados como de baixo risco.

No geral, a primeira proposta superou os outros três porque integrado estágios do câncer e status recorrência, em vez de considerar apenas um deles. Este método pode ser aplicado para os estudos de outras doenças e pode melhorar significativamente o desempenho de previsão por ensembling informações heterogénea.

Informações de Suporte ficheiro

S1. resultado

mrmr para CRC modelo de previsão palco. Este arquivo contém duas folhas. O primeiro deles é a tabela recurso a MaxRel, que classificou os 500 melhores genes de acordo com a relevância entre as características e classe das amostras. A segunda é a tabela recurso a mrmr, que classificou estes 500 genes de acordo com os critérios de redundância e relevância

doi:. 10.1371 /journal.pone.0063494.s001

(XLSX)

arquivo S2. .

A precisão da previsão para cada estágio do tumor e precisão geral previsão para todas as fases de tumor em cada corrida de IFS

doi: 10.1371 /journal.pone.0063494.s002

(XLSX)

S3 arquivo. resultado

mrmr para CRC modelo de previsão de recorrência. Este arquivo contém duas folhas. O primeiro deles é a tabela recurso a MaxRel, que classificou os 500 melhores genes de acordo com a relevância entre as características e classe das amostras. A segunda é a tabela recurso a mrmr, que classificou estes 500 genes de acordo com os critérios de redundância e relevância

doi:. 10.1371 /journal.pone.0063494.s003

(XLSX)

arquivo S4.

A sensibilidade (Sn), especificidade (SP), precisão (Ac), coeficiente de correlação de Matthews (MCC) de cada execução da IFS para CRC modelo de previsão de recorrência

doi:. 10.1371 /journal.pone.0063494.s004

(XLSX)

Reconhecimentos

os autores gostariam de agradecer ao editor por ter tempo para editar esse papel. Os autores também gostaria de agradecer aos dois revisores anônimos por seus comentários construtivos, que eram muito útil para o fortalecimento da apresentação deste estudo.

Deixe uma resposta