PLOS ONE: Descoberta de uma assinatura Immune novo gene com Valor Prognóstico profunda no câncer colorretal: Um Modelo de cooperatividade Desorientação criado no processo de desenvolvimento para o cancro

Abstract

genes relacionados à resposta imune desempenham um papel importante na carcinogênese colorretal mediando inflamação ou imuno-vigilância evasão. Embora um progresso notável foi feito para investigar o mecanismo subjacente, a compreensão do processo de carcinogênese complicada foi enormemente prejudicada pela heterogeneidade do tumor em grande escala. Desenvolvimento ea quota carcinogênese semelhanças marcantes em seu comportamento celular e mecanismos moleculares subjacentes. A associação entre o desenvolvimento embrionário e carcinogênese faz o desenvolvimento embrionário um modelo de referência viável para estudar o cancro, assim, contornar a complexidade potencialmente enganosa de heterogeneidade tumor. Aqui nós propôs que os genes imunológicos, responsáveis ​​pela desorientação cooperatividade intra-imune (definida neste estudo como rompimento de padrões de correlação expressão de desenvolvimento durante a carcinogênese), provavelmente contêm recursos de prognóstico inexplorado de câncer colorretal. Neste estudo, foi determinado o perfil de expressão de ARNm de 137 amostras de biópsias humanas, incluindo amostras de diferentes fases de desenvolvimento humano do cólon, colo-rectal e pré-cancerosas progressão amostras de cancro colorrectal, 60 entre os quais também foram utilizados para gerar o perfil de expressão de miARN. Nós inicialmente estabelecido modelo de transição de correlação de Spearman para quantificar a desorientação cooperatividade associada com a transição do normal para pré-cancerosas de tecido de câncer, em conjunto com a rede de regulação miRNA-RNAm e algoritmo de aprendizado de máquina para identificar genes com valor prognóstico. Finalmente, uma assinatura de 12 genes foi extraída, cujo valor prognóstico foi avaliada utilizando análise de sobrevivência de Kaplan-Meier em cinco conjuntos de dados independentes. Utilizando o teste de log-rank, a assinatura de 12 genes foi estreitamente relacionado com a sobrevida global em quatro conjuntos de dados (GSE17536, n = 177,

p

= 0,0054; GSE17537, n = 55,

p

= 0,0039; GSE39582, n = 562,

p

= 0,13; GSE39084, n = 70,

p

= 0,11) e significativamente associada à sobrevida livre de doença em quatro conjuntos de dados (GSE17536 , n = 177,

p

= 0,0018; GSE17537, n = 55,

p

= 0,016; GSE39582, n = 557,

p

= 4.4e-05; GSE14333, n = 226,

p

= 0,032). A análise de regressão Cox confirmou que a assinatura de 12 genes foi um fator independente na previsão de sobrevida global do paciente com câncer colorretal (taxa de risco: 1.759; 95% intervalo de confiança: 1,126-2,746;

p

= 0,013], bem como sobrevida livre de doença (razão de risco: 2.116; 95% intervalo de confiança: 1,324-3,380;

p

= 0,002)

Citation:. Um N, Shi X, Zhang Y, Lv N, Feng L, Di X, et al (2015) Descoberta de Assinatura Immune novo gene com Valor prognóstico profunda no câncer colorretal:.. um Modelo de cooperatividade Desorientação criado no processo de desenvolvimento de cancro da PLoS ONE 10 (9): e0137171. doi: 10.1371 /journal.pone.0137171

editor: Zhiqian Zhang, Pequim Hospital Institute, CHINA

Recebido: 30 de abril, 2015; aceito: 13 Agosto, 2015; Publicado : 01 de setembro de 2015

Direitos de autor:. © 2015 An et al Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

dados Disponibilidade: dados de mRNA os dados brutos e processados ​​foram depositados no Centro Nacional de Informações sobre Biotecnologia (NCBI) Gene Expression Omnibus banco de dados (GEO) com o número de acesso séries GSE71187 ( ) e GSE71130 (dados de miRNA)

Financiamento:. Este trabalho foi apoiado pelo Programa de Pesquisa e Desenvolvimento de alta Tecnologia Nacional da China (SS2014AA020801, https://www.863.gov.cn/) eo Sci Programa de Desenvolvimento de biotecnologia de Pequim (D121100004712002, https://www.bjkw.gov.cn/n8785584/index.html) recebido pela KZ. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

o câncer colorretal (CRC) é o terceiro câncer mais comum em homens (746.000 casos, 10,0% de todos os cânceres) ea segunda em mulheres (614.000 casos, 9,2% dos cancros) em todo o mundo [1]. Apesar dos avanços significativos na compreensão do seu mecanismo molecular, CRC continua a ser uma das principais causas de mortalidade por câncer [2]. Estudos recentes sugeriram heterogeneidade em larga escala ocorreu em CRC [3-5], bem como em muitos outros tipos de cancro [6-8]. Tumor heterogeneidade desenvolve através de uma sequência de eventos, guiada por selecção clonal, onde a instabilidade genómica contribui para a produção de uma população de células diverso que é sujeito a selecção em um contexto de micro-ambiente ou terapêutico [9]. Por isso, é urgentemente necessário um novo modelo que compartilha semelhanças com câncer em termos de atributos de células-comportamentais e moleculares, mas que é intrinsecamente mais “organizada”.

Tem sido mais de 150 anos desde que Rudolf Virchow propôs pela primeira vez que as neoplasias surgem “de acordo com a mesma lei, que regula o desenvolvimento embrionário”, em 1858. a associação entre o desenvolvimento embrionário e carcinogênese é amplamente divulgado. Além disso, certos genes de desenvolvimento chave também estão envolvidos na carcinogénese através da activação mutacional [10]. Através de modelos animais de desenvolvimento, mecanismos moleculares da carcinogênese foram revelados e uma variedade de novas moléculas relacionadas com o cancro, caminhos e biomarcadores identificados [11-13]. O desenvolvimento embrionário e carcinogénese também partilham muitas outras semelhanças em relação ao comportamento celular, incluindo epitelial-a-mesenquimal transição (EMT) [14], mesenquimais-epiteliais de transição (TEM) [15], e imuno-vigilância evasão [16] . Tomados em conjunto, estes resultados oferecem evidência convincente de que o tumor pode ser visto como um órgão aberrante que tenha adquirido a capacidade de proliferação indefinida por meio de ataques acumulados [17], e que os eventos moleculares que se desviem células tumorais a partir do caminho de desenvolvimento normal, são provavelmente responsáveis para a iniciação e progressão do câncer.

pareadas correlações de expressão gênica (usando correlação de Pearson) são muitas vezes utilizados para determinar as associações entre genes em estudos transcriptomic [18-20]. As correlações de expressão gênica de pares em fase de desenvolvimento manifestar a estreita fisiológico ou associações distantes do gene de regulação do gene. Nosso estudo indica que as correlações entre os genes dentro de um grupo funcional dada (resposta imune) mostram um padrão notavelmente compacto e sincronizada da expressão do gene que garante a regulação apertada do desenvolvimento do cólon. Para um determinado gene, a ordem de classificação da sua correlação com os restantes membros deste grupo de genes, o que representa a topologia associação biológica, provavelmente foi perturbado durante a carcinogênese (relações reguladoras foram gradual mudado de fisiológica ao estado patológico). Nossa hipótese é que, se alguém vê um tumor como um órgão desenvolvimento aberrante, os genes culpado responsáveis ​​por perturbar a integridade deste padrão de expressão gênica correlação coordenada e, mais especificamente, perturbando a ordem de classificação do padrão de correlação dentro deste grupo gene particular durante a carcinogênese, provavelmente segurar profunda informação prognóstica. Nós definimos este conceito como “desorientação cooperatividade”, e originalmente construído um modelo de transição Spearman para quantificar desorientação cooperatividade que surge durante a progressão do desenvolvimento do cólon para a progressão da pré-cancerosa ao câncer, em vez de simplesmente se concentrar em genes diferencialmente expressos por fenótipos específicos.

MicroRNAs (miARNs) são uma classe de RNAs não-codificantes pequenas, ~ 22 nt de comprimento, que regulam a expressão do gene através da ligação à região 3 ‘não traduzida (3’-UTR) de genes alvo que leva à degradação da proteína ou inibição da tradução dos genes-alvo [21]. MiRNAs são previstos para regular mais de 60% de todos os genes codificadores de proteínas em mamíferos [22], regulando assim quase todos os processos celulares [23, 24]. Nossa hipótese é que miRNAs desempenhar um papel fundamental na sobrevida do paciente CRC e que os alvos a jusante desses miRNAs pode ter valor prognóstico; Esta estratégia também foi adotada por Yang et al. [25] que demonstraram que a expressão de 219 genes associados a miARN foi associada com um subtipo mesenquimais de cancro do ovário seroso associada com baixa sobrevivência global (OS) [25].

Embora a relação entre a desorientação cooperatividade, embrionária desenvolvimento e carcinogênese ainda não está claro, é plausível que certos genes miRNA regulamentados, que desempenham papéis importantes na fase de desenvolvimento e contribuem para a cooperatividade desorientação durante a carcinogênese, pode ter um impacto substancial na transformação câncer. Estes genes podem ser promissores candidatos biomarcadores de prognóstico.

Neste estudo, nós nos concentramos em genes relacionados com a resposta imune. A resposta imune e, mais especificamente, a inflamação, tem uma profunda influência sobre a carcinogénese, que pode matar as células do tumor, ou, em algumas circunstâncias, pode ser mobilizada para facilitar a carcinogénese [26]. A importância da resposta imune em carcinogénese levou-nos a determinar os biomarcadores de prognóstico para CRC. O nosso é o primeiro estudo a examinar uma série de amostras, de cólon humano desenvolvimento embrionário, a progressão pré-cancerosas colorectal, com amostras de CRC, a fim de simular a trajetória do desenvolvimento do cólon humano e carcinogênese. O modelo de transição Spearman propusemos aqui representa o primeiro passo na identificação dos genes culpado [genes diferencialmente expressos (degs) com uma nova interpretação com base na expressão padrão de correlação] responsável por romper o padrão de correlação organizada entre os genes relacionados ao sistema imunológico durante a carcinogênese. Usando a tecnologia de microarray e bioinformática análises, identificamos uma assinatura de 12 genes com valor prognóstico significativo, o que pode ser clinicamente relevante no futuro.

Materiais e Métodos

Um esquema para o estudo é descrito em Fig 1.

CRC

cancro colorectal,

DVIG

desenvolvimento variando gene imunológico,

OS

sobrevida global,

DFS

doença- sobrevida livre

pacientes e amostras

de acordo com os princípios da biologia do desenvolvimento gastrointestinal [27], as amostras de cólon em desenvolvimento foram obtidos a partir de 20 casos de aborto no Maternal Criança Hospital Health Care de Hai Dian entre 2007 e 2009. As amostras incluídas embriões inteiros (nós) em três a cinco semanas pós-ovulatórios (PWS), dois pontos embrionárias precoces (CEE) em oito a dez PWS e dois pontos embrionárias médio (MEC) em 14 a 22 PWS. Dentro de 10 minutos de aborto, os tecidos foram lavados com solução salina normal, e os embriões inteiros ou vírgula embrionários foram cuidadosamente separados a partir de tecidos fetais com a orientação de um microscópio estéreo Nikon SMZ1500 (Japão). Foram excluídos os embriões /fetos com doenças genéticas conhecidas ou suspeitas.

amostras de mucosa colorretal normais foram coletadas de pacientes com hemorróidas que receberam a excisão cirúrgica no Departamento de Colon e Cirurgia Retal de Pequim Shi Ji Tan Hospital entre 2009 e 2010 . Cinquenta e duas amostras de CRC com informações OS foram obtidos durante a ressecção cirúrgica de Zhe Jiang University School of Medicine. amostras de biópsia da colonoscopia, incluindo adenomas colorretais e adenocarcinomas foram obtidos do Departamento de Endoscopia do Hospital de Câncer, da Academia Chinesa de Ciências Médicas, entre 2008 e 2011. Os pacientes com história de polipose adenomatosa familiar, hereditário não-polipose CRC, ou doença inflamatória do intestino foram excluídos. Adenoma é definido como displasia, carcinoma in situ, suspeita de carcinoma invasivo e carcinoma intramucoso; o adenocarcinoma é definido como invasão submucosa pelo adenocarcinoma [28]. Quatro a seis áreas foram excisados ​​a partir de amostras de neoplasia colorectal, incluindo as bordas e o centro da lesão, de acordo com a directriz ASGE [29]. As amostras de tecido foram todos congelados instantaneamente em azoto líquido imediatamente após a biópsia ou cirurgia e armazenado a -80 ° C. Uma porção de todas as amostras foi sujeito a análise patológica realizado por dois patologistas independentes, cegos e experimentados. Amostras satisfeitos com os critérios de diagnóstico de mucosa normal e neoplasia (células neoplásicas 70%) foram incluídos. Se mais do que uma amostra de biópsia foi feita a partir do mesmo paciente, estas amostras foram reunidas. Todos os doadores assinaram formulários de consentimento informado. O uso de amostras de tecidos humanos e os procedimentos experimentais para este estudo foram revistos e aprovados pelo Comitê do Instituto do Câncer e do Hospital da Academia Chinesa de Ciências Médicas de Ética.

isolamento do RNA

O RNA total extraiu-se a partir dos tecidos, utilizando o reagente TRIzol congelados de isolamento de ARN (Invitrogen, Carlsbad, CA, EUA) de acordo com as especificações do fabricante. a integridade de ARN foi avaliada usando um Bioanalyzer 2100 (Agilent Technologies, Santa Clara, CA, EUA). Se o número de integridade do ARN foi ≥ 5, o ARN total foi purificado adicionalmente utilizando o RNeasy Mini Kit (Cat No.74106, Qiagen, Alemanha). As concentrações de ARN foram determinadas com um NanoDrop ND-1000 Espectrofotômetro (NanoDrop Technologies, Wilmington, EUA).

perfil de expressão Microarray e os dados normalização

Depois de uma análise de avaliação e integridade do RNA histopatológico, todas as amostras foram analisados ​​utilizando microarrays Agilent. amostras de biópsia incluindo 6 WE, 6 CEE, 8 MEC, 12 normal, 58 adenoma e 47 amostras de adenocarcinoma foram utilizados para análise mRNA microarray; destes, também foram utilizadas 60 amostras (2 Nós, 6 CEE, 8 MEC, 11 normal, 9 adenoma e 24 amostras de adenocarcinoma) para a análise microarray miRNA. amostras de ARN total purificado foram etiquetadas e hibridizadas para Agilent 4 × 44K Total Humano Genoma Oligo Microarrays (G4112F) de acordo com as instruções do fabricante. Para as matrizes de miRNA, o RNA total foi analisado com um Agilent 8 × 15K Humano miRNA Microarray V3 (G4470C).

O microarray mRNA e miRNA dados brutos foram normalizados utilizando o software GeneSpring GX, versão 11.5 (Silicon Genetics, Redwood City, CA, EUA). Para os dados de expressão de mRNA, um total de 41,091 sondas individuais foram obtidos de acordo com a configuração padrão do GeneSpring. O valor da expressão de um gene particular, foi determinado como o valor médio de todas as sondas de mapeamento para este gene. Finalmente, foram obtidos os valores de 18,986 genes de expressão. miARNs medidos foram considerados presentes quando o seu sinal pode ser detectada em pelo menos 50% das amostras dentro de cada tipo de amostra. Os perfis de expressão foram adquiridas durante 96 miARNs. Os dados brutos e processados ​​foram depositados no Centro Nacional de Informações sobre Biotecnologia (NCBI) Gene Expression Omnibus banco de dados (GEO) com o número de acesso séries GSE71187 (dados de mRNA) e GSE71130 (dados de miRNA).

Affymetrix microarrays recolha de dados, pré-processamento e normalização

Os dados brutos para cinco estudos mRNA câncer colorretal microarray humanos (Tabela 1) foram baixados do GEO. O conjunto de dados combinados continha um total de 1.094 amostras foram processadas em arrays Affymetrix HG-U133A Plus2 (GPL570), que contêm 52,475 sondas. valores de expressão normalizados foram obtidos através da robusta média multi-array (RMA) algoritmo e mais quantil normalizados utilizando o pacote Bioconductor “affy”. O algoritmo de combate foi utilizado para eliminar os efeitos potenciais de lote com o pacote Bioconductor “inSilicoMerging”. Os níveis de expressão de genes 20,184 foram obtidos como o valor médio de todos sondas para mapeamento de um gene particular. Toda a informação clínica foi extraída a partir das publicações originais. Entre estes cinco conjuntos de dados, GSE17536, GSE17537 e GSE39582 conter tanto sobrevida livre de doença (DFS) informação OS e. GSE39084 contém dados OS somente, quando GSE14333 contém apenas informações DFS.

Identificar “genes relacionados ao sistema imunológico-variando de desenvolvimento” (DVIGs)

WE, CEE, MEC e amostras normais representaram amostras em diferentes estágios de desenvolvimento do cólon humano; adenomas foram consideradas como lesões pré-cancerosas; e adenocarcinomas representada a fase do cancro. Genes que caíram sob a GO prazo Gene Ontology (https://www.geneontology.org): 0.006.955 foram considerados genes relacionados à resposta imune; isso resultou em 1028 genes, dos quais 972 estavam presentes em nossos dados mRNA microarray. ANOVA foi usado para recuperar 665 DVIGs que foram diferencialmente expressos durante a fase de desenvolvimento (FDR 0,0001).

Criação do modelo de transição Spearman

A descrição detalhada do modelo de transição Spearman é apresentado em Métodos S1.

Construção de um miRNA-mRNA regulamentar rede

rede reguladora a miRNA-mRNA foi gerado com base em algoritmos de sequências de (Miranda [30], TargetScan [31], PicTar [32] ) e dados de microarranjos (60 amostras de biópsia com tanto miRNA e dados microarray mRNA). Um par de regulamentação miRNA-mRNA foi considerada sólida apenas se satisfeito pelo menos dois algoritmos sequência e se os seus níveis de expressão foram significativamente e inversamente correlacionados (FDR 0,01).

O estabelecimento de um gene assinatura CRC utilizando aprendizado de máquina aplicada a perfis de amostras clínicas primárias de expressão de mRNA

das 52 amostras de CRC cirurgicamente excisadas, foram selecionados 19 e 22 casos em que os pacientes sobreviveram mais tempo ( “Good grupo”) ou menor ( “grupo Pobre”) de cinco anos ( após a cirurgia) para treinar um modelo de aprendizagem de máquina florestas aleatória. Resumidamente, os genes foram encomendados pela média diminuição Gini (ODM) critério, onde os genes são classificados por seu nível de influência no desempenho da classificação florestas aleatória; deixar uma validação fora cruz (LOOCV) para estimar proporção “Pobre de votação” do caso de teste, que foi ainda tratado como preditor no receiver operating teste de característica (ROC). Os genes foram, em seguida, eliminado de forma recursiva com base na classificação de gene inicial, até que a área sob a curva ROC (AUC) foi optimizado. Este algoritmo é claramente descrito em pesquisas anteriores como o algoritmo AUC-RF [33].

Kaplan-Meier análise de sobrevivência e análise de regressão Cox

Análise de Componentes Principais (PCA) foi realizado utilizando genes de interesse em cada baixado Affymetrix conjunto de dados. O primeiro componente principal (PC1) capta a maior quantidade de variância total nos perfis e foi calculado para cada paciente. Os pacientes foram divididos em dois grupos de igual tamanho com base na ordem de classificação da PC1 através de seus perfis tumorais. análise de sobrevivência de Kaplan-Meier eo teste de log-rank foram utilizados para avaliar a diferença de prognóstico entre os dois grupos atribuído pelo PC1 [12]. O modelo de riscos proporcionais de Cox foi utilizado para avaliar a independência dos fatores prognósticos de uma forma gradual. Amostras no conjunto de dados Affymetrix combinada (1.094 amostras) com informações completas da idade, sexo, o Comité Misto Americana do Câncer (AJCC) estágio (palco), grau patológico (grau) e informações de sobrevivência foram utilizadas (213 amostras para análise OS Cox e 213 amostras para análise DFS Cox), e um valor de

p Art 0,05 foi considerado significativo. Validação

Gene assinatura usando gene aleatório de amostragem

A nossa estratégia foi selecionar um pequeno gene assinatura com valor prognóstico significativo por estreitamento genes de interesse de uma forma gradual. Para provar que este método realmente previu resultado sobrevivência, N-gene (onde o gene assinatura final contém os genes n) amostras aleatórias foram realizadas 2000 vezes em cada conjunto de genes. análise de sobrevivência de Kaplan-Meier foi realizada com genes n escolhidos aleatoriamente, e o número de vezes que os genes escolhidos aleatoriamente poderia discriminar simultaneamente todos os conjuntos de dados de sobrevivência alvo foi gravado.

Análises Estatísticas

Todas as análises estatísticas foram executados usando o software de projecto de I (versão 2.15.1), e Bioconductor (versão 2.11). Os pacotes R “Floresta aleatória” (versão 4,6-7) [34] e “proc” (versão 1.7.1) [35] foram utilizados para construir o modelo AUC-RF. Diferencialmente expressos genes foram obtidas usando o pacote de R “samr”. Análise de sobrevivência de Kaplan-Meier foi levada a cabo usando o pacote de R “sobrevivência”. O pacote de anotação Bioconductor “org.Hs.eg.db” (versão 2.8.0) foi utilizado para recuperar os genes imuno-relacionados [36]. Mapeamentos entre as sondas Affymetrix e identificadores de genes Entrez foram realizadas utilizando o pacote de Bioconductor “hgu133plus2.db”. Meta-análise foi realizada com o pacote R “meta”, e parcelas florestais foram feitas usando o pacote R “rmeta”. visualização da rede foi realizada em Cytoscape (versão 3.2.0) [37].

Resultados

genes diferencialmente expressos entre o normal eo tecido CRC são significativamente enriquecido para o termo Reactome “sinalização no sistema imunológico”

genes diferencialmente expressos (degs) entre tecidos normais e CRC foram identificados usando o algoritmo SAM (FDR 1e-07). Degs incluiu 3.226 e 2.538 genes significativamente cima e reprimidos em CRC. Usando a análise de enriquecimento Reactome, realizado com David Bioinformática Recursos 6,7 (https://david.abcc.ncifcrf.gov/), descobrimos que o termo Reactome “sinalização no sistema imunológico” foi significativamente enriquecida em CRCs (Bonferroni ajustado

p

valor = 0,004), sugerindo uma associação significativa entre a carcinogênese e os genes relacionados ao sistema imunológico (S1 tabela).

correlação de Pearson heatmaps

correlações Pairwise Pearson entre os 665 DVIGs foram calculados e ajustado para eliminar a parcialidade (método ajustada foi descrito nos Métodos S1). heatmaps correlação de Pearson (665 × 665) foram construídos para amostras de cólon durante o desenvolvimento do cólon (Fig 2A), progressão (Fig 2B) e câncer (Fig 2C) etapas. Durante o estágio de desenvolvimento, obtiveram-se três grupos distintos. grupos distintos, contudo, não foram evidentes durante as fases de progressão e câncer. Ao sobrepor as três curvas de densidade de correlação de Pearson (Figura 2D), uma distribuição bimodal claro foi observado para o estádio de desenvolvimento, em contraste com as distribuições unimodal dos estádios de progressão e cancerosas. Além disso, o estágio do câncer tinha uma densidade máxima superior a uma correlação de Pearson igual a zero em comparação com a progressão ou estágios de desenvolvimento.

Heatmaps de correlação de Pearson ajustados para 665 DVIGs em (A) o desenvolvimento, (B) a progressão pré-cancerosas e (C) ao cancro, respectivamente. Genes foram agrupados em três grupos (destacadas com cores diferentes) por UCA. (D) enredo Densidade de pares correlações de Pearson ajustados de todas as três fases. A curva para o estágio de desenvolvimento é a distribuição bimodal, mas unimodal no fases de progressão e câncer. A fim de tornar vetores intra-imunes comparáveis, os genes foram reordenadas na progressão e estágio do câncer heatmaps para coincidir com a ordem no heatmap fase de desenvolvimento, para gerar (E) heatmap progressão reordenadas e (F) heatmap câncer reordenadas.

DVIG

, o desenvolvimento variando gene imunológico;

UCA

, algoritmo de agrupamento sem supervisão.

“genes Obedientes” foram filtradas usando modelo de transição Spearman

Pearson heatmaps correlação de DVIGs durante as fases de progressão e câncer foram reordenados para criar todas as três fases (Figura 2E e 2F, descritos nos Métodos S1). Como mostrado na Fig 3A, os 665 DVIGs foram projectados sobre uma transição de Spearman sistema de coordenadas, com a transição de Spearman entre o desenvolvimento e progressão (STD-P, Métodos S1) e entre a progressão e cancro (STP-C, Métodos S1) como o X e Y eixo coordenadas, respectivamente. Os genes foram coloridas da mesma forma como no agrupamento heatmap desenvolvimento na figura 2A. Dos 665 DVIGs, 385 (denominados “genes obedientes”) caiu dentro do arco do quarto de círculo, enquanto os restantes 280 (denominados “genes de desvio”) caiu fora desse arco e foram utilizados como candidatos para procedimentos de selecção a jusante.

(a) os 665 DVIGs foram projetadas em uma transição de correlação de Spearman sistema de coordenadas com base em sua desorientação cooperatividade entre os estágios consecutivos. Os genes foram coloridas da mesma forma como no heatmap desenvolvimento. (B) O algoritmo de AUC-FR foi utilizado para a optimização gene assinatura. Genes foram recursivamente removido de uma lista gene ordenou-importância até o maior valor AUC foi cumprido. (C) A maior AUC de 0,904 (95%

CI

: 0,799 ~ 1,000) foi obtida quando o número de genes foram reduzidos a 12, com 81,8% de sensibilidade (95%

CI

: 0,636-0,955) e% de especificidade 89,5 (95%

CI

: 0,737-1,000).

Dev

, o desenvolvimento;

Prog

, a progressão;

TPS

, ponto teoricamente estável;

AUC

, área sob a curva;

DVIG

, o desenvolvimento variando gene imunológico;

CI

, intervalo de confiança.

genes Diversion com um ou vários reguladores de miRNA esteve no pool genético

Usando os dados de mRNA e miRNA emparelhado que estavam disponíveis para 60 das amostras de biópsia CRC, construímos uma rede de regulação miRNA-mRNA para selecionar genes de desvio que tiveram pelo menos um regulador de miRNA (Métodos S1). Isto resultou em 59 genes de desvio que foram potencialmente reguladas por 37 miRNAs (Fig 4, S2 Tabela).

nós amarelo escuro representam miRNAs. nós safira vermelha e representam mRNAs, entre os quais os vermelhos são genes na assinatura de 12 genes. bordas sólidas dirigidas representam regulação miRNA-mRNA.

otimização assinatura Gene pelo algoritmo AUC-RF

Os 59 genes de desvio foram ainda mais reduzidas estes 59 genes para obter o subconjunto de genes proporcionando o melhor desempenho prognóstico. Estes genes foram primeiramente ordenados de acordo com a sua importância nos casos em discriminar por OS (maior ou menor que 5 anos), utilizando o algoritmo de floresta aleatória; genes foram, em seguida, eliminado de forma recursiva a partir da parte inferior desta lista até que a área sob a curva ROC (AUC) foi optimizado (AUC = 0,904, 95%

CI

: 0,799-1,000, Figura 3B). Isto resultou em uma assinatura de 12 genes otimizado, que teve 81,8% de sensibilidade (95%

CI

: 0,636-0,955) e% de especificidade 89,5 (95%

CI

: 0,737-1,000) na discriminação pobre de boa OS em 52 amostras de cirurgia com um “pobre” proporção de voto de 0,560 (Fig 3C). Esta assinatura de 12 gene é composto de

AXL

,

BCl3

,

COLEC12

,

ABR

,

PXDN

,

EP300

,

JAM3

,

MAP3K1

,

CASP8

,

RPS6KA1

,

CHUK

, e

RPS6KA2

, e é regulado por 16 miRNAs (Fig 4).

Kaplan-Meier sobrevivência e análise de regressão Cox confirmou a validade do 12-gene assinatura

análise de sobrevivência de Kaplan-Meier foi realizado para avaliar o valor prognóstico da assinatura de 12 genes em cinco conjuntos de dados Affymetrix recuperados do banco de dados do GEO. Os resultados do teste de log-rank confirmou que a assinatura de 12 genes foi estreitamente relacionado com OS em quatro conjuntos de dados (Fig 5A; GSE17536, n = 177,

p

= 0,0054; GSE17537, n = 55,

p

= 0,0039; GSE39582, n = 562,

p

= 0,13; GSE39084, n = 70,

p

= 0,11). Além disso, esta assinatura de 12 genes foi significativamente associada com DFS em quatro conjuntos de dados (Fig 5B; GSE17536, n = 177,

p

= 0,0018; GSE17537, n = 55,

p = 0,016

; GSE39582, n = 557,

p

= 4.4e-05; GSE14333, n = 226,

p

= 0,032). A análise de regressão Cox também confirmou que a assinatura de 12 genes foi um fator independente na predição OS do CRC paciente [Tabela 2; taxa de risco (

HR

): 1.759; 95%

CI

: 1,126-2,746;

p

= 0,013], bem como DFS (Tabela 2;

HR

: 2.116; 95%

CI

: 1,324-3,380;

p

= 0,002). Meta-análise foi realizada para avaliar a correlação entre cada um dos 12 genes e sobrevivência (OS: GSE17536, GSE17537, GSE39582 e GSE39084, e DFS: GSE17536, GSE17537, GSE39582 e GSE14333) de pacientes de CRC com o modelo de efeito fixo (Fig 6A ) e modelo de efeito aleatório (Fig 6B).

análises de sobrevida de Kaplan-Meier e log-rank testes foram realizados para avaliar o valor prognóstico da assinatura de 12 genes. (A) O desempenho da assinatura de 12 genes em discriminação OS. Conjuntos de dados com informações OS foram GSE17536, GSE17537, GSE39582 e GSE39084. (B) O desempenho da assinatura de 12 genes em discriminação DFS. Conjuntos de dados com informações DFS foram GSE17536, GSE17537, GSE39582 e GSE14333.

OS

, a sobrevida global;

DFS

, sobrevida livre de doença.

(A) Forest plot da associação entre genes individuais e OS com um modelo de efeito fixo em conjuntos de dados que contêm informações sobre o SO (GSE17536, GSE17537 , GSE39582 e GSE39084). Meta-análise desses 12 genes em quatro conjuntos de dados independentes foi realizada, e

HR

, 95%

CI

de cada gene e correspondente

p

valor foram calculados e plotados em o enredo da floresta. (B) Forest plot da associação entre genes individuais e DFS com um modelo de efeito aleatório em quatro conjuntos de dados contendo informações DFS (GSE17536, GSE17537, GSE39582 e GSE14333).

CRC

, câncer colorretal;

HR

, taxa de risco;

CI

; intervalo de confiança;

OS

, a sobrevida global;

DFS

, sobrevida livre de doença.

amostragem aleatória gene verificou a validade de nossa metodologia

Para confirmar a validade do nosso processo de seleção assinatura, um painel de 12 genes foi amostrado aleatoriamente 2000 vezes através dos 972 genes relacionados ao sistema imunológico, 665 DVIGs, 280 genes de desvio e 59 genes regulados por miRNA, respectivamente. O número de vezes que um painel de 12 genes escolhidos aleatoriamente poderia discriminar, simultaneamente, os conjuntos de dados de sobrevivência (OS e DFS em GSE17536 e GSE17537, DFS em GSE39582 e GSE14333), 0, 0, 9 e 33 para os quatro grupos de gene supramencionados, respectivamente , proporcionando uma forte evidência para a validade da nossa hipótese e gene gasoduto de selecção assinatura (Fig 7A).

(a) enredo Bar do número de vezes que 12 genes escolhidos aleatoriamente poderia discriminar simultaneamente quatro conjuntos de dados de sobrevivência (oS e DFS em GES17536 e GSE17537, DFS em GSE39582 e GSE14333). (B) Heatmap de 137 amostras de biópsia estabelecidos com o perfil da assinatura de 12 gene expressão de mRNA. Os dados em bruto foram normalizados de ARNm e, em seguida, filtrou-se (ver “Materiais e Métodos”). As linhas representam genes, e as colunas representam amostras de biópsia. As linhas, em vez de colunas, foram reordenados usando UCA, ao passo que as amostras do mesmo tipo foram colocados juntos.

DVIG

, o desenvolvimento variando gene imunológico;

UCA

, algoritmo de agrupamento não supervisionado;

OS

, a sobrevida global;

DFS

, sobrevida livre de doença.

Discussão

A associação íntima entre o desenvolvimento embrionário e carcinogênese faz o desenvolvimento embrionário um modelo de referência viável para estudar o câncer, que contorna a complexidade potencialmente induzir em erro associado com a heterogeneidade de tumores.

Deixe uma resposta