PLOS ONE: Reconstrução e Análise de Fator de Transcrição-miRNA Co-Regulamentação feed-forward Loops em cancros humanos usando o filtro-Wrapper Seleção de Recursos

Abstract

Fundo

Como um dos tipos mais comuns de motivos de co-regulação, Loops feed-forward (FFLs) controlam muitas funções celulares e desempenham um papel importante em cancros humanos. Portanto, é crucial para reconstruir e analisar FFLs relacionadas com o cancro que são controlados pelo fator de transcrição (TF) e microRNA (miRNA) simultaneamente, a fim de descobrir como miRNAs e TFs cooperar uns com os outros em células cancerosas e como elas contribuem para carcinogênese. estudos FFL atuais dependem de informações regulamentação previsto e, portanto, sofrem a questão falso positivo no resultado de predição. Mais criticamente, FFLs gerados por abordagens existentes não podem representar o relacionamento regulação dinâmica e condicional sob diferentes condições experimentais.

Metodologia /Principais Achados

Neste estudo, propusemos uma seleção recurso de filtro-wrapper romance método para identificar com precisão mecanismo de co-regulação através da incorporação de informação prévia das interações reguladoras previstas com paralelos conjuntos de dados de expressão de miRNA /mRNA. Ao aplicar este método, reconstruímos 208 e 110 TF-miRNA FFLs de co-regulação de pan-cancerosas da próstata e conjuntos de dados humanos, respectivamente. Uma análise mais aprofundada destes FFLs relacionadas ao câncer mostraram que a STAT3 TF topo do ranking e miRNA HSA-let-7e são reguladores importantes implicados em cancros humanos, que regulam alvos significativamente enriquecidas em regulamentos de processos celulares e vias de sinalização que estão envolvidas na carcinogénese.

Conclusões /Significado

neste estudo, nós apresentamos uma abordagem computacional eficiente para reconstruir FFLs de co-regulação, identificando com precisão as interações de co-regulação de genes. A força do método de seleção de recurso proposto reside no fato de que pode precisamente filtrar falsos positivos nas interações regulamentares previstas pela modelagem quantitativa da co-regulação complexa de genes alvo mediados pela TFS e miRNAs simultaneamente. Além disso, o método de seleção de recurso proposto pode ser geralmente aplicado a outros estudos de regulação gênica usando dados de expressão paralelos no que diz respeito a diferentes contextos biológicos

Citation:. Peng C, Wang M, Shen Y, Feng H, Li A ( 2013) Reconstrução e Análise de fator de transcrição-miRNA de co-regulação feed-forward Loops em cancros humanos usando o filtro-Wrapper Seleção de recursos. PLoS ONE 8 (10): e78197. doi: 10.1371 /journal.pone.0078197

editor: Raya Khanin, Memorial Sloan Kettering Cancer Center, Estados Unidos da América

Recebido: 11 de junho de 2013; Aceito: 09 de setembro de 2013; Publicação: 29 de outubro de 2013

Direitos de autor: © 2013 Peng et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este trabalho foi apoiado por subsídios da National Science Foundation Natural da China (61101061 para MW, 31100955 para AL). Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

Central a todos os organismos biológicos, a decifração dos regulamentos de genes complicadas entre um grupo de reguladores e genes-alvo é crucial para aprender as atividades fisiológicas intracelulares e funções em nível molecular. Ela também ajuda a compreender os mecanismos internos de doenças complexas

in vivo

. Os reguladores de genes em regulamentos incluem factores de transcrição (TFS), que são proteínas que se ligam a locais específicos nas regiões do promotor de genes alvo, activando assim ou inibindo a expressão deles. Outros reguladores endógenos incluem pequenas (19-24 nucleótidos) RNAs não-codificantes (miARNs) que envolvem na regulação da expressão do gene ao nível [1] pós-transcricional através da inibição do processo de tradução ou mRNAs alvo degradantes. Verificou-se que tanto TFs e miARNs desempenhar um papel importante em cancros humanos [1] -. [5], por meio de controle de muitos processos biológicos no desenvolvimento e progressão do cancro

Muitos estudos descobriram que FT e miARNs são genes reguladores primários em animais e em função de uma lógica reguladora semelhante [6]. Daí TFs e miARN pode regular o mesmo gene alvo de forma cooperativa ao nível da transcrição e pós-transcricional, respectivamente. Por outro lado, miARNs são regulados pela TFS durante a sua transcrição a partir do genoma no interior do núcleo e a expressão de TF também poderia ser modulado por miARNs. Portanto, os regulamentos de genes pela TFS e miRNAs são muitas vezes fortemente acoplados, tornando um determinado ‘feed-forward laços “(FFLs) [7] estrutura com circuitos reguladores fechadas. FFLs ter sido demonstrada como um ofthe a maioria dos tipos comuns de motivos co-transcricional [8] e foi relatado que centenas de FFLs controladas-miARN estão disponíveis a nível genoma [9], [10]. Ao formar módulos funcionais na rede de transcrição (GRNs), FFLs controlar muitas funções celulares e também desempenham um papel importante em cancros humanos, por exemplo, apoiando propriedades oncogênicas de oncogenes [11] e influenciando uma abundância de genes alvo em células tumorais por diversos caminhos biológicos [12]. Assim, torna-se crucial para reconstruir e analisar TF-miRNA co-regulação FFLs em cancros humanos, a fim de descobrir como miRNAs e TFs cooperar uns com os outros em células cancerosas e como elas contribuem para a carcinogénese.

One dos desafios em estudar FFLs é a informação incompleta de metas regulatórias. Como há apenas um pequeno número de alvos experimentalmente verificados, a maioria dos estudos FFL adotar informação reguladora da previsão computacional. Por exemplo, a fim de encontrar miRNAs relacionadas ao câncer e TFs, Yan

et al

. FFLs extraído e classificados de TF previsto e alvos miRNA usando TRANSFAC e TargetScan [13]. Ye

et al

. FFLs também utilizados obtidos a partir de outros recursos de predição para construção e análise de rede co-regulação TF miARN e na leucemia linfoblástica aguda de células T [14]. No entanto, estes resultados previstos contêm uma grande proporção de falsos positivos, e mais criticamente FFLs geradas por abordagens acima são estáticas e não podem representar as relações dinâmicas e regulação condicional sob diferentes condições experimentais.

Actualmente, experiências microarray foram paralelas realizada para investigar a expressão gênica e miRNA em cancros simultaneamente [15], [16], que oferece uma grande oportunidade para abordar as questões acima mencionadas, utilizando dados de expressão na reconstrução do FFLs TF-miRNA de co-regulação. Recentemente, Lu

et al

. propôs um modelo de regressão Lasso que utiliza interações reguladoras computacionalmente previstos e câncer de dados de expressão paralelas para inferir redes de regulação miRNA-alvo [17], Yu

et al

. Modelo usado gradual regressão linear (STEP), que também integra os regulamentos previstos atuais com dados de expressão para obter uma rede combinatória de TF e miRNA no câncer [18]. Estes dois papéis lançar luz sobre a metodologia para a construção de GRNs miRNA-envolvidos e revolucionou a nossa compreensão da implicação do TFS e miRNAs em cancros humanos. No entanto, o estudo da FFLs exige informações precisas co-regulação, como FFLs representar a si mesmo como um tipo sutil de motivo de co-regulação. Portanto, os métodos computacionais mais sofisticadas são preferidos para reconstruir com precisão FFLs de dados de expressão com a ajuda de interações regulamentares previstas.

Neste estudo, propusemos um método computacional romance baseado em seleção de recursos para reconstruir TF-miRNA co-regulação FFLs em cancros humanos. Como uma máquina poderosa tecnologia de aprendizagem, seleção de recurso tem sido amplamente utilizada em muitas áreas de bioinformática, como a seleção de genes de dados de microarranjos [19], a inferência de redes de genes [20], o conteúdo e análise de sinais de sequência [21] e de massa análise [21]. Nós empregamos duas populares estratégias de seleção de recurso: filtro e embalagem, para descobrir de forma eficiente co-regulamentação do TFS e miRNAs de dados de microarranjos paralelas de cancros humanos. Os nossos resultados mostraram que o método proposto reduziu significativamente a taxa de detecção falsa nas relações reguladoras inferidos, levando a reconstrução mais precisa FFL. Uma análise mais aprofundada dos FFLs identificados pelo método proposto mostrou que incluiu muitos genes relacionados com o cancro conhecidos e miRNAs, indicando a sua importância funcional em cancros humanos.

Materiais e Métodos

Previsto interações reguladoras

Três tipos de interações reguladoras foram investigados neste estudo: TF de miRNA (TF-miRNA), TF para gene (TF-gene), e miRNA ao gene (miRNA-gene). Baixamos previu interações TF-miRNA do site cGRNB [18] com 11,599 pares de regulamentação. Para recuperar as interacções de TF-gene candidato, locais de ligação de TF foram extraídos a partir do primeiro ficheiro TFbsConsSites de UCSC [22], seguindo o procedimento descrito em [18] e, em seguida, utilizado para digitalizar os 1 kb a montante de 0,5 kb a jusante dos locais de início da transcrição de todos os genes de referência na UCSC. Os resultados foram ainda combinados com 7,059 interacções de TF-gene a partir do banco de dados TRED [23], que conduz a totalmente 130,338 interacções de TF-genes, incluindo genes alvo 16,534 e 214 TFs humanos. Para as interacções de miARN-gene, os resultados de três amplamente usados ​​miARN alvo ferramentas de previsão: PicTar [24], TargetScan [25] e Miranda [26] foram obtidos a partir do banco de dados miRGen [27], que contêm 75.968, 75.613 e 41.804 previu miRNA- interações gene respectivamente. A união dos resultados de previsão, incluindo 118,408 interações miRNA-gene com 276 miRNAs humanos e 10.255 genes-alvo, foram utilizados para uma investigação mais aprofundada.

mRNA Paralela e conjuntos de dados de expressão de miRNA

Foram utilizados dois paralela ARNm e miARN conjuntos de dados de expressão para cancros humanos, que representam os dados de expressão de ARNm de miARN e obtidos a partir das mesmas amostras e nas mesmas condições experimentais. O primeiro conjunto de dados inclui dados de expressão NCI-60 mRNA baseados nos chips Affymetrix HG-U133 [16] e os dados de expressão de miRNA paralelos [15] a partir do site CellMiner. Este conjunto de dados pan-cancro inclui totalmente 60 linhas celulares de cancro humano, proveniente de diferentes melanomas, leucemia e outros tumores sólidos, tais como cancro da mama, do cólon, do ovário, do pulmão e cancro da próstata. Este conjunto de dados de expressão paralela consiste totalmente 8.388 genes e 195 miRNAs [18]. A segunda mRNA paralelo e miRNA dataset expressão adotada neste estudo é constituída por 111 câncer de próstata e 28 amostras de próstata normais, incluindo 373 miRNAs e 19.253 mRNAs [28]. Este conjunto de dados está disponível na base de dados GEO com o número de acesso: GSE21032

Seleção de características para a identificação de interações reguladoras

Para cada alvo (mRNA ou miRNA), o conjunto de características iniciais (ou seja, todos previstos. FT ou miARNs que regulam este objectivo) normalmente contém mais do que um elemento, devido a um grande número de falsos positivos nos resultados previstos. Em seguida, a matriz de recurso tem

n

linhas e

m

colunas indicando as

n

reguladores e os seus valores de expressão em

amostras m

. Como primeiro passo, nós filtrada o conjunto de recursos de cada alvo usando um método eficiente mrmr (mínimo de redundância de-maximal-relevância) [19] com base em informação mútua, que é uma medida amplamente utilizada para definir a dependência de variáveis. Especificamente, vamos

p

(

x

) e

p

(

y

) ser as funções marginais de distribuição de probabilidade de duas variáveis ​​

x

e

y

e

p

(

x, y

) ser a função de distribuição de probabilidade conjunta, a informação mútua é definida como: (1) Suponha que um alvo

x

com valor da expressão

e

x

tem dois reguladores

y

i

e

y

j

com valores de expressão

e

yi

e

e

yj

. Por exemplo, se

y

i

e

y

j

representam um miRNA e uma TF, em seguida,

E

yi Comprar e

E

yj

será obtido a partir dos dados de expressão de miRNA e mRNA paralelas, respectivamente. O conjunto de recursos final

S

após a etapa de filtro irá satisfazer dois critérios utilizados no método mrmr, ou seja, a relevância máxima com o alvo e a redundância mínima entre os reguladores (ou seja, para selecionar os reguladores que têm redundância não apenas o mínimo de comum informações relativas aos reguladores já existentes, mas também de informação mútua máxima com o alvo), como formulados pela equação (2) e (3), respectivamente. AQUI

I

representa a informação mútua de duas variáveis. A partir dos resultados do ranking de mrmr, foram selecionados até 20 principais reguladores candidatos que são mais propensos a ter interações com o alvo de uma investigação mais aprofundada, que deve incluir todos os reguladores possíveis. (2) (3) Em seguida, características de cada alvo foram ainda mais otimizada pelo método de seleção de recurso wrapper e nesta etapa foi empregado um procedimento de eliminação retrógrada recursiva. Modelamos valores de alvo de expressão

i

(

E

xi

) e sua

p

reguladores (

E

yi1

, … ,

e

yip

) com a regressão linear (Equação 4), onde

β

i

é o coeficiente de regressão e

ε

i

representa o termo de erro ou ruído gerado a partir do processo de regressão. Para cada tempo, excluído o regulador com o coeficiente de regressão menor do featureset e repetiu o processo acima com os reguladores restantes até que o conjunto de recursos tornou-se vazio. As características óptimas foram determinadas por menor

p -valor

(inferior a 0,01) do modelo de regressão linear, utilizando F-teste. (4)

Reconstrução e validação de FFLs de co-regulação

As interações de co-regulação identificadas pelo método de seleção de recurso de filtro-wrapper composto por três tipos de relações reguladoras TF-miRNA: TF-gene , miARN-gene e o TF-miARN. Para reconstruir FFLs de co-regulação, foi realizada uma base de pesquisa exaustiva sobre o método em profundidade para todos os genes-alvo nos resultados. Para TF-FFLs, em primeiro lugar uma lista de genes-alvo potenciais que são controlados por, pelo menos, um miARN TF e foram gerados. Os reguladores de miARN de cada gene alvo foram então examinadas uma a uma e um TF-FFL foi gerado se o gene alvo e o seu regulador de miARN foram ambas controladas por um TF. Para miRNA-FFLs, a lista gene mesmo alvo foi usado e um miRNA regulação tanto um gene alvo na lista e sua TF foi escolhida para construir um miRNA-FFL. Finalmente, para identificar os compostos-FFLs os miRNA-FFLs reconstruídos foram ainda examinadas de forma iterativa para ver se o TFs nestes FFLs também regulam os miRNAs correspondentes.

Para validar os FFLs reconstruídos a partir de conjunto de dados paralelo expressão e de informação prévia interações regulamentares previstas, foram selecionados aleatoriamente o mesmo número de interações a partir de pares de regulação previstos a partir do qual reconstruímos as FFLs usando acima abordagem. Este procedimento foi repetido 1000 vezes para gerar a distribuição empírica sob a hipótese nula de que as FFLs reconstituídas pela nossa abordagem de facto surgir por acaso. Nós, então, realizada uma amostra t-teste com base no número de TF-FFLs, miRNA-FFLs e compósitos-FFLs reconstruídos a partir de conjunto de dados pan-câncer e calculado o

p

-valor para determinar se esta hipótese nula pode ser rejeitada ao nível de significância de 0,01.

Além disso, para validar ainda mais a importância de FFLs ao câncer, foi avaliado o desempenho dos FFLs identificadas na classificação de câncer de próstata e amostras normais utilizando dados de expressão de genes em paralelo. LIBSVM [29], uma biblioteca SVM pública, foi seleccionado para a classificação. Deixe-one-out validação cruzada (LOOCV), que é o método mais objectivo e rigoroso para avaliar um classificador, foi adotada para avaliar o desempenho de classificação de FFLs. Para comparação, foi também utilizado um método de linha de base, em que os rótulos de câncer e conjunto de dados de expressão normal foram permutados 100 vezes. Para cada tempo, classificadores SVM utilizando os mesmos FFLs foram gerados a partir dos dados permutados de expressão e, em seguida, testadas com o mesmo procedimento de avaliação. Os resultados da classificação obtidos a partir de todos os testes de permutação foram calculados para obter o desempenho da linha de base.

Três medições de desempenho de classificação utilizados neste estudo, a precisão (

Prec

), sensibilidade (

Sn

) e especificidade (

Sp

) são definidos como folllows: (5) (6) (7) Aqui

TP

,

TN

,

FP

e

FN

representam verdadeiro positivo, verdadeiro negativo, falso positivo e falso negativo, respectivamente. Entretanto, uma vez que os tamanhos das amostras de cancro e normais são muito diferentes, o coeficiente de correlação Matthews (

Mcc

) foi utilizado, o que é uma medida equilibrada da qualidade das classificações [30]: (8) Além disso, nós também plotados o operador receptor característica (ROC) para comparação de desempenho, em que o eixo x representa 1-

Sp Comprar e eixo y representa

Sn

.

resultados

Filtro-wrapper seleção de recursos

Um exemplo do processo de selecção recurso de filtro-wrapper utilizando o conjunto de dados pan-câncer é ilustrada na Figura 1. na selecção recurso de filtro, os reguladores de alto escalão seleccionado por mrmr demonstrou uma grande informação mútua, indicando elevada relevância com o gene alvo (Figura 1A). A Figura 1B mostra no início, há totalmente 20 características candidatos com possíveis falsos positivos e do

p

-valor do modelo de regressão linear associado é 0,27. Quando a seleção recurso wrapper é executada, o correspondente

p

-VALOR diminui drasticamente, sugerindo um modelo melhor, que é mais perto de mecanismo de regulação do gene real. O modelo final consiste em três reguladores com uma óptima

p

-valor de 3,9 × 10

-4. Além disso, o boxplot dos

p

-Valores para todos alvo investigada neste estudo (Figura 2A) mostra seleção de recurso geralmente torna modelos de regressão mais precisos. Também avaliamos o método proposto pelo cálculo do coeficiente de correlação de Pearson (PCC), uma medida amplamente utilizada para identificar relações de regulamentação [31], entre os reguladores candidatos e de destino. Como resultado, PCCs significativamente mais elevados (U-test

p

-valor: 4.4 × 10

-167) foram observados nas interações reguladoras após seleção de características (Figura 2B). Tomados em conjunto, o método de seleção recurso de filtro-wrapper melhora a confiabilidade das interações regulatórias identificadas pela modelagem com precisão dados de expressão paralelas e eficiente remoção de interações falsamente previstos.

(A) Um exemplo que mostra informação mútua de todos os reguladores no filtrar processo de seleção de recurso. Nós escolhemos os reguladores de alto escalão selecionados pelo mrmr, que demonstram maiores valores de informação mútua que indicam alta relevância com o gene alvo. (B) Um exemplo que ilustra

p

mudança -valor do modelo de regressão linear no processo de seleção de recurso wrapper. Quando 17 características são removidos, o melhor

p

-valor (marcado pelo vermelho ‘*’) encontrados pela seleção recurso invólucro é de 3,9 × 10

-4.

( a)

P

-Valores dos modelos de regressão linear para todos os genes-alvo, antes e após a seleção de funções.

P

-Valores diminuiu significativamente após a seleção de recursos foi realizada. coeficientes de correlação (B) Pearson (CCP) entre todos os genes-alvo e seus reguladores antes e depois da seleção de recursos. PCCs mais elevados (U-test

p

-valor: 4.4 × 10

-167) foram observados nas interações regulatórias identificadas finais

Para avaliar ainda mais o desempenho do. método proposto, nós permutado os valores de dados de expressão de expressão aleatoriamente por 100 vezes e calculada falsa discoveryrate (FDR), ao considerar as interações geradas a partir dos conjuntos de dados aleatórios como falsos positivos. Para efeito de comparação, também avaliamos o desempenho dos outros dois métodos: Lasso [17] e STEP [18]. O processo de teste foi repetido 3 vezes e os resultados estão apresentados na Tabela 1. Com variância comparável, o valor médio de FDR para selecção característica de filtro é de 0,11, o que é significativamente menor do que a de laço e PASSO. Além disso, usando filtro e seleção de recursos invólucro em conjunto, observou-se uma redução dramática na variância FDR 1,24-0,38, indicando uma melhor consistência e robustez em comparação com outras abordagens. Além disso, este método proporcionou uma média de 0,06 FDR, que é 5% melhor do que o método do filtro. Tomados em conjunto, estes resultados demonstram o desempenho superior do método de seleção de recurso de filtro-wrapper.

Finalmente, nós investigamos interações reguladoras miRNA antes e depois da seleção de recursos. Como mostrado na Tabela 2, não foram totalmente 190976 previu interacções miARN alvo e a maioria deles foi removido quando a selecção do recurso foi aplicada, indicando estas interacções reguladoras previstas eram falsos positivos ou não relacionada com cancros humanos. Além disso, através do recurso a miRTarBase [32] que contém alvos miRNA experimentalmente validadas, encontramos a fração de interações reguladoras conhecidas foi aumentado significativamente nos resultados (Tabela 2, Hypergeometric-teste,

p

-valor: 2,4 × 10

-3 para a seleção recurso de filtro, 4,0 × 10

-4 de recurso de filtro-wrapper selecção), que também suporta o utilitário de seleção de recursos na descoberta de interações reguladoras.

TF e miRNA de co-regulação FFLs em cancros humanos

a partir dos 24,033 interações regulatórias identificadas pela seleção de recursos, nós identificados três tipos de FFLs em cancros humanos (Figura 3A): TF-FFL, miRNA-FFL e composite- FFL. No TF-OFF, o TF é o principal regulador que regula directamente o gene miARN alvo e ao mesmo tempo a miARN também regula o gene alvo. O miRNA-FFL tem a mesma estrutura com TF-FFL mas o regulador principal é, ao invés miRNA. O compósito-OFF é uma combinação de TF-FFL e miARN-OFF, no qual o TF e miARN regular entre si, enquanto que também regulam o mesmo gene alvo. Nota Estes FFLs também foram relatados em outros estudos de câncer [7], [13], [14], [33], [34], sugerindo que a prevalência de FFLs na regulação de genes e mecanismos da carcinogênese. A partir do conjunto de dados pan-câncer, que reconstruiu com sucesso 98 TF-FFLs, 106 miRNA-FFLs e 4 FFLs compósitos a partir das interações regulatórias identificadas por seleção de recurso. Para validar ainda mais esses FFLs relacionadas com o cancro, foi realizada uma amostragem teste t comparando FFLs reconstruída para aqueles gerados por interações selecionados aleatoriamente a partir de pares de regulamentação previstas (ver Método), e o número médio de TF-FFLs, miRNA-FFLs e FFLs compósitos em interações randomizados foi de 56, 26 e 0,2, que foram todos significativamente menor (

p

-valor: 1,2 × 10

-8 para TF-FFL, 2,0 × 10

-43 para miRNA-FFL, 9,9 × 10

-11 para composite-FFL) que o número de FFLs identificadas em cancros humanos.

(a) Três tipos de FFLs 3 vértices encontrados em cancros humanos. De acordo com a relação entre a miARN e TF, os FFLs mistos encontrada em cancros humanos foram classificados como a TF-FFL (TF regula directamente o gene miARN e alvo, enquanto a miARN também regula o gene alvo), miARN-FFL (miARN regula diretamente o gene TF e do alvo, enquanto o TF também regula o gene alvo) ou composite-FFL (TF ea miRNA regular uns dos outros enquanto eles também regulam o mesmo gene alvo). (B) TF-FFLs comuns encontradas em ambos pan-cancerosas e cancerosas da próstata conjuntos de dados. Os círculos vermelhos indicam genes-alvo; triângulos azuis e praças laranja indicam TFs e miRNAs.

Enquanto isso, nós reconstruída TF-miRNA FFLs de co-regulação, usando o conjunto de dados de câncer de próstata e comparou-os com aqueles gerados a partir de dados de expressão de próstata normais. O número de FFLs co-regulação no cancro da próstata era de 110, e muito mais FFLs (425 no total), foram identificados em células da próstata normais. Além disso, verificou-se a composição do FFLs também foi significativamente diferente (teste do qui-quadrado,

p

-valor: 1,7 × 10

-2), por exemplo, o percentual de miRNA-FFLs foi de 79% no câncer de próstata, enquanto este número aumentou para 89% no tecido da próstata normal. Este fenómeno implica muitas FFLs normais de co-regulação são dramaticamente suprimida ou alterada no cancro da próstata. Finalmente, foram comparados os FFLs reconstruídos a partir pan-câncer e conjuntos de dados de câncer de próstata e identificados 2 TF-FFLs (Figura 3B) que apareceram em ambos os conjuntos de dados. Curiosamente, os miARNs nestes dois FFLs, HSA let-7a-e HSA-deixou-7e, pertencem à família de HSA-let-7, que está relacionada com a próstata [35], da mama [36], pulmonar [37] cancros.

Além disso, foi realizada a análise de classificação do câncer de próstata e amostras normais, usando os dados de expressão de miRNAs e genes em FFLs de co-regulação acima mencionados. O desempenho do FFLs normais e cancerosas foram avaliados usando LOOCV e apresentados na Tabela 3. FFLs normais e cancerosas produzir resultados muito bons de classificação com

Prec

de 95,0% e 95,7%, repectively. Além disso, o

Sn

,

Sp Comprar e

MCC

medições mostram os resultados classfication de ambos os tipos de FFLs são muito equilibrada. Além disso, usando todas estas FFLs o desempenho de classificação é melhorada com o

Prec

,

Sn

e

Mcc

aumentando para 97,1%, 99,1% e 0,909, respectivamente, que são signficantly melhor do que os do método de linha de base. Estes resultados também são corroboradas pelas curvas ROC de abordagens acima (Figura 4), sugerindo a eficácia destes FFLs na classificação câncer de próstata e amostras normais e sua importância para o câncer

.

O cinza, azul, verde e vermelho as curvas são as curvas ROC de linha de base (uma permutação), FFLs câncer, FFLs normais e todas as FFLs, respectivamente. A maior área sob a curva indica os melhores desempenhos de classificação.

jogadores-chave na FFLs relacionadas ao câncer

Foi calculada a ocorrência do TFs e miRNAs no pan- cancerosas e câncer de próstata FFLs. Como mostrado na Tabela 4, no topo do ranking do TF e miARN são STAT3 e HSA-deixou-7e, respectivamente. Curiosamente, encontramos STAT3 apareceu em 18 FFLs de câncer de próstata (Tabela 5), ​​que foi significativamente enriquecido em comparação com aqueles no tecido da próstata normal (teste do qui-quadrado,

p

-valor = 2,6 × 10

-12) e no pan-câncer (teste do qui-quadrado,

p

-valor = 3,8 × 10

-3). Este fenómeno implica STAT3 está implicado no cancro da próstata. Tem sido relatado que a STAT3 é activada constitutivamente no tecido de cancro da próstata [38] e a indução da expressão de STAT3 pode induzir uma transformação maligna de células epiteliais prostáticas normais [39]. Além disso, a STAT3 foi mostrado como um alvo terapêutico promissor para o cancro da próstata [40]. Todas estas observações demonstram que STAT3 é um importante TF relacionada ao câncer e tem um impacto importante sobre a ocorrência e desenvolvimento de câncer de próstata. Além disso, descobrimos mais de 24% da meta de STAT3 encontrado em pan-câncer também apareceu no câncer de próstata. Uma análise mais aprofundada do enriquecimento funcional dos alvos STAT3 no câncer de próstata mostrou estes alvo desempenhou um papel importante em vários regulamentos processo celular implicados na carcinogênese, por exemplo, a ligação de superfície celular ea regulação da atividade de diferentes tipos de proteinases (Tabela 6). Os resultados da análise via também indicou que estas alvo eram abundantes em frutose e metabolismo manose e Notch via de sinalização.

TF-miRNA redes de co-regulação em cancros humanos

com base nos FFLs reconstruídos nos dois conjuntos de dados, construímos mais redes de co-regulação cancro da próstata específicas TF-miRNA pan-câncer e, e visualizou-los usando software Cytoscape [41]. Como mostrado na Figura 5, a rede de co-regulação pan-cancro contém um número total de nodos 213, incluindo 37, 17 miARNs TFs e 159 outros genes. A rede específico do cancro da próstata consiste de 118 nodos com 27 TFs, 8 e 83 miARNs outros genes (Figura 6). Foi calculado o grau (conectividade) de cada nó e descobriu que o hub com o maior grau em ambas as redes foi o mesmo miRNA HSA-let-7e. Este resultado concordou com a análise FFLs discutido acima, indicando que HSA-let-7e pode ser crucial em vários cancros humanos. Um estudo mais aprofundado literatura mostra que a HSA-deixou-7e é um membro de deixar-7 família que emergiu como supressor de tumores [36], e tem sido relatada a desempenhar um papel importante na regulação de oncogenes em multipletumors [42], [43].

Os círculos vermelhos indicam genes-alvo; triângulos azuis e praças laranja indicam TFs e miRNAs. Red T edge forma regulação miRNA; azul borda forma de seta:. regulação TF

Os círculos vermelhos indicam genes-alvo; triângulos azuis e praças laranja indicam TFs e miRNAs. Red T edge forma regulação miRNA; azul borda forma de seta:. regulação TF

A sub-rede de HSA-let-7e recuperado de FFLs pan-cancerosas (Figura 7) inclui 57 genes-alvo e 12 TFs incluindo muitos genes relacionados com o cancro, tais como MYB, E2F2 e hand1. MYB é proto-oncogene que foi identificado para causar uma gama de leucemia [44]. E2F2 é regulador do ciclo celular cujos aumentos no tecido de cancro da próstata [45] nível de expressão. Hand1 também tem sido relatada a desempenhar um papel crítico no processo de carcinogénese [46]. Também realizamos a análise funcional de enriquecimento de metas HSA-let-7e em pan-câncer e os resultados da Tabela 7 mostram que eles são significativamente enriquecidas em cinco vias (hsa05200: Pathways em câncer; hsa05220: leucemia mielóide crônica; hsa00270: cisteína e metionina metabolismo; hsa05222: câncer de pulmão de pequenas células; hsa05219: cancro de bexiga), entre os quais quatro vias estão relacionados com cânceres humanos. Ao todo, estes resultados mostram que HSA-let-7e pode inibir o processo de ocorrência do tumor e desenvolvimento em tumores diferentes, regulando diferentes oncogenes.

A sub-rede foi desenhada com todos nós ligados diretos de HSA-let-7e , que é mostrado para ser o hub da rede de co-regulação.

Discussão

cânceres humanos são normalmente caracterizados por proliferação de genes versáteis em diferentes estágios de desenvolvimento com complicado mecanismo regulador, portanto reconstrução da regulação de genes em cancros humanos, especialmente no que diz respeito ao seu complexo de recurso, dinâmico e condicional, pode avançar muito o nosso conhecimento sobre a origem do câncer e seu comportamento maligno. Neste estudo, utilizamos método de seleção de recurso de filtro-wrapper para identificar as interações regulamentares entre genes-alvo e reguladores, das quais mais reconstruídos FFLs TF-miRNA de co-regulação em cancros humanos. O método proposto tira o máximo partido de conjuntos de dados de expressão paralelas e informação prévia das interações regulamentares previstos para modelar e caracterizar o mecanismo de co-regulação complicada em cancros humanos.

Deixe uma resposta