PLOS ONE: Módulo de Rede Inferência a partir de uma expressão genética do cancro do conjunto de dados Identifica microRNA Regulado Módulos

Abstract

Fundo

Os microRNAs (miRNAs) são pequenos RNAs que reconhecem e regulam genes alvo do mRNA. Várias linhas de evidência indicam que eles são reguladores chave de numerosas funções críticas no desenvolvimento e doenças, incluindo câncer. No entanto, definindo o lugar ea função dos miRNAs em complexas redes reguladoras não é simples. abordagens de sistemas, como a inferência de uma rede módulo de dados de expressão, pode ajudar a alcançar este objetivo.

Metodologia /Principais Achados

Durante a última década, muitos progressos foram feitos no desenvolvimento de algoritmos de inferência de rede módulo robustas e poderosas. Neste estudo, analisar e avaliar experimentalmente uma rede módulo inferida a partir de tanto dados de expressão de mRNA miRNA e, usando o nosso algoritmo de inferência rede módulo recentemente desenvolvidos com base em técnicas de otimização probabilísticos. Mostramos que vários miARNs são previstos como reguladores estatisticamente significativas para vários módulos de genes fortemente co-expressa. Uma análise detalhada dos três desses módulos demonstra que a atribuição específica de miARNs é funcionalmente coerente e suportada pela literatura. Nós projetamos ainda um conjunto de experiências para testar a atribuição de miR-200a como o topo do regulador de um pequeno módulo de nove genes. Os resultados sugerem fortemente que o miR-200a está regulando os genes módulo através do fator de transcrição ZEB1. Curiosamente, este módulo é mais provável envolvido na homeostase epitelial e sua desregulação pode contribuir para o processo maligno nas células cancerosas.

Conclusões /Significado

Os nossos resultados mostram que uma análise de rede módulo robusto de expressão de dados podem fornecer novas perspectivas de miARN função em processos celulares importantes. Tal abordagem computacional, a partir de dados de expressão sozinho, pode ser útil para o processo de identificação da função de miARNs sugerindo módulos de genes co-expressos nas quais desempenham um papel regulador. Como se mostra neste estudo, os módulos podem então ser testados experimentalmente para investigar e refinar a função da miARN na rede reguladora

citação:. Bonnet E, Tatari H, Joshi A, Michoel T, K Marchal , Berx L, et ai. (2010) Módulo de Rede Inferência a partir de uma expressão genética do cancro do conjunto de dados Identifica microRNA Módulos regulamentados. PLoS ONE 5 (4): e10162. doi: 10.1371 /journal.pone.0010162

editor: Simon Rogers, da Universidade de Glasgow, Reino Unido

Recebido: 15 de dezembro de 2009; Aceito: 22 de março de 2010; Publicação: 14 de abril de 2010

Direitos de autor: © 2010 Bonnet et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este trabalho é suportado por uma porta Innovatie Wetenschap en Technologie (IWT) subvenção para o projecto (SBO) Bioframe Stretegisch BasisOnderzoek e por um Pólo (IUAP) concessão para o projeto BioMaGNet (Interuniversitário de atração Bioinformática e Modelagem:. de Genomas para Networks, ref P6 /25). Os financiadores não tiveram nenhum papel no desenho do estudo, datacollection e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declaram que não há interesses concorrentes existem

Introdução

MicroRNAs (miRNAs) são pequenos RNAs reguladores endógenos, presentes numa grande variedade de organismos eucarióticos. Eles são incorporados num ARN de silenciamento induzido complexo (RISC) que se liga aos locais de complementaridade variável em RNAs mensageiros-alvo, provocando a sua degradação e /ou reprimir a sua tradução em [1]. Evidência para a participação dos miRNAs no crescimento celular, diferenciação celular e câncer está se acumulando. Quase metade do mapa miRNAs humanos anotada dentro de regiões cromossômicas frágeis, que são áreas associadas com vários tipos de cancros humanos. Evidências recentes indicam que miARNs, bem como os factores que participam na biogénese de miARN pode funcionar como supressores de tumores e /ou oncogenes [2]. De acordo com a versão mais recente do repositório miRBase [3], existem 700 sequências madura miRNA humanos identificados com o apoio experimental, enquanto alguns estudos computacionais expandir esta lista para mais de 1.000 [3], aproximadamente igualando o número de fatores de transcrição [4] . Estudos computacionais e experimentais também previu que entre 30% e 100% dos genes codificadores de proteínas humanas pode ser sob a regulação pós-transcricional de miRNAs [5], [6]. Não é difícil ver que mesmo utilizando os valores mais conservadores, a rede de regulação induzida por um número tão grande de reguladores e metas é potencialmente muito grande. Além disso, miARNs não actuar isoladamente, mas são parte de uma rede de regulação complexa, envolvendo factores de transcrição, transdutores de sinal e outros tipos de moléculas reguladoras [7]. Reconstruir e analisar tais redes reguladoras é, portanto, um desafio complexo, mas crucial para enfrentar.

Existem

Vários algoritmos para inferir redes reguladoras de dados de expressão [8], [9], [10]. Um dos métodos mais poderosa, especialmente para os organismos eucarióticos, assume uma estrutura modular da rede subjacente de regulação, em que um grupo de genes co-expressa é regulada por um conjunto comum de reguladores (também conhecido como o programa regulador) [10]. O programa regulador utiliza os níveis do conjunto de reguladores de expressão para prever a expressão significativo dependente da condição dos genes co-expressa. Assim, os módulos são constituídos por aglomerados de genes co-expresso juntamente com os seus reguladores associados. Como regulador pode ser associado a mais de um módulo, o conjunto forma uma rede módulo. Nós desenvolvemos recentemente um novo algoritmo que se estende o conceito de rede módulo original da Segal e colaboradores [10], utilizando técnicas de optimização de probabilidade que o estabelecimento de prioridades dos grupos estatisticamente mais significativos de genes co-expressa e seus reguladores candidatos [11], [12]. A principal vantagem deste algoritmo é que ele extrai-centróide soluções como mais representativos de um conjunto de possíveis modelos estatísticos, a fim de evitar soluções subóptimas. Testando-a em vários conjuntos de dados biológicos, temos demonstrado que esta abordagem gera módulos mais coerentes, e que os reguladores consistentemente atribuído a um módulo são mais frequentemente apoiada por fontes externas de dados [11], [12].

no presente estudo, nós adaptamos o nosso algoritmo de rede módulo para tomar como entrada um conjunto de dados heterogénea de ambos os dados de expressão de ARN mensageiro (ARNm) miARN e medida nas mesmas amostras. Vários miRNAs são atribuídos como reguladores alta pontuação candidatos para vários módulos, juntamente com factores de transcrição conhecidos ou transdutores de sinais. Uma análise detalhada dos três módulos, onde miARNs são seleccionados como reguladores de alta pontuação mostra que esta tarefa é altamente coerente com a função módulo e também está suportado por várias fontes de dados externas. Nós também validou um desses módulos experimentalmente, que mostra que a sobre-expressão ou a inibição da miARN atribuído como um regulador altera significativamente a expressão de uma variedade de genes do módulo, confirmando assim a inferência do algoritmo. Esses resultados corroboram módulo de inferência rede como uma abordagem robusta e útil para obter insights mais precisos em função de miRNA.

Resultados

Inferência de uma rede módulo de microRNA a partir de dados de expressão

A lemone algoritmo, começando a partir de uma matriz de dados de expressão e uma lista de candidatos reguladores, irá produzir uma rede módulo, composto por módulos de genes co-expressa e seus reguladores associados. O algoritmo também está agrupando as condições (colunas) para cada conjunto de genes co-expressa, criação de clusters de condição. A lista de reguladores para um determinado módulo é ordenada de acordo com a sua pontuação individual. Esta pontuação só leva em conta a expressão diferencial do regulador através dos diferentes grupos diferentes de condição, e não seu valor absoluto. Desta forma, podemos, simultaneamente, avaliar e comparar mRNA e miRNA reguladores candidatos, utilizando os níveis de cada classe de reguladores de expressão. Como entrada para o nosso algoritmo, foi utilizado um conjunto de dados composto de dados de expressão de medidas em 89 tumor e amostras de tecidos normais (que representam 11 classes de tumor), tanto para 11.833 RNAs mensageiros e 124 miRNAs [13]. Ao contrário das tentativas anteriores [14], [15], [16], a nossa abordagem para a integração dos miRNAs na rede não se baseia na previsão alvo miRNA, ou uma mistura entre a previsão alvo e dados de expressão, mas se baseia exclusivamente em dados de expressão. O algoritmo gerado um conjunto de 76 conjuntos de genes fortemente co-expressa, o que corresponde a um total de 2.987 genes. Calculou-se o enriquecimento GO para todos os módulos [17] e encontrou um total de 44 clusters de ter pelo menos uma categoria GO enriquecido (p 0,05), para um total de 589 categorias enriquecido (a lista completa de módulos e suas categorias GO é disponível como S2 tabela). Para a atribuição dos reguladores, nós compilamos uma lista de 1.841 reguladores de candidatos com base em suas anotações GO (tanto fatores de transcrição ou transdutores de sinais), além de uma lista de 124 miRNAs. Após a atribuição dos reguladores tomamos um corte rigoroso correspondente ao topo 2% interações reguladoras previstos mais significativas (Figura 1), obtendo-se um conjunto final de 294 reguladores únicos (a lista completa dos genes do módulo e reguladores está disponível na tabela S1). Dentro deste conjunto, dez miARNs foram seleccionados como reguladores para um total de sete módulos (Tabela 1). A fim de avaliar a validade ea relevância da rede módulo inferido, nós aqui apresentar uma análise detalhada de três módulos, com ênfase nas características típicas de módulos de regulação miRNA mediadas. Esses módulos foram selecionados com base em seu interesse intrínseco, a coerência funcional e o elevado número de referências da literatura discutindo sua função putativa.

Os histogramas representam a distribuição de distribuídos aleatoriamente (verde) e verdadeiro (amarelo) Reguladores de pontuação para o rede módulo. A seta para os reguladores aleatórios representa a pontuação máxima para os reguladores atribuídos aleatoriamente com o valor indicado entre parênteses. A seta para os verdadeiros reguladores representa o valor de nota de corte, com o valor bruto indicados entre parênteses.

miR-133 e miR-145 são designados como reguladores de um módulo lisa actomiosina muscular

módulo 29 é um pequeno módulo composto por quatro genes reguladores e cinco atribuídos (Figura 2A). The Go categorias sobre-representados para este módulo estão ligados a suavizar o desenvolvimento muscular e estrutura actomiosina (Figura 2a e mesa S2). MYH11 codifica um membro da família lisa cadeia pesada miosina muscular. ACTG2 é uma proteína actina gama 2 encontrados em tecidos entéricos. Os dois outros genes no módulo (mylk e cnn1) são bem conhecidos dos reguladores de interacções actina-miosina. Mylk é a cadeia leve da miosina quinase, uma quinase dependente de cálcio dedicado que fosforila um site específico sobre a cadeia leve reguladora da miosina, aumentando a sua actividade. Mylk é ubíqua em todos os tecidos adultos, com os mais altos valores encontrados nos tecidos do músculo liso [18]. Cnn1 (calponina) é uma proteína de ligação de cálcio, que inibe a actividade de ATPase da miosina do músculo liso. O regulador de topo (PPP1R12B) selecionada para este módulo é uma subunidade miosina fosfatase. A fosfatase de miosina é também um regulador de núcleo bem conhecido da via de actomiosina, a inibição da actividade da miosina [18]. O segundo regulador de alta pontuação candidato é um miARN, miR-133, enquanto que o terceiro regulador é a TGF-beta estimulou clone-22 membro 1 do gene (TSC22D1), que codifica uma proteína do domínio de fecho de leucina, um membro da via de TGF-beta1 que é envolvida na regulação de transcrição. Os últimos reguladores estão ANGPTL2, um fator de crescimento endotelial vascular, e outro miRNA, miR-145.

valores de expressão de genes são codificados por cores, que vão desde azul escuro (baixos níveis de expressão) para amarelo (níveis elevados de expressão) brilhantes . Em cada figura, colunas representam uma amostra diferente. A barra codificada por cor, na parte inferior do gráfico representa a origem de tecidos (ver a legenda), enquanto os quadrados cinzentos abaixo apenas indicar se a amostra de tecido era normal (cinza claro) ou do tumor (cinzento escuro). Os reguladores candidatos são ordenados por valor decrescente pontuação (de cima para baixo). As amostras são agrupados em folhas de valores de expressão homogéneos, de acordo com as árvores hierárquicos indicados no topo de cada figura. As caixas de laranja no direito da figura indicam categorias GO super-representados (p≤0,05).

Os dois miRNAs selecionados como reguladores para este módulo mostram claramente um padrão de expressão fortemente correlacionada positivamente com os genes de módulos ( Figura 2a). Como a maioria dos miRNAs têm sido caracterizados reguladores medida em negativos da expressão do gene, isso sugere uma regulação indireta entre os miRNAs e módulo de 29 genes. Estudos recentes revelam vários genes candidatos prováveis ​​que poderiam atuar como reguladores de intermediários entre os miRNAs e módulo de 29 genes. MiR-133, seleccionado como o segundo melhor regulador para este módulo (Figura 2a), foi recentemente mostrado ser um regulador chave para o desenvolvimento do esqueleto muscular e hipertrofia do músculo cardíaco [19], [20]. Nestes estudos, o miR-133 foi mostrada para regular directamente o factor SRF de transcrição. SRF é reconhecido como um factor vital para as atividades do citoesqueleto e de célula contrátil normais e todos os módulos de 29 genes (

MYH11

,

cnn1

,

ACTG2

,

mylk

) são conhecidos por serem alvos directos de SRF [21]. Esses resultados da literatura suportam a hipótese de uma ligação reguladora indireta entre miR-133a e dos módulos 29 genes via SRF. A maioria dos estudos sobre a actividade SRF, até agora, este factor caracterizado como um activador transcricional [21], mas alguns resultados também sugerem que o SRF pode actuar como um repressor transcricional dos seus objectivos genes [22], [23], [24]. SRF gene mediada repressão não é clara, mas pode envolver o recrutamento por SRF de silenciadores de transcrição [23], [24]. Se a hipótese de que SRF é reprimir a transcrição de genes de módulo 29, então a cadeia de regulação de miR-133 – SRF – módulo 29 genes pode explicar a correlação positiva a expressão do gene que é observado na Figura 2-A. Os outros miARN seleccionados como um regulador, o miR-145 foi recentemente mostrado ser um regulador importante para o destino das células do músculo liso [25]. Este estudo [25] também mostra que o miR-145 está a activar um dos seus alvos directos, o myocardin (Myocd), que é um factor de transcrição conhecido para activar a expressão do gene do músculo liso através da interacção com o SRF [26]. Assim, temos também uma cadeia reguladora miR-145 – Myocd – Módulo de 29 genes que podem explicar o padrão de expressão observado na Figura 2a. Nem SRF nem Myocd são atribuídos como reguladores ou agrupados com os outros genes módulo 29. Infelizmente, o gene myocardin não estava presente nas micromatrizes utilizados para produzir os conjuntos de dados [13]. O perfil do fator de transcrição SRF parece correlacionar-se mal com a expressão de módulo de 29 genes em nosso conjunto de dados (arquivo S1 Data), explicando por que este gene não pode ser selecionado como um regulador. Várias razões podem explicar por que o perfil é divergente, como modificações pós-traducionais ou o fato de que miRNAs actuam ao nível pós-transcricional, possivelmente prevenindo o efeito regulatório a ser detectado (reprimindo a tradução).

MiR -142s são atribuídos como reguladores da resposta imunitária de um módulo

módulo 18 é composto de seis genes (Figura 2b), dos quais cinco imunoglobulinas correspondentes codificam quer para a cadeia pesada (IGHG4, IGHA2, IGHA1) ou para o cadeia leve (IGKV1-5, IGLV3-21), enquanto IGLL1 é a cadeia leve substituto, um componente crítico do complexo receptor de célula pré-B. Não surpreendentemente, encontramos a categoria resposta imune GO sobre-representados para este módulo (Figura 2b e mesa S2). Todos os genes de módulo são conhecidos por ser principalmente expresso em células B em desenvolvimento e maduros, revelando um módulo coerente [27]. Nove reguladores alta pontuação foram selecionados para este módulo. O regulador de topo é um gene homeobox, HOXC5. O gene HMGA1 é selecionado como o segundo melhor regulador para este módulo. Proteínas de alta Grupo de Mobilidade (HMGA) regular a actividade de uma grande variedade de genes, alterando a conformação de DNA dos seus genes-alvo. HMGA1 é conhecido por co-activar a transcrição em células-B e de ser importante para o desenvolvimento de células B [28]. A terceira e quarta reguladores candidatos são dois miRNAs processados ​​a partir do mesmo precursor, miR-142-5p e miR-142-3p. O gene HLA-DRB1 pertence aos paralogues cadeia beta de HLA de classe II. É conhecida por desempenhar um papel central no sistema imunitário através da apresentação de péptidos derivados de proteínas extracelulares [29]. CCL5 é uma citocina quimiotático desempenhar um papel activo no recrutamento de leucócitos para locais inflamatórios [30]. AXL é uma tirosina cinase do receptor que está a transformar em fibroblastos e células hematopoiéticas, e está envolvido no desenvolvimento mesenquimais [31]. CXCL14 é uma pequena citocina pertencente à família quimioquina CXC. Este gene é quimiotáctica para monócitos e pode activar estas células na presença de um mediador inflamatório [32]. expressão CXCL14 é reduzida ou ausente da maioria das células cancerosas [33]. Este módulo está provavelmente ligado a uma resposta imune desencadeada por diversos estados tumorais. Tais respostas imunes pró-tumorais persistentes são conhecidos para potenciar o desenvolvimento do tumor primário e progressão maligna.

miR-142s são preferencialmente expressos em tecidos hematopoiéticos e a sua expressão é regulada durante a hematopoiese, sugerindo um papel na diferenciação de células imune [34 ]. O TCF12 factor de transcrição é previsto como um alvo para miR-142-3p [35]. Num estudo anterior, uma dosagem combinada dos factores de E2A, E2-2 e TCF12 foi demonstrado ser necessário para o desenvolvimento de células B normais. Mais precisamente, TCF12 é importante para a geração de números normais de células B-pro [36]. Porque módulo de 18 genes são expressos no desenvolvimento de células B, a regulação da TCF12 por miR-142-3p pode ser importante para este processo. Além disso, encontramos conservado motivos de ligação para TCF12 para a maioria dos módulos de 18 genes (arquivo de S1 de Dados), que indica que este fator de transcrição pode ser importante para a sua regulamentação. Como para o módulo 29 e SRF, o perfil dos TCF12 expressão é altamente divergentes a partir dos perfis de módulos de 18 genes de expressão, explicando por que este gene não foi selecionada como gene módulo ou regulador (dados não mostrados).

Mir- 200a é um regulador chave de um módulo envolvida na homeostase

epiteliais

módulo 25 é constituído por nove genes (Figura 2C). SCNN1A (também conhecido como ENaC) é a subunidade alfa do canal de sódio sensível à amilorida epitelial, expresso em muitos tecidos epiteliais [37]. PRSS8 (prostasina) é um tripsinogénio que regula a actividade do canal de sódio epitelial [38]. FDXY3 é uma proteína de membrana pequena que é altamente transcrito em tecidos, tais como útero, estômago e cólon, e pode funcionar como um regulador do canal de Na /K [39]. TACSTD1, o transdutor de sinal de cálcio associado a tumor 1, funciona como uma molécula de adesão celular independente de cálcio [40]. Outros genes como ATAD4 ou TMEM63A são proteínas trans-membrana de função desconhecida. RAB25 é uma pequena proteína de ligação ao GTP. proteínas Rab ter sido envolvido na regulação do tráfego de vesículas [41]. O regulador módulo superior é miR-200a. Em relação aos outros reguladores, PPP1R1B é uma fosfoproteína regulada por cAMP e da dopamina, e é um inibidor da proteína fosfatase 1. Para além do seu papel bem conhecido no sistema nervoso central, que é altamente expressa em uma variedade de tecidos epiteliais onde poderia desempenham um papel na sinalização de células epiteliais e a tumorigénese [42]. GPR30 é um trans-membrana proteína G acoplada do receptor de estrogénio [43], enquanto PTGER3 é um receptor de proteína G acoplado a prostaglandina E2 que está envolvido em vários processos fisiológicos e foi mostrada para afectar as concentrações intracelulares de Ca ++ e cAMP [43]. ZNF157 é uma proteína de dedo de zinco de função desconhecida, enquanto GNB3 e GNG5 são subunidades G proteínas envolvidas na transdução de sinal. A partir das funções destes genes, podemos concluir que a maior parte do módulo de 25 genes e reguladores provavelmente estão envolvidos na homeostase epitelial, embora nós não encontrou qualquer categoria GO especial enriquecida para este módulo. Também é importante notar que vários desses genes estão relacionados com a progressão do tumor [40], [41], [44].

miR-200a, que foi escolhido como o melhor regulador candidato para o módulo 25, é um membro de uma família de cinco miARN miARNs estreitamente relacionados (miR-200a, miR-200b, miR-200C, o miR-141 e miR-429). Publicações recentes mostram a expressão específica do epitélio do miR-200a e miR-200B [45], [46]. Nós preparámos uma série de experiências para validar o papel de miR-200a como um regulador da expressão de genes no módulo 25. miR-200a foi introduzido numa linha celular de cancro humano de mama epitelial diferenciado MDA-MB-231, conhecido expressam de forma aberrante baixos níveis de miR-200a. A expressão de seis genes (

RAB25

,

IRF6, SCNN1A, PRSS8, ATAD4

,

TACSTD1

) dos nove pertencentes ao módulo 25 foi monitorada através de RT-qPCR ( A Figura 3). Sem exceção, os seis genes monitorados mostram uma clara aumento da regulação sobre a expressão exógena de miR-200a (Figura 3a). A experiência inversa, a inibição de alguns membros da família de miR-200 (miR-200a, b, c) nas células MDA-MB-231 utilizando antagomirs, resultou na diminuição da regulação significativa de quatro dos cinco genes testados, (

SCNN1A

não é significativamente regulada para baixo,

ATAD4

não é expressa em condições normais nesta linha celular) (Figura 3b). Estes resultados mostram claramente que o miR-200a é um regulador central do módulo 25, mais provavelmente, com os outros membros da família de miR-200.

(a) a análise de PCR quantitativo em tempo real (RT qPCR) da expressão de módulo 25 genes

RAB25

,

IRF6,

SCNN1A,

PRSS8

,

ATAD4 e TACSTD1

e sobre a sobre-expressão de miR-200a no MDA células MD-231 (média ± desvio padrão). O eixo y representa o valor da expressão de ARNm relativa. miR-1 foi usado como controlo (Ctrl), uma vez que não é conhecida para qualquer alvo dos genes monitorados (b) Análise de RT qPCR da expressão relativa para os genes de

RAB25

,

IRF6

,

SCNN1A

,

PRSS8

e

TACSTD1

em células MDA-MB-231 infiltradas com miR-200a, b, c antagomirs. O eixo y representa o valor da expressão de ARNm relativa (média ± desvio padrão). miR-1 foi usado como controlo (Ctrl) (c) Análise de RT qPCR dos níveis de expressão relativa de genes módulo 25

RAB25, IRF6, SCNN1A, PRSS8, ATAD4, TACSTD1, TMEM63A

e

FXYD3

em células MDA-MB-231 onde

ZEB1

é derrubado. O primeiro barplot (preto) mostra a repressão eficaz de

níveis ZEB1

por transfecção com o

ZEB1

específica siRNA. Par = cultura de células parental, Mock = transfecção simulada, si-ZEB1 = transfecção com o ZEB1 siRNA específico.

Neste módulo, observamos novamente um padrão de clara correlação positiva entre o miR-200a eo módulo expressão dos genes, o que sugere um circuito de regulação indirecta entre o miR-200a e o módulo 25 genes (Figura 2c e na Figura 3A e 3B). trabalho experimental recente mostrou que os membros da família miR-200 alvejar diretamente os fatores de transcrição ZEB1 e ZEB2 [47], [48], [49]. Estes fatores de transcrição são conhecidos como grandes repressores de transcrição de diferenciação epitelial orquestrar a transição epitelial mesenquimal (EMT) [50]. EMT é um processo que conduz a células epiteliais de um fenótipo polarizada a uma alta motilidade fenótipo mesenquimal, não polarizada e se sabe que ocorre em tumores epiteliais que dão origem a células cancerosas extremamente malignas. Os fatores de transcrição ZEB ter sido funcionalmente relacionados aos membros da família miR-200 por meio de um ciclo de feedback negativo dupla, promovendo, assim, EMT e câncer invasão [47], [51], [52]. Encontramos conservado motivos de ligação ZEB para várias módulo de 25 genes (arquivo S1 Dados), sugerindo que fatores Zeb poderiam ser os reguladores intermediários entre miR-200 e módulo de 25 genes. Para testar esta hipótese, foram regulados negativamente o factor de transcrição ZEB1 em MDA-MD-231 com um siRNA específico, enquanto o controlo da expressão de genes de oito módulo 25 (Figura 3C). Todos os genes apresentaram um padrão sobre-regulação forte, com a excepção de o gene RAB25 (Figura 3c). Esses resultados demonstram que o factor ZEB1 é essencial para a regulação dos genes do módulo 25. Tomados em conjunto, os nossos resultados experimentais (Figura 3) sugerem fortemente a existência de uma cadeia de regulação entre o miR-200 e o módulo 25 genes através do factor de transcrição ZEB1 (Figura 4). Como tanto o miR-200 e ZEB1 desempenham papéis importantes na EMT [47], [48], [49], [51], [52] que a hipótese de que o módulo 25 repressão pode contribuir para o processo de EMT maligna em células cancerosas.

MIR-200 genes reprimir fatores Zeb, que por sua vez reprimem a expressão de módulo de 25 genes. A luz amarela indica genes designados como reguladores, a luz verde indica genes módulo enquanto a luz laranja indica genes não atribuído como reguladores, mas apoiado pela literatura (regulação indireta). Este modelo regulatório apoiar a correlação positiva dos padrões de expressão entre mir-200a e módulo de 25 genes.

Discussão

MiRNAs surgiram há pouco tempo como uma camada nova e importante de regulação. A maior parte dos estudos até agora têm-se centrado na sua identificação e na detecção dos seus alvos. Vários estudos experimentais demonstraram que pelo menos alguns deles desempenham papéis fundamentais em várias vias de desenvolvimento e celulares. Integrando miRNAs em redes de regulação é, portanto, de fundamental importância e que deve ser feito tendo em conta os outros tipos de moléculas regulatórias. Até o momento, poucos estudos têm proposto uma estratégia computacional para inferir redes módulo miRNA mediadas [14], [15], [16]. Estes foram baseados, principalmente, em previsão de miARN alvo, ou de uma combinação de predição alvo e dados de expressão. Temos aplicado um algoritmo de inferência rede módulo robusto e imparcial para um conjunto de dados de expressão relacionada com o cancro de ambos os mRNAs e miRNAs. Na nossa abordagem, miARNs foram considerados como candidatos reguladores, em conjunto com outros tipos de reguladores, como factores de transcrição e transdutores de sinal. Mesmo depois de aplicar um corte rigoroso, vários miRNAs foram retidos como alta pontuação, estatisticamente reguladores candidatos significativas para vários módulos. Através de uma análise aprofundada de três desses módulos, mostramos que a atribuição de miRNAs específicos como reguladores é apoiado por várias fontes externas e é funcionalmente coerente. Além disso, podemos mostrar experimentalmente que um miRNA, designado como o melhor regulador, é de fato um regulador chave para a expressão de genes do módulo. O número de miARNs atribuídos neste estudo (10) pode parecer bastante modesto, mas este número deve ser avaliada em relação ao número total de miARNs para o qual a expressão foi medido nas amostras (124). O rácio atribuído por número total de miARNs é igual a 8%, enquanto que o mesmo valor da relação é de 15% para os factores de transcrição do conjunto mais transdutores de sinal (284/1841). Os dois valores da relação são comparáveis ​​e, portanto, podemos razoavelmente esperar um maior número de miRNAs atribuídos quando um aumento da cobertura da expressão paisagem miRNome estarão disponíveis.

No entanto, assim como com outros métodos semelhantes, o cuidado tem que ser levado para a interpretação do modelo regulatório inferido. Em particular, a correlação da expressão do gene pode não indicar sempre uma interação direta. De fato, para os três módulos que têm investigado em detalhes, descobrimos uma via regulação indireta entre o regulador e os genes do módulo. Além disso, nenhum destes genes reguladores indirectos foram atribuídos pelo algoritmo no programa de regulação ou mesmo agrupados com os genes do módulo. Como pudemos mostrar para o módulo 29 e o fator SRF transcrição, a razão é porque os reguladores perfil de expressão indireta diferir significativamente daqueles dos genes do módulo. Várias razões podem explicar esta divergência, por exemplo, o regulamento poderia acontecer ao nível pós-transcricional, ou pode ser o resultado de modificações pós-traducionais. reguladores indiretos pode, claro, complicar a interpretação dos resultados, mas eles são de se esperar, especialmente em organismos eucarióticos superiores, onde são esperados redes de regulação a ser mais complexa [53].

No seu conjunto, os nossos resultados mostram que o romance percepções pode ser adquirida a partir de uma análise de rede módulo robusto de miRNA e mRNA de dados expressão e apoiar a visão de que pelo menos alguns miRNAs têm um papel chave na regulação de processos celulares importantes. A nossa abordagem tem também a vantagem de proporcionar uma vista directa de modificações pós-transcrição através da integração de miRNAs, onde a expressão de mRNA por si só pode não ser suficiente para revelar a existência de interações reguladoras. Todos os três módulos para a qual fizemos uma análise detalhada neste estudo têm cada um conjunto coerente de genes, envolvidos no mesmo processo e função. Além disso, ligando miRNAs para módulos coerentes, acreditamos que esta abordagem pode ajudar a elucidar a função miRNA e poderia conduzir de forma eficiente trabalho experimental para a identificação de componentes reguladores-chave em diversos processos. Com a rápida proliferação de várias técnicas para medir com alta precisão os níveis de expressão de centenas de miRNAs, ea disponibilidade concomitante de dados de expressão de mRNA, será altamente atraente para aplicar estratégias computacionais como o que descrevemos aqui para expandir nosso conhecimento em redes globais de regulamentação.

Materiais e Métodos

conjuntos de dados de expressão

Foi utilizado um normalizadas dados de expressão de câncer definidos previamente publicado [13]. Foram realizadas etapas de filtragem adicionais para melhorar a qualidade do conjunto de dados de entrada. Conjuntos de sondas sem identificadores de genes Ensembl conhecidas foram descartados, bem como sequências de miARN que não foram anotados como miARNs humanos na versão mais recente miRBase [3]. A matriz de dados final continha 11.833 genes e 124 miRNAs, para o qual a expressão foi medida através de 89 amostras que abrangem 11 classes de tumores diferentes.

Módulo de inferência rede

Foi utilizado o algoritmo lemone para inferir a rede módulo [11], [12], [54]. Num primeiro passo, o algoritmo está à procura de uma partição de genes em aglomerados de genes co-expressa. Num segundo passo, o algoritmo define um programa regulador (um conjunto de genes reguladores) para cada grupo.

Deixe uma resposta