PLOS ONE: miRNA-RNAm de correlação da rede Módulos no câncer de próstata humano e as diferenças entre primários e metastáticos do tumor Subtypes

Abstract

Os estudos recentes mostraram a contribuição de miRNAs a patogênese do câncer. O câncer de próstata é o câncer mais comumente diagnosticado em homens. Ao contrário de outros tipos principais de cancro, nenhum gene foi identificado como sendo mutado na maioria dos tumores da próstata. Isto implica que a caracterização de genes, incluindo os miARNs não codificantes expressão, pode variar substancialmente ao longo dos casos individuais deste cancro. A variabilidade dentro de cada classe torna possível reconstruir ou inferir correlação miARN-ARNm específica da doença e as redes modulares reguladoras usando dados de microarranjos de alta-dimensionais de amostras de tumor de próstata. Além disso, uma vez que miARNs e genes supressores de tumores são geralmente tecido específico, os módulos de miARN-ARNm poderia potencialmente diferem entre o cancro da próstata primário (PPC) e cancro da próstata metastizado (MPC). Nós aqui realizado um

in silico

análise para explorar os módulos de rede correlação miRNA-RNAm nos dois subtipos de tumor. Nossa análise identificou 5 miRNA-RNAm pares de módulos (MPs) para PPC e MPC, respectivamente. Cada MP inclui um módulo de conexão positiva (correlação) e um módulo de conexão negativa (correlação). O número de miARNs ou ARNm (genes) em cada módulo varia de 2 a 8 ou, de 6 a 622. Os módulos descobertos para PPC são mais informativos do que aqueles para os MPC em termos das perspectivas biológicos implicados. Em particular, um módulo de conexão negativa no PPC se encaixa bem com a teoria da regulação pós-transcricional mediada por miRNA popularmente reconhecido. Isto é, as sequências 3’UTR dos mRNAs envolvidos (~620) são enriquecidas com os motivos do sítio alvo dos 7 miARNs modulares, tem-miR-106, -191, -19b, -92a, -92b, -93, e -141. Cerca de 330 GO termos e vias KEGG, incluindo via de sinalização TGF-beta que mantém a homeostase do tecido e desempenha um papel crucial na supressão da proliferação de células cancerosas, estão sobre-representados (adj.p 0,05) na lista gene modular. Estes módulos computacionalmente identificados fornecer evidências biológicas notável para a interferência de miRNAs no desenvolvimento de cancros da próstata e garante o acompanhamento adicional em estudos laboratoriais independentes

Citation:. Zhang W, Edwards A, Fan W, Flemington EK, Zhang K (2012) miRNA-mRNA de correlação da Rede Módulos no cancro da próstata humana e as diferenças entre os subtipos de tumores primários e metastáticos. PLoS ONE 7 (6): e40130. doi: 10.1371 /journal.pone.0040130

editor: Lorenzo Chiariotti, Università di Napoli Federico II, Itália |

Recebido: 19 Março, 2012; Aceito: 01 de junho de 2012; Publicado: 29 Junho 2012 |

Direitos de autor: © 2012 Zhang et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Research relatou nesta publicação foi apoiado pelo National Institutes of bolsas de Saúde (NIGMS P20GM103424, NCRR-RCMI 5G12RR026260-03), um prêmio de Louisiana BOR (LEQSF (2008-11) -RD-a-32), um departamento da concessão do Exército dos EUA (W911NF -12-1-0066) e uma subvenção de NSF (EPS-1006891). Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:. Embora o Dr. Wei Fan é afiliado com IBM T. J. Watson Research, isso não altera a adesão dos autores para todos os PLoS ONE políticas em dados e materiais de compartilhamento.

Introdução

Os microRNAs (miRNAs) são curtos (~

22nt

), ARN de não codificação derivadas de precursores de haste em ansa codificadas pelo genoma. Como os cruciais reguladores pós-transcricional da expressão gênica em metazoários, miRNAs ligam principalmente para as sequências UTR 3 ‘de RNA mensageiro (mRNA), geralmente resultando em repressão translacional ou degradação mRNA [1], [2]. Estima-se que ~ 30% de genes codificadores de proteínas humanas são regulados por miARNs, onde cada miARN alvo pode transcritos aproximadamente 200 e mais de um miARN pode convergir para um único ARNm alvo [2], [3]. Numerosos estudos têm demonstrado que a expressão aberrante miRNA

s Quais são susceptíveis de contribuir para doenças humanas, incluindo câncer [4], [5], [6], [7], [8], [9]. No entanto, estes pequenos RNAs não poderia ser o “câncer-drivers” [10] na maioria dos casos de cancro, porque as evidências para as suas mutações em células sematic ainda são relativamente raros [11], [12]. Isto indica que miARNs podem eles próprios ser regulada por outras moléculas, tais como factores de transcrição [13] e, por sua vez, desempenham papéis cooperativamente na progressão da doença por meio da amplificação ou a redução do impacto das aberrações que ocorrem em proto-oncogenes e genes supressores de tumor. Tem sido reconhecido que a interferência de miARNs com tumorigénese é bastante complicado e necessita de ser analisada por abordagens de biologia de sistemas baseados em rede.

Até à data, um número de algoritmos foram desenvolvidos para inferir módulos miARN-ARNm ou redes modulares usando a informação do genoma de transcrição e uma sequência de afinidade [14], [15], [16], [17]. Apesar dos diversos modelos algorítmicos e complexidades computacionais, os regimes de fluxo desses métodos são bastante explícitas e as definições de um módulo de miRNA-RNAm carregam características semelhantes. Um módulo básico é geralmente constituído por um conjunto de genes codificadores de proteínas co-expressas e um miARN que é significativamente correlacionados com estes genes no nível de expressão, ou é um preditor de topo (entre outros reguladores) para as árvores de classificação ARNm-set-determinada das amostras biológicas /”condições” [18], [19], [20]. Tal tipo de um-para-muitos de módulo pode então ser refinado em um módulo de regulação canónica miARN-ARNm onde as expressões de miARNs e mRNAs estão em relação inversa, e os motivos de sequências complementares para sementes dos miARNs existir nas 3’UTRs dos genes alvo (mRNAs). Dois ou vários módulos de um-para-muitos podem ainda ser combinados em um módulo de muitos-para-muitos, identificando suas interseções [16].

O câncer de próstata é o câncer mais comumente diagnosticado ea segunda principal causa de mortalidade por câncer em homens americanos. Todos os anos, mais de 200.000 novos casos são diagnosticados e mais de 30.000 homens adultos morrer desta doença [21]. desfecho fatal, muitas vezes ocorre quando a infiltração local do tumor se espalhou além da próstata e metástase para gânglios linfáticos e outros órgãos. Ao contrário de outros grandes tipos de cânceres, a etiologia genética do câncer de próstata é bastante complexo e heterogêneo. Nenhuma mutação de um único gene tenha sido identificada na maioria dos tumores da próstata [12], [22], [23]. Isto implica que o perfil de expressão de genes, incluindo miARNs não codificadoras, pode variar substancialmente ao longo dos casos individuais em diferentes estágios ou subtipos do cancro da próstata. A variabilidade intra-classe, ou seja, a variabilidade principalmente devido às diferenças intrínsecas no mecanismo genético molecular entre indivíduos amostrados da mesma classe, faz com que seja possível reconstruir ou inferir a doença correlação específica e redes de regulação (Modular) usando os dados de alta dimensão microarray de amostras de tumor de próstata. Em particular, porque miARNs e genes supressores de tumores são geralmente tecido específico [23], [24], os módulos de miARN-mRNA diferem entre potencialmente cancro da próstata primário (PPC) e cancro da próstata metastizado (MPC). Nosso estudo, assim, iniciado a partir desta percepção e centrada no

in silico

identificação e comparação de módulos de miRNA-RNAm em PPC e MPC. Um banco de dados abrangente lançado recentemente [12] forneceu-nos as informações necessárias para uma tal investigação bioinformática. Os resultados obtidos proporcionam uma visão biológica notável na interferência de miARN no desenvolvimento de cancros da próstata. A Figura 1 resume o esquema do nosso fluxo de trabalho, e os detalhes de cada etapa são descritos nas seções Resultados e método.

Antes de decomposição, os coeficientes de correlação de Pearson foram transformadas com o método r-z de Fisher. A1 /B1 /C1: os resultados obtidos a partir do cancro da próstata primário (PPC) amostras. A2 /B2 /C2: os resultados obtidos a partir das amostras de cancro da próstata metastizado (MPC). A3 /B3 /C3:. Os resultados obtidos a partir de uma estrutura de dados aleatórios gerados por baralhar a matriz de PPC

Red: os melhores correlações positivas de 1%. Amarelo: o 1% correlações negativas. Laranja:. Pseudo ou correlações unconsidered

Red: os melhores correlações positivas de 1%. Amarelo: o 1% correlações negativas. Laranja:. Pseudo ou correlações unconsidered

Resultados e Discussão

SVD Análise de miRNA-mRNA Interação Matrizes

Antes de inferir os módulos de rede miRNA-RNAm para PPC e MPC, procurou-se obter uma compreensão geral das diferenças entre essas duas matrizes de correlação calculados a partir dos níveis das amostras de tumores primários e metastáticos miRNA /expressão de mRNA, respectivamente (veja a seção Método para detalhes). No entanto, devido ao enorme número de potenciais relações de regulação ou co-expressa miARN-mRNA e a interacção complexa entre eles, juntamente com os ruídos introduzidas no processo de amostragem e de medição, a comparação aos pares dos elementos da matriz correspondente foi também trivial para alcançar uma conclusão. Nós contornado este obstáculo, empregando um método inovador. Mais especificamente, nós tratamos cada matriz de correlação como um conjunto de dados pseudo com as linhas (mRNAs) como “observações” e as colunas (miRNAs) como “características” e caracterizou-o através da realização de análise de SVD (decomposição singular do valor) [25], [ ,,,0],26], [27], [28]. Considerando os valores de coeficientes de correlação foram na gama de [-1, 1], que transforma as entradas da matriz e utilizando o método de Fisher RZ antes da decomposição de modo que os resultados podem ser explicados pela teoria estatística padrão.

os valores de p ordinárias foram ajustados com o método de BH.

A sub-rede foi extraído para módulos

p-module-5-ne (MA)

. Todas as conexões, exceto para os relacionados com a E2F5 são negativos. Sinal + indica que pelo menos um motivo de miARN alvo local existe na sequência de UTR 3 ‘do ARNm ligado (gene).

. Os genes que têm conexões negativas com os miRNAs na rede modular são sombreadas com vermelho. CDKN1A Gene (embora não na lista gene módulo) também é protegido com vermelho por causa das correlações negativas significativas (p 0,001), com HSA-miR-93, -106b e -200C ao nível da expressão. Genes E2F5, MYC (cMyc) e CDK4, demonstrando um padrão aparente de correlações de transcrição positivos com os miRNAs modulares (Figura 9), são sombreadas com amarelo.

O número apresentado em cada célula é o p -valor da correlação para o miRNA correspondente e mRNA (gene).

Esta análise levou a duas conclusões interessantes. Em primeiro lugar, tanto para PPC e matrizes de correlação MPC, o fator latente levando consigo explicar mais da metade da variação dos dados (Figura 2-A1, A2), e as pontuações (no primeiro vetor singular esquerda) em todo genes (Figura 2 B1,-B2) apresentam uma distribuição de dois picos claros. Em segundo lugar, a matriz de PPC difere da matriz MPC por um segundo factor latente substancial que explica ~ 20% da variância e tem uma pontuação assimétrica (no segundo vector singular esquerda) de distribuição (Figura 2-C1), que se desvia da simétrica contraparte para MPC (Figura 2-C2). A força desta análise é ainda mais realçada pelo facto de os padrões observados não estão presentes em um conjunto de dados aleatórios definidos como mostrado na Figura 2-A3, B3 e C3, em que a análise foi realizada em SVD uma matriz gerada por baralhar as linhas e colunas da matriz PPC. Embora as implicações biológicas precisa ser mais investigada, essas descobertas preliminarmente confirmada a hipótese inicial de que a interferência dinâmica de miRNAs nesses dois tipos de câncer de próstata pode ser maior exploração diferente e vale a pena.

É interessante notar que, na preparação Figura 2, utilizou-se a informação de 58 miARNs cancerosas recolhidas em [7]. No entanto, os resultados apresentados em grande parte, realizada quando a análise DVS foi realizado sobre a totalidade do conjunto de dados (matrizes). Além disso, reconhecemos que as diferenças entre a PPC e MPC pode ser determinada por um conjunto de miRNAs. Este baseia-se na percepção de uma análise adicional que mostrou que os padrões demonstrado na Figura 2 também realizada sobre as submatrizes com apenas os miARNs supressores de tumores, mas não sobre os sub-matrizes contendo os oncogenes miARNs exclusivamente. Vamos continuar a investigar este problema em futuras pesquisas.

miRNA-mRNA módulos em diferentes subtipos do cancro da próstata

Dois miRNA-mRNA redes (PN e MN) foram gerados por um método baseado na correlação para PPC e MPC, respectivamente. A fim de concentrar a análise sobre os miRNAs relacionadas com o cancro, as dimensões da PN e MN foram ainda mais reduzidos, tal como apresentado na seção Método. Com as redes condensadas como entradas, principais módulos do miRNA-RNAm relacionadas ao câncer foram identificados por um algoritmo baseado em análise de agrupamento. Dentro de um módulo individual, cada um miARN ou ARNm tem pelo menos duas ligações com os mRNAs correspondentes ou modulares miARNs.

Tal como resumido na Tabela 1, Figura 3 e Figura 4, foram identificados 5 miARN-ARNm do módulo de pares (MPs ) para PPC e MPC, respectivamente. Cada MP inclui um módulo de conexão positiva (correlação) e um módulo de conexão negativa (correlação). O número de miARNs ou ARNm (genes) em cada módulo varia de 2 a 8 ou, de 6 a 622. A maior parte dos módulos de conter o factor de transcrição de ligação a DNA específica de sequência (TF) os genes [29] que podem ter funções como mediadores para as ligações de miARN-ARNm. Os dois membros (tais como

p-modu-1-ps e

p-modu-1-ne

em PPC) de cada MP contêm os mesmos miRNAs mas diferentes mRNAs. Dois módulos de MPs distintas (tais como

p-modu-1-ps

e

p-modu-2-ps em PPC) consistem em diferentes miRNAs e variada (ou parcialmente sobreposta) mRNA conjuntos. Dentro de um módulo de conexão positivos, ou negativos (com “

-ps

” ou “

-ne

” extensão no IDs), as correlações dos miRNAs envolvidos e mRNAs nos níveis de expressão são consistentemente positivo ou negativo. Independentemente do tipo de ligação, o ARNm definida em cada módulo imita em grande parte um agrupamento de genes de co-expressa. Além dos quatro módulos das duas MPs (

p-modu-3-ps

(

-ne

) e

m-modu-4-ps

(

-ne

)) em que a maioria dos miARNs pertencem à família let-7, os módulos para MPC dificilmente se sobrepõem com os módulos para PPC em termos dos miARNs envolvidos (Tabela 1) e os genes codificadores de proteínas (Tabela S1). conhecimentos avançados sobre as diferenças entre PPC e MPC pode ainda ser inferida por uma análise das implicações biológicas dos módulos identificados.

Aqui temos de salientar que os módulos identificados não são necessariamente os módulos regulatórios canônicas em que todas as ligações entre miARNs e genes são determinadas pelas relações causais regulador-alvo [30]. Na verdade, devido ao problema não resolvido em reconhecer com precisão os locais alvo de miRNA [2], é um desafio para identificar um módulo de regulamentação canônica não trivial e exato. No entanto, podemos esperar encontrar um módulo de regulação menos rígida, chamada de “semi-canônico” além do módulo de regulação, em que a relação potencialmente determinada pelo mecanismo de degradação mRNA miRNA-mediada é predominante entre as conexões miRNA-RNAm. Baseado nesta teoria amplamente aceite, módulos reguladores semi-canónicos, se existir, deve estar entre os módulos de ligação negativa, e, em seguida, pode ser determinada pela análise de alvo de enriquecimento. Fizemos esta exploração, estabelecendo a matriz sequência de afinidade miRNA-mRNA e conduzir o teste exato de Fisher (consulte a seção Método). Como resultado, verificou-se que

p-modu-5-ne

, um módulo identificado para PPC, foi o único módulo de semi-canônico, onde as sequências 3’UTR dos envolvidos 622 mRNAs foram significativamente enriquecido (p 1.0E-4) com os motivos no local alvo dos 7 miRNAs modulares (HSA-miR-106b, -200C, -19b, -92a, -92b, -93 e -141) (Figura 5). Este módulo, por conseguinte, representa a diferença mais significativa entre o PPC e MPC em termos das correlações miARN-ARNm observados. Ele sugere que a regulação pós-transcricional mediado pelos miRNAs câncer documentados contribuir diretamente para a variabilidade dos genes codificadores de proteínas através das amostras de tumores para PPC, mas não para MPC expressão.

As implicações dos módulos identificados precisa para ser ainda mais inferida através das anotações funcionais dos genes modulares, uma vez que existe um grande interesse biomédico para elucidar as relações entre a actividade da miARN modulares, como reguladores ou biomarcadores, e a variabilidade dos processos biológicos específicos. Usando o banco de dados David [31], descobrimos que mais de 330 GO termos e vias KEGG, incluindo a via de sinalização TGF-beta, foram sobre-representados (BH adj.p 0,05) com os 622 genes do módulo de semi-canônica

p-modu-5-ne

. Os genes dentro de outros módulos individuais também demonstrou a similaridade funcional significativa. Por exemplo,

m-modu-4-ne

, um módulo de conexão negativa descoberto pela MPC, foi enriquecido com os genes da GO: 0007186~G proteína-proteína acoplada via de sinalização (BH adj.p = 1.14E-40). Tabela S2 resumidos os resultados da análise de enriquecimento funcionais dos genes modulares.

Também examinamos as diferenças entre estes dois subtipos de câncer de próstata através do estudo do perfil distributivo das vias KEGG sobre-representados no conjunto de genes modular individual. Como mostrado na Figura 6, o módulo de

P-Modu-4-PS Compra de PPC é único entre os módulos identificados sobre as funções dos genes modulares. Cerca de duas dezenas das vias, tais como diabetes mellitus tipo I, estão sobre-representados em sua lista de gene ea maioria deles estão relacionados ao processo da doença e /ou resposta imune. Três miRNAs (HSA-miR-146a, -150 e -223) estão incluídos neste módulo. O envolvimento de miR-146a na resposta imune tem sido amplamente investigada. [32] mostrou que o miR-146a é um modulador de IL-2 e a morte celular induzida por activação em linfócitos. [33] relatou que medeia um circuito inflamatória na doença de Alzheimer e sublinhou células cerebrais humanas. Um outro estudo [34] também demonstraram que HSV-1 infecção em células do cérebro humano podem induzir a expressão de miR-146a. Aparentemente, esses achados não apenas indicam que miR-146a tem um papel funcional na resposta imune como um fator de regulação, mas também sugerem que a sua atividade dinâmica (expressão), em alguns contextos específicos, pode apenas servir como o passageiro da doença e /ou processos imunes [10]. Esta é exatamente a principal mensagem transmitida pelo módulo

p-modu-4-ps

onde as correlações positivas entre os miRNAs modulares e genes não poderia ser simplesmente explicada por um mecanismo regulador-alvo.

receptores olfativos (RUP) são expressos não apenas nos neurônios sensoriais do epitélio olfativo, mas também em vários outros tecidos onde as suas funções potenciais são em grande parte desconhecido. Numa publicação recente, os autores relataram que a activação de um receptor olfactivo (PSGR) inibe a proliferação de células de cancro da próstata [35]. Os resultados de nossa análise mostrar que a transdução olfatória (pathway) é sobre-representados na lista gene de 4 módulos principais (

m-modu-2-ne

,

m-modu-3-ne

,

m-Modu-4-ne

,

m-Modu-5-ne

) em MPC (Figura 6). Os miRNAs envolvidos incluem hsa-miR-200a /-200b, hsa-miR-15a /26a /29c, hsa-miR-7a /-7e /-7f /-98, e hsa-miR-107 /-26b. Embora o miRNA definido em

p-modu-3-ps (-ne)

em grande parte sobreposta com isso em

m-modu-4-ne

, nenhum módulo em PPC tem uma relação funcional com condução olfativo. Por isso, especula-se que a ativação de PSGR ea associação (direto ou indireto) com miRNAs são apenas confinado à MPC.

Focal-quinase de adesão (FAK) é um importante mediador para a sinalização do fator de crescimento, a proliferação celular , a sobrevivência das células e a migração celular. modelos de ratos têm mostrado que a expressão de FAK é aumentada em tumores humanos [36]. Um estudo recente demonstrou que a adesão focal controla o cancro da próstata progressão [37]. Neste estudo, descobrimos que miRNAs interferir na transdução da sinalização de FAK, portanto, pode assumir papéis no desenvolvimento do câncer. Como mostrado na Figura 6, de adesão focal (em conjunto com 6 vias KEGG relacionados, tais como a interacção receptor-ECM) é sobre-representados nas listas de genes de 3 módulos principais identificados para PPC (

P-Modu-1-PS

,

p-modu-2-ps

,

p-modu-5-ne

). Em frente aos casos de transdução olfativa para MPC, a associação de por um FAK algoritmo de agrupamento hierárquico sinalizando com miRNAs parece limitada a PPC. Estes resultados indicam outra grande diferença entre os dois subtipos de câncer. investigação experimental sobre esta questão poderia ser promissora para o diagnóstico de câncer de próstata.

Interferência Potencial de miRNAs em TGF-beta via de sinalização

O fator transformador de crescimento beta (

TGF

beta

) mantém a homeostase do tecido e desempenha um papel crucial na supressão da proliferação de células de câncer [23], [38]. Como mencionado acima, o TGF-beta via de sinalização é sobre-representados no conjunto de genes (RNAm) do módulo de regulação semi-canônica,

p-modu-5-ne

. Dos 622 genes modulares, uma dúzia deles codificam proteínas na via. Estes 12 genes demonstrar 56 negativos-conexões com os 7 miRNAs modulares, e quase um terço das conexões são compatíveis com os potenciais relações regulador-alvo determinado pelas informações sequência de afinidade (Figura 7). Com base nesta constatação e as teorias descrito em [23] (páginas 198-224), geramos um modelo hipotético (Figura 8) mostram que a interferência dos miARNs modulares com a sinalização de TGF-beta e a proliferação de células cancerosas. Na Figura 8, os genes negativamente correlacionada com a miARNs na rede modular são destacadas em vermelho. Gene CDKN1A também está marcado em vermelho por causa de suas correlações negativas significativas (p 0,001), com HSA-miR-93, -106b e -200C ao nível da expressão. Genes E2F5, cMyc (MYC) e CDK4 mostram um padrão aparente de correlações de transcrição positivos com os miRNAs modulares e são destacadas em amarelo. As relações apresentados na Figura 8 sugerem que os miARNs modulares interferir com o processo da doença do cancro da próstata por um mecanismo primário oncogénica nas amostras PPC medidos. Mais especificamente, a expressão dessas miARNs inversamente regula a intensidade da transcrição de dois genes GF-beta, e TGFBR1 TGFBR2, e um gene de supressão de cancro Smad3. Em seguida, através da activação ou inactivação do Smad4 /complexo Smad2-3 /E2f, este efeito é reflectido sobre os níveis de CDKN1A e cMyc, expressão e finalmente influencia a inibição da paragem do ciclo celular e a proliferação celular.

Expressão variabilidade dos miRNAs no módulo

p-modu-5-ne

Como discutido acima, no

p-modu-5-ne

, os miRNAs identificados regulam diretamente a transcrição intensidades dos mRNAs modulares nas amostras PPC. A este respeito, é importante para a elucidação da etiologia da variabilidade biológica (em amostras de tumor) dos níveis de expressão de miARN que determinam as conexões miARN-ARNm. Em primeiro lugar, observamos que a maioria dos miRNAs identificados, incluindo HSA-miR-19b, -92a, -93 e -106b, têm sido relatados como os alvos dos fatores de transcrição da família E2F [13], [39]. Enquanto isso, nós também observadas as conexões positivas entre estes miRNAs e E2F5 nos níveis de expressão (Figuras 8 e 9). Portanto, havia uma possibilidade de que a variabilidade biológica dos miRNAs foi devido à regulamentação, por E2F5. No entanto, tal mecanismo deve ser investigado desde a imagem real do regulamento e /ou mutação do gene em si TF ainda não está claro. Em seguida, se perguntado se os níveis de expressão de miRNA modulares foram relacionados com a progressão do câncer de próstata. Para investigar esta questão, agrupamos as amostras de 98 PPC sobre os níveis dos 7 miRNAs modulares de expressão através de um algoritmo de agrupamento hierárquico e comparou o resultado com as classes base de pontuação de Gleason. Não foi encontrada associação entre as duas partições. Finalmente, foi proposto e testado a hipótese de que a variabilidade biológica dos miRNAs foi originado a partir da regulamentação por parte dos genes codificadores de proteínas (incluindo genes do câncer) em que mutações esporadicamente ocorreram em amostras de tumores individuais. Por análise de agrupamento, que em primeiro lugar gerado duas partições das amostras 98 PPC, respectivamente, com base nos níveis de expressão de todos os 7 miARNs do módulo e as intensidades de transcritos de 34 potenciais genes de condução de cancro em amostras de tumores, como mostrado na Figura-1 de [12]. Em seguida, através de um teste qui-quadrado, verificou-se a associação entre as duas partições foi extremamente significativa (p 0,001)., Indicando nossa hipótese pode ser confirmada desta maneira

Materiais e Métodos

Define os dados

os dados microarray foi publicado no Gene Expression Omnibus (GEO, um banco de dados compatível Miame) repositório com o número de acesso GSE21032 [12], [40]. Entre as 218 amostras biológicas incluído no super-série, 98 tumores primários, 13 tumores metastáticos e 28 amostras de tecido da próstata normais (N = 139) tem dois perfis de expressão de miRNA e mRNA. rigorosos critérios foram aplicados na selecção de tumores para a análise genómica [12]. Os perfis de expressão gênica (mRNA) foram medidos com Affymetrix Exon Human 1.0 ST Array [conjunto de sonda (exon) version], e as imagens foram quantificados usando o GeneChip Software Operacional (GCOS) versão 1.4. Os dados brutos foram processados ​​pelo Aroma Affymetrix. Foram realizados o ajuste fundo RMA padrão e normalização quantil. As expressões de miRNA foram medidos na plataforma da Agilent-019118 Human miRNA Microarray 2.0 G4470B, e as imagens foram quantificados usando Agilent recurso de extração de versão 9.5. Os dados foram normalizados com-array entre normalização estabilização variância (VSN) após a exclusão dos microRNAs não presente em mais de 80% das amostras analisadas. Neste estudo, os dados de mRNA (o arquivo baixado Matrix Series) foi ainda mais simplificado através seguinte procedimento. Em primeiro lugar, nós adaptamos os valores de expressão de genes que inicialmente centradas no Affymatrix_Exon_Gene_IDs (Affy_IDs) para os símbolos oficiais de genes através do cálculo da média para um gene com dois ou vários Affy_IDs. Em segundo lugar, os valores da expressão de genes adaptados foram transformados em escala de Iog2. Finalmente, filtrou-se para fora dos genes que a falta de expressão variabilidade entre as matrizes 139. Com um ponto de corte de uma mudança de duas vezes a intensidade de expressão máximo para o mínimo uma, ~ 5730 genes passado o filtro. Portanto, os conjuntos de dados finais miRNA contém 5730 genes e 377 miRNAs. Embora as informações das amostras de tecidos normais 28 foi considerado na pré-processamento de dados para diluir o potencial de ruído nos experimentos de microarray, enfocamos as amostras PPC e MPC na análise a seguir SVD e miRNA-mRNA identificação do módulo.

Cálculo de miRNA-mRNA correlação Matrizes

Foi utilizado um método intensivo computacionalmente para estimar a correlação entre a expressão de um miRNA e um mRNA. O cálculo da correlação de Pearson foi repetido 1000 vezes. Em cada corrida, 80% das amostras de PPC ou MPC selecionados ao acaso estavam envolvidos. A estimativa final foi obtido pela média dos resultados ao longo dos 1000 repetições.

geração de redes de correlação miRNA-RNAm

respectivamente gerado duas redes de correlação miRNA-RNAm, PN e Mn, por PPC e MPC pela discretização as matrizes de correlação de expressão com 5730 genes (mRNAs), como linhas e 377 miRNAs como colunas. Mais especificamente, preenchido em ambas as matrizes com uma para a parte superior 1% das correlações positivas miARN-ARNm, -1 para o topo de 1% das correlações negativas, e 0 para o resto das entradas. Assim, um elemento diferente de zero representa uma correlação positiva ou negativa para um par de miARN e ARNm. Uma correlação definida de tal maneira corresponde a uma ligação de miARN-ARNm com o valor de p 0,008 (ou 0,065) para PPC (ou MPC)

Identificação de miARN-ARNm Módulos

Ambos matrizes de correlação discretizadas foram condensados ​​por excluindo a falta miRNAs de relações gravados com cancros e os genes de qualquer ligação com os miRNAs relacionadas ao câncer. Isto é, as colunas correspondentes aos miARNs não incluídos na lista documentado em [7], em primeiro lugar foram removidos, e, em seguida, as linhas (genes) que não continham, pelo menos, duas entradas diferentes de zero foram excluídos. A PN condensado e contêm, assim, MN 58 colunas, e 1792 e 1340 linhas, respectivamente. Com as matrizes de rede refinados como entradas, dois heatmaps foram gerados, respectivamente, para PPC e MPC pela aplicação da função “

heatmap.2

” no “gplots” pacote R. O layout dos miRNAs e mRNAs nas heatmaps foram baseados em uma de duas vias de análise de agrupamento hierárquico com

Manhattan

distância e

método Ward

como os argumentos. Tomando como um exemplo de PPC (Figura 3), foram identificados os módulos de miARN-ARNm através das três etapas seguintes. (1) Com base no dendrograma e os padrões de ligação miARN-ARNm mostrados no mapa de calor, cinco subconjuntos de miARN modulares (grupos) foi determinado visualmente. (2) Para cada um dos subconjuntos de miARN, as ligações positivas ou negativas com mRNAs foram coletadas em um par de matrizes de topologia de 2 colunas, respectivamente. (3) Um par módulo miARN-mRNA foi identificado a partir das saídas do passo (2) depois de deixar os mRNAs com apenas uma ligação (positivo ou negativo). Figuras das redes modulares foram produzidos por Cytoscape 2.8.1 [41].

Site de destino Enriquecimento Teste

Usando um programa de R propriedade do laboratório com o núcleo sendo o

matchPattern

() na Bioconductor

Biostrings

[42], [43], foram identificados os 7-mer e 8-mer miRNA motivos no local alvo nas sequências UTR 3 ‘(obtidos a partir de 18 hg-) de os genes medidos nos dados de microarray empregues. A matriz de sequência de afinidade binário miARN-ARNm (A) foi então gerado de uma forma tal que um elemento (A

ij) de valor 1 indicaram a existência de motivo (s) local alvo para a j

th miARN no sequência de UTR 3 ‘do i

th ARNm. Para um miRNA, a significância estatística do nível de enriquecimento de site de destino na lista dos genes modulares correlacionados foi medida pelo teste exato de Fisher, em referência ao nível de todo o conjunto de genes.

Informações de Apoio

tabela S1.

O resumo do miRNA-RNAm módulos correlação com a rede.

doi: 10.1371 /journal.pone.0040130.s001

(TXT)

Tabela S2.

Deixe uma resposta