PLOS ONE: Integrative Identificação desregulamentado Mirna /TF mediada por genes regulatórios Loops e Redes de próstata Cancer

Sumário

Os microRNAs (miRNAs) têm atraído uma grande quantidade de atenção em biologia e medicina. Foi levantada a hipótese de que miRNAs interagir com fatores de transcrição (TFS) em uma forma coordenada a desempenhar um papel-chave na regulação de sinalização e vias de transcrição e na obtenção de regulação do gene robusto. Aqui, propomos um método computacional integrativa romance inferir certos tipos de circuitos de regulação mediada por miRNA desregulados nos níveis de sinalização da transcrição, pós-transcricional e. Para prever de forma fiável interações miRNA-alvo de dados de expressão de mRNA /miRNA, o nosso método utiliza coletivamente previsões miRNA-alvo com base em sequência obtida a partir de vários algoritmos, informações conhecidas sobre alvos de mRNA e miRNA do TFS disponíveis em bases de dados existentes, certas estruturas moleculares identificados como sendo estatisticamente sobre-representados nas redes de genes regulatórios, informações subtipagem molecular disponíveis e técnicas estatísticas state-of-the-art para restringir adequadamente a análise subjacente. Desta forma, o método explora quase todos os aspectos das informações extraível nos dados de expressão. Nós aplicamos o nosso procedimento em dados mRNA expressão /miRNA de tumor de próstata e amostras normais e detectar numerosos ciclos desregulados mediada por miRNA conhecidos e novos e redes de câncer de próstata. Também demonstramos instâncias dos resultados de uma série de configurações biológicas distintas, os quais são conhecidos por desempenhar papéis cruciais na próstata e outros tipos de cancro. Nossos resultados mostram que o método computacional proposto pode ser utilizado para alcançar efetivamente percepções notáveis ​​sobre os mecanismos moleculares mal compreendidos de interações miRNA-mediadas e dissecar seus papéis funcionais no câncer em um esforço para abrir caminho para terapias baseadas em miRNA em ambientes clínicos.

Citation: Afshar AS, Xu J, Goutsias J (2014) Integrative Identificação desregulamentado Mirna /TF mediada por genes regulatórios Loops e Redes no câncer de próstata. PLoS ONE 9 (6): e100806. doi: 10.1371 /journal.pone.0100806

editor: Sebastien Pfeffer, Centro Nacional Francês de Pesquisa Científica – Institut de Biologie moléculaire et cellulaire, França |

Recebido: 20 Janeiro, 2014; Aceito: 28 de maio de 2014; Publicação: 26 de junho de 2014

Direitos de autor: © 2014 Afshar et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este trabalho foi financiado pela National Science Foundation (NSF) Concede CCF-0849907 e CCF-1.217.213. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

Os microRNAs (miRNAs) são ácidos pequenas não codificantes ribonucleico (RNAs), que amplamente regulam a expressão de genes em animais metazoários, plantas e protozoários. Cerca de 22 nucleótidos de comprimento, geralmente miARNs reprimir a expressão do gene através da ligação a sequências com complementaridade parcial de ARN alvo mensageiro (mRNA) transcrições. Nos mamíferos, miARNs são pensados ​​para controlar a actividade de mais de 60% de todos os genes que codificam proteínas e extensivamente participar na regulação de muitas funções celulares [1], [2].

Com poucas excepções, metazoários miRNAs base-par com os seus objectivos imperfeitamente, na sequência de um conjunto de regras que foram formuladas por meio de análises experimentais e baseados em bioinformática [3]. Esta complementaridade limitada torna a tarefa de computacionalmente identificar alvos miRNA muito desafiador e geralmente leva a um grande número de, na maior parte falsas, alvos potenciais.

No início ferramentas computacionais têm-se centrado principalmente na dissecar interações miRNA-alvo individuais, baseando-se na sequência com base na identificação de locais de ligação de miARN alvo ou em ARNm /miARN análise de dados de expressão de [4] – [6]. Métodos alternativos utilizam genes do hospedeiro miARN como proxies para medir a expressão de miARN incorporados [7] ou empregar uma abordagem informação teórica para identificar mRNAs candidatos que modulam a actividade da miARN afectando a relação entre um miARN e o seu alvo (s) [8]. Por outro lado, o trabalho recente considera análise de co-expressão, assumindo que os objectivos de uma determinada miARN são co-expressas, pelo menos em certos tecidos ou condições [9].

Convencionalmente, muitos métodos computacionais desenvolvidos para predição miARN alvo dependem da suposição de que há uma correlação inversa entre o nível de expressão de um miARN e que do seu alvo [10]. No entanto, demonstrou-se recentemente que tanto positiva e negativa da transcrição de co-regulação de um miARN e os seus alvos são predominantes nos genomas humanos e de rato [11], [12]. Em particular, dois tipos de circuitos reguladores (que iremos discutir em breve) têm sido propostos para interações mediada por miRNA, que modulador atribuem e /ou reforçar os papéis de miRNAs em suas redes baseadas em motivos, como loops feed-forward (FFLs ) [13]. Como consequência, as previsões miARN alvo depender exclusivamente uma suposição correlação inversa espera-se ser limitado, se o método de previsão não incorporar adequadamente a estrutura da rede de FFL subjacente.

Baseado no paradigma anterior, vários investigadores têm investigado a estatística sobre-representação das estruturas de rede envolvendo miRNA e TF co-regulação dos mRNAs para identificar redes funcionais enriquecidos e /ou avaliar a sua prevalência em diferentes contextos biológicos [14] – [21]. Essencialmente, esses métodos calcular medidas de coordenada co-regulação gênica por miRNA e reguladores TF. Outros investigadores têm considerado os métodos de regressão ou modelos de Bayesian para quantificar as associações de estatística por determinação de alterações no nível de um dado mRNA de expressão explicada pelos níveis de TFs e miARNs expressão previsto para segmentar o ARNm com base na informação da sequência [22] – [25]. Subsequentemente, eles usam as relações inferidas para delinear estruturas de rede significativos e motivos de uma forma semelhante à utilizada nos métodos acima mencionados. É importante notar, contudo, que os resultados coletivos produzidos por todas essas abordagens fornecer um apoio adicional para a importância de miRNA /FFLs mediada por TF como redes funcionais em diferentes contextos biológicos vigente, reconfirmando as hipóteses inicialmente proposto em [11], [12] .

Além do que precede, as interrupções na regulação do gene (por exemplo, por alterações genéticas e epi) acredita-se que induzir alterações na função normal das células que levam à progressão de condições patológicas, como o cancro, são divulgados através da rede de transcrição. Como consequência, o tratamento eficaz de muitas doenças humanas podem exigir uma compreensão fundamental e sistémica de reguladores genómicas, tais como miARNs e TFs, e as suas redes de interacção. No entanto, sistematicamente inferir interações moleculares pelos métodos experimentais é difícil e caro. Por conseguinte, é altamente desejável desenvolver abordagens computacionais “” fiáveis ​​capazes de identificar tais redes. previsões de rede pode, posteriormente, ser utilizado por um biólogo especialista em formular novas hipóteses e efetivamente prosseguir com sua investigação experimental e validação.

Recentemente, vários novos métodos têm sido propostos para identificar coordenado miRNA interações /TF [26], [ ,,,0],27]. No entanto, e para uma dada estrutura de motivo (por exemplo, um FFL), estes métodos tentar prever as interacções de base (as três arestas de uma FFL), utilizando informação biológica limitado e um conjunto restrito de ferramentas computacionais. Como resultado, embora os métodos são eficazes no fornecimento de insights sobre a prevalência de várias instâncias motivo em rede de transcrição, eles podem não produzir previsões confiáveis ​​do ponto de vista experimental.

O desempenho de alguns dos métodos anteriores tem foi recentemente testada em [27]. Observou-se que, embora alguns métodos foram capazes de alcançar uma taxa de sucesso razoável em prever ocorrências de um tipo de interacção, eles são menos eficazes em prever instâncias dos outros dois tipos, com vários algoritmos de ter uma taxa de sucesso de perto de ou menos do que 1% em prever as interacções de TF-mRNA e TF-miARN. Isso destaca o fato fundamental que prever interações moleculares de pares e construir instâncias de ordem superior de motivos utilizando as bordas previstos pode se traduzir em taxas de falsos positivos mais elevados. Uma vez que há uma riqueza de informações sobre como um TF liga os seus objectivos e em suas funções regulamentares específicas, decidimos considerar apenas

experimentalmente validadas interações TF-mRNA e TF-miRNA no âmbito do quadro FFL e mudar o foco em predizer com segurança a extremidade interacção miARN alvo mal compreendidos. Acreditamos que, ao restringir adequadamente o problema análise estatística subjacente, que pode potencialmente aumentar a confiabilidade do miRNA /gene previsões de loop reguladoras mediada por TF.

Para restringir ainda mais o problema previsão interação miRNA-alvo, nos concentramos em este documento sobre certos motivos regulatórios de três nós. O primeiro conjunto de motivos que o nosso método considera são FFLs três nós que têm atraído recentemente uma grande quantidade de atenção entre os sistemas e biólogos experimentais. Estes motivos são excelentes modelos de regulação mediada por miRNA e transcrição coordenado, que foram hipótese de ser prevalente nos genomas humano e do rato [12].

Nós consideramos dois Tipo I FFL motivos, em que o miRNA e TF são os reguladores a montante ea jusante, respectivamente, bem como quatro do tipo II motivos FFL, em que o TF é agora o regulador a montante, enquanto que o miRNA é o regulador a jusante – veja a Figura 1. de uma perspectiva mecanicista, esses seis FFLs são classificadas como sendo

coerente ou

incoerente

. No caso coerente, os reguladores de miRNA e TF agir de forma coordenada para reforçar a lógica de regulação ao longo de dois percursos de alimentação para a frente. Em FFLs coerentes Tipo I e Tipo II-B, estes caminhos simultaneamente reprimir a expressão do ARNm alvo. O mecanismo resultante é utilizado, por exemplo, ao submeter a transcrição de um gene gotejante, garantindo que a sua expressão permanece a um nível insignificante. Por outro lado, em uma do Tipo II-A FFL coerente, o TF reforça a transcrição do ARNm alvo, activando-o directamente, bem como através da inibição da sua repressão pelo regulador miARN segmentação.

O Tipo I FFL consiste de tripletos (miARN, TF, ARNm) de tal modo que um miARN alvo, simultaneamente, um ARNm e o seu ARNm TF. O Tipo II FFL consiste de tripletos (miARN, TF, ARNm) de tal modo que um TF regula simultaneamente um miARN alvo e o seu ARNm. Finalmente, o loop de tipo III consiste de tripletos (miARN, G-1, G-2) de tal modo que a miARN alvos simultaneamente dois transcritos em uma determinada via de KEGG, um de cada L-1 e L-2 gene, cuja proteínas correspondentes poderiam potencialmente interagir uns com os outros com base em um mapa via fornecida no banco de dados KEGG.

nos FFLs incoerentes, os reguladores de miRNA e TF agir de forma coordenada para afinar a expressão do mRNA alvo . Mais especificamente, qualquer desvio em relação à concentração de estado estacionário do regulador a montante (isto é, a miARN no tipo I e do TF no Tipo II-A e Tipo II-B FFLs) iria conduzir o ARNm alvo, bem como o regulador de jusante , longe de seus níveis de estado estacionário na mesma direção. Desta forma, o regulador de jusante pode equilibrar a expressão do ARNm alvo, compensar as flutuações no nível de expressão do factor a montante.

Certos processos celulares pode ser ultra-sensível para a actividade de um dado transcrito numa contexto biológico específico. Nestas situações, o mecanismo de “ruído buffer” fornecido pelo FFLs incoerentes ajuda a manter a homeostase proteína alvo e garante que uma deriva descoordenada do nível de estado estacionário do regulador a montante pode não resultar em uma variação indesejável no nível da proteína-alvo que pode levar para os resultados patológicos. MiRNAs são particularmente eficazes nesta configuração, devido ao seu mecanismo de acção rápido ao nível pós-transcricional, em oposição a transcricionais repressores, acelerando assim o ruído da protecção [12].

Além do modulador e /ou reforçando funções reguladoras de genes que miARNs são conhecidos por desempenhar em concerto com o TFS, que têm sido propostos para desempenhar papéis importantes na regulação das vias de sinalização bem. A este respeito, embora miARNs são conhecidos por terem efeitos subtis nos níveis de proteína de alvos individuais, a sua influência cumulativa pode afectar significativamente os resultados controladas por vias de sinalização, dada a multiplicidade dos seus objectivos e a regulação negativa simultânea de vários destes objectivos. Para tomar este aspecto importante em consideração, o nosso método também considera o Tipo III motivo básico circuito representado na Figura 1, em que um miARN alvo dois transcritos de genes, L-1 e L-2, cujas proteínas podem potencialmente interagir uns com os outros de acordo com um mapa via fornecida na base de dados KEGG (https://www.kegg.jp). A existência de Tipo III ciclo motivos é apoiado por duas hipóteses principais: (i) miRNAs desempenham papéis importantes na regulação das vias de sinalização, devido à sua natureza sensível da dose acentuada [28] – [32], e (ii) alvos de miRNAs individuais estão mais ligado (isto é, interagir) ao nível da proteína do que o esperado por acaso [28], [33] – [35].

por comparação, o método proposto em [26] considera apenas FFLs Tipo II e faz não discriminar entre FFLs coerentes e incoerentes, que é necessário para uma compreensão de nível de sistemas de mudanças transcriptoma na doença. Além disso, os testes estatísticos padrão usado para identificar genes diferencialmente expressos entre duas condições em uma expressão de gene típico de perfis estudo, tal como adoptadas métodos anteriores [26], [27], tornar-se fundamentalmente falho na presença de fontes de desaparecidos de variabilidade (devido a factores biológicos e experimentais entre outros) [36] – [38]. informações subtipagem molecular é um exemplo fundamental de tais fontes de variabilidade.

Para tratar das questões anteriores, desenvolvemos neste trabalho IntegraMiR, um novo método de análise integrativa, que pode ser usado para inferir certos tipos de loops de reguladoras de desregulado interações miRNA /TF que aparecem no limite, os níveis pós-transcricional e sinalização da transcrição de uma forma estatisticamente sobre-representados. O método proposto atribui funções biológicas para miRNAs, integrando cinco principais fontes de informação em conjunto com técnicas estatísticas state-of-the-art para inferir de forma confiável tipos específicos de interações miRNA-alvo no contexto de loops de reguladoras. Em particular, IntegraMiR utiliza:

dados de expressão de mRNA e miRNA

informações miRNA-alvo com base em sequência obtida a partir de diferentes algoritmos

informações conhecidas sobre alvos de mRNA e miRNA de.. TFs disponível em bancos de dados existentes.

Alguns motivos de três nós na rede de transcrição.

informações subtipagem molecular conhecido disponível com dados de expressão de genes.

Para fazer isso , IntegraMiR identifica miRNAs desregulados, a TFS e mRNAs através da realização de análise estatística dentro de um quadro limitado que usa informações “antes” que compreende descobriu recentemente motivos, o conhecimento disponível sobre miRNA /mRNA regulação transcricional e interações em nível de proteína conhecidos sobre as vias de sinalização. Para ilustrar a eficácia eo potencial deste método, podemos aplicá-lo em dados de expressão de mRNA /miRNA do tumor e amostras normais e identificar vários novos laços desregulados conhecidos e no câncer de próstata (PCA). Isso nos permite demonstrar instâncias dos resultados e conclusões em um número de configurações biológicas distintas, que são conhecidos a desempenhar papéis cruciais na APC e outros tipos de câncer.

Devemos ressaltar neste ponto que IntegraMiR é escalável , no sentido de que as informações dos bancos de dados existentes ou recentemente desenvolvidas /atualizados pode ser entrada para gerar desejado /resultados prolongados. Além disso, quaisquer dados miARN /expressão de ARNm com amostras obtidas em qualquer contexto biológico entre duas condições pode ser explorada para inferir as laçadas desregulados correspondentes relevantes para o contexto em particular em mãos. Finalmente, o leitor interessado pode baixar gratuitamente uma implementação R de IntegraMiR de www.cis.jhu.edu/~goutsias/CSS%20lab/software.html.

Resultados

Integrado miRNA /TF mediada por loop Regulatory Previsão

O fluxograma apresentado na Figura 2 fornece uma descrição geral das diferentes etapas empregadas por IntegraMiR. Nós remetemos o leitor para a seção “Materiais e Métodos” para mais detalhes sobre cada etapa. O procedimento utiliza dados de expressão de ARNm e de miARN obtidos a partir de tecido da próstata em duas condições biológicas diferentes (normal versus cancro). É, além disso, emprega resultados obtidos pelos algoritmos de previsão alvo miRNA-base de sequência e incorpora informações extraídas dos quatro bancos de dados disponíveis on-line, a saber:

O método atribui funções biológicas para miRNAs, integrando cinco principais fontes de informação, juntamente com state-of -the-art técnicas estatísticas para inferir de forma confiável tipos específicos de interações miRNA-alvo no contexto de loops de reguladoras de dados de expressão de mRNA e miRNA.

-mSigDB (www.broadinstitute.org/gsea/msigdb ).

-miRTarBase (https://mirtarbase.mbc.nctu.edu.tw).

-TRANSFAC (www.gene-regulation.com/pub/databases.html).

-TransmiR (https://202.38.126.151/hmdd/mirna/tf).

Observe que as informações ENCODE lançou recentemente em sítios de ligação TF com base em experiências chip-seq para 161 TFs em 91 linhas de células (https://genome.ucsc.edu/ENCODE). Infelizmente, esta base de dados não fornece o tipo de regulação (activação ou repressão) de uma determinada interação TF-alvo, informações que é crítico em nossa abordagem. Por esta razão, utiliza IntegraMiR TRANSFAC. No entanto, uma vez que esta informação torna-se disponível através de codificar ou qualquer outro banco de dados de TF-alvo, que pode ser facilmente utilizado por IntegraMiR.

O primeiro passo do IntegraMiR aplica técnicas de pré-processamento padrão nos dados de expressão crua (como correção de fundo , normalização, e correção heterogeneidade de dados) para melhorar a qualidade dos dados, seguido por testes múltiplos hipótese (MHT) e análise de variável substituta (SVA) para identificar mRNAs e miRNAs que são diferencialmente expressos entre as duas condições biológicas, enquanto corrige a variabilidade biológica devido à subtipagem molecular, vários efeitos de teste e de lote.

o segundo passo implementa análise estatística adicional, usando análise de conjunto de enriquecimento de gene (GSEA) para avaliar melhor o significado biológico de certos mRNAs e miRNAs que não são considerados para ser diferencialmente expressos por MHT. Ao empregar as assinaturas moleculares de banco de dados mSigDB de conjuntos de genes anotados para uso com GSEA e

verificados experimentalmente banco de dados alvo miRNA miRTarBase, IntegraMiR constrói três grupos separados de conjuntos de genes e avalia a significância estatística de cada conjunto de genes enriquecido para a desregulamentação nos dados de expressão de mRNA disponíveis. O primeiro grupo é constituído por conjuntos de genes nos dados de mRNA indexados por um ARNm TF que não é considerada para ser expresso diferencialmente por MHT e é determinada por mSigDB para regular directamente a cada gene no conjunto de genes. O segundo grupo é constituído por conjuntos de genes nos dados de mRNA indexados por um miARN que não é considerada para ser expresso diferencialmente por MHT e é determinada por miRTarBase para direcionar cada gene no conjunto de genes. O terceiro grupo é composto por conjuntos de genes nos dados de mRNA indexados por um KEGG específica via [39] de sinalização, [40] incluído no mSigDB. Finalmente, TFs associadas a conjuntos estatisticamente significativa de gene enriquecida são emendadas para a lista desses mRNAs que se considera ser diferencialmente expressos por MHT para gerar uma lista combinada de mRNAs diferencialmente expressos, eo mesmo é feito para miRNAs. Devemos notar aqui que mSigDB é amplamente usado para obter conjuntos de genes para análise GSEA. Por outro lado, nós empregamos MiRTarBase uma vez que esta base de dados tem acumulado um número relativamente grande de interações miRNA-alvo experimentalmente validadas.

Em resumo, GSEA determina se um determinado conjunto de genes mostra diferenças concordantes estatisticamente significativas entre os dois biológica estados [41]. A principal razão IntegraMiR aplica GSEA após o passo inicial teste de hipóteses é para melhorar a detecção de diferencialmente expressos TFs e miRNAs, que pode ser perdida quando os níveis de expressão individuais mostrar apenas mudanças moderadas entre as duas condições biológicas. Por uma questão de facto, se um certo número de transcrições são conhecidos para participar num mecanismo biológico comum, em seguida, até mesmo alterações moderadas nos níveis destas transcrições de expressão podem ser estatisticamente significativa, devido ao facto de as relações biológicas conhecidas entre transcritos pode resultar em maior poder estatístico quando detectar pequenas variações nos seus níveis de expressão em comparação com o caso de transcritos individuais. Além disso, para certos TFs, a expressão de ARNm de TF pode não necessariamente ser utilizado como um substituto da sua actividade ao nível da proteína, devido a modificações pós-transcricional e pós-tradução de TFs [42], [43]. Para resolver estas questões, IntegraMiR também considera a expressão diferencial de genes coletiva, ao contrário de vários procedimentos seguidos por outros trabalhos relacionados discutido anteriormente que construir, principalmente, suas análises sobre as estatísticas obtidas a partir de transcrições individuais.

A terceira etapa do IntegraMiR utiliza os resultados obtidos por MHT e GSEA, bem como o conhecimento biológico disponível e previsões miARN alvo baseada na sequência, identificar conhecidos

alvos directamente reguladas de expresso diferencialmente TFs e miARNs e previu alvos para os miARNs. Ao empregar o TRANSFAC banco de dados TF eucariótica ea TF /miRNA banco de dados regulamentação TransmiR, IntegraMiR produz uma lista de diferencialmente expressos TFs juntamente com os seus genes alvos e o tipo de regulação (activação ou repressão) para cada gene alvo. Também produz uma lista de diferencialmente expressos TFs juntamente com os seus alvos miRNA diferencialmente expressos e o tipo de regulamento para cada alvo miRNA. Note-se que a escolha para utilizar TRANSFAC e TransmiR baseia-se no facto de TRANSFAC fornece de forma fiável a informação crucial do tipo de regulação (activação /repressão) de um factor de transcrição e o seu gene alvo (s), ao passo que TransmiR fornece a informação crucial do microARN (s) a ser regulada por ela. Por outro lado, para identificar alvos de ARNm de miARNs expressos diferencialmente, IntegraMiR emprega miRecords (https://mirecords.umn.edu/miRecords), uma ferramenta integrada baseada na sequência de predição miARN alvo, bem como miRTarBase, uma base de dados de experimentalmente alvos miRNA validados. Nesta etapa, IntegraMiR produz uma lista de miRNAs diferencialmente expressos com as previsões alvo baseada em sequência correspondente, alterados com alvos de mRNA experimentalmente validadas de miRTarBase para ajudar a identificar as previsões verdadeiro-positivos e falso-negativos, utilizando conhecimento biológico disponível. A este respeito, IntegraMiR incorpora um

módulo preditivo

(explorando miRecords) e um

não preditivo módulo (miRTarBase)

para realizar essa tarefa.

A quarta etapa da IntegraMiR implementa uma técnica, descritos na secção “Materiais e Métodos”, para a construção de laçadas desregulados dos tipos descritos na Figura 1, utilizando os resultados obtidos a partir dos passos anteriores. IntegraMiR constrói os seguintes três tipos de loops de reguladoras:

(i) um FFL compreendendo um miRNA que tem como alvo simultaneamente um TF e um mRNA que está diretamente regulado pelo TF

(ii) An. FFL compreendendo um TF que regula directamente um miARN e um ARNm que é directamente objecto de miARN.

(iii) um circuito de regulação compreendendo um miARN que tem como alvo simultaneamente dois genes diferentes numa determinada via de KEGG cujas proteínas podem potencialmente interagem uns com os outros com base em um mapa via fornecida no banco de dados KEGG.

Para classificar os loops de reguladoras construídos em termos de seu “significado”, IntegraMiR aplica um procedimento de teste de hipóteses utilizando o método de Fisher [44] . O procedimento emprega estatística de teste resumo de Fisher, dada pela Eq. (2) na seção “Materiais e Métodos”, para combinar os valores

P

MHT-computados atribuídos a cada nó do laço em um

P

valor usado como uma contagem de classificação para o toda loop. Isto não se aplica ao tipo laços III, uma vez que estes laços envolvem genes e transcritos de mRNA não específicas. Uma vez que os papéis funcionais de loops reguladoras são diferentes, grupos IntegraMiR esses loops em cinco categorias distintas: Tipo I coerente FFL, Tipo I incoerente FFL, Tipo II coerente FFL, Tipo II FFL incoerente, e Tipo III laços – ver Figuras 1 2. Para proporcionar flexibilidade adicional na interpretação dos resultados, IntegraMiR ordena FFLs Tipo II em dois subgrupos distintos, Tipo II-A e Tipo II-B, embora esta classificação adicional pode não ser necessária. Dentro de cada grupo e subgrupo, IntegraMiR classifica os loops desregulados, aumentando a pontuação, com menor pontuação correspondente à maior “significado”, e destaca os laços descobertos a ser desregulamentado de forma

consistente

com a estrutura ea borda subjacente dados de expressão, tal como determinado pelas regras ilustradas na Figura 3 (ver também a secção “Materiais e Métodos”). É além disso marca alvos de miARN dependendo se estes objectivos são previstos pelo procedimento ou ter sido validada experimentalmente de acordo com miRTarBase, ou ambos. Note-se que “consistência” refere-se ao fato de que os padrões dos nós de um loop de expressão desregulada estão de acordo com a sua estrutura de borda de regulamentação. Por exemplo, um tipo I FFL coerentes é dito para ser consistentemente desregulada se compreende um miARN regulada positivamente regulada negativamente e TF e ARNm, ou um miARN e regulados negativamente regulada positivamente TF e mRNA; veja a Figura 3.

Um ciclo desregulado é considerado

consistente

se o padrão de seus nós de expressão estão de acordo com a sua estrutura margem regulatória. Qualquer ciclo desregulado que não satisfaz esta propriedade está a ser dito

inconsistente

.

IntegraMiR Identifica extensiva da transcrição, pós-transcricional e sinalização desregulamentação em CaP

Para investigar a eficácia de IntegraMiR em delinear lacetes reguladoras miARN-mediadas, são utilizados os dados de expressão de microarray de ARNm, obtidas a partir de 48 normais e 47 amostras de próstata de tecido de tumor (NCBI banco de dados GEO, o número de acesso GSE29079), bem como dados de expressão de microarranjo de miARN obtidos a partir de combinados amostras de tecidos normais e cancerosos, extraídos de 20 indivíduos (NCBI banco de dados GEO, número de acesso GSE23022). Para mais informações sobre estes dados, nós nos referimos o leitor para a seção “Materiais e Métodos”. Depois de pré-processamento de dados, IntegraMiR incorpora Análise Surrogate Variável (SVA) [36], em conjunto com MHT, para identificar genes diferencialmente expressos entre as duas condições. Tem sido mostrado que aumenta a precisão SVA biológica e reprodutibilidade de análises em estudos de expressão do genoma [36], [37]. IntegraMiR emprega SVA para ter em conta as variabilidades biológico devido a subtipos moleculares categorizados pelo estado de fusão do gene TMPRSS2-ERG, que foi identificado em cerca de metade de todos os casos de CaP e é um evento precoce crítico no desenvolvimento e progressão desta doença [ ,,,0],45] – [47]

IntegraMiR primeira executa MHT, utilizando uma estatística t moderado [48], para identificar separadamente mRNAs e miRNAs que são diferencialmente expressos entre tumores e amostras normais.. Esta análise identifica extensa desregulação da transcrição nas amostras de tecido de tumor: 7.934 genes (fora de 17.324) são encontrados para ser expressos diferencialmente com base na sua significância estatística, com 164 destes genes a ser sobre-expresso por uma mudança de dobragem ou reprimida por uma mudança de dobragem – ver tabelas S1 S2. A lista gene que fornecemos na Tabela S2 contém genes importantes, como TARP, MYC, SNAI2 (SLUG), WIF1 e ERG entre outros, que foram caracterizados anteriormente em CaP.

A análise dos dados de expressão miRNA correspondente por MHT resultados em 18 (num total de 847) miRNAs humanos diferencialmente expressos, o que listam na Tabela 1 (primeiro 18 miRNAs) – ver também o S3 Tabela. Recentemente, análise de sequenciação de profundidade de perfis de expressão de miRNA identificaram 33 miRNAs como sendo diferencialmente expressos em APC, com miR-375, miR-200c, miR-143 e miR-145 exibindo a desregulamentação mais pronunciado [49]. Foram comparados os resultados IntegraMiR aos obtidos por sequenciação de profundidade. Dos 18 miRNAs identificados pelo IntegraMiR, 7 miRNAs (miR-200C, miR-20a, miR-375, miR-106a, deixe-7a, miR-21 e miR-106b) foram confirmados para ser regulada por meio de análise de sequenciação de profundidade , ao passo que 2 miRNAs (miR-221 e miR-145) foram confirmados para ser reprimidos. Os restantes 9 miRNAs identificados por MHT não foram detectados por sequenciação de profundidade.

Durante a segunda etapa do IntegraMiR, aplicação de GSEA em conjuntos de genes de alvos TF obtidos a partir mSigDB descobre 37 desregulamentado significativamente TFs, que são não detectado pelo passo inicial MHT com base na análise de um único gene. Listamos estes TFs na Tabela S4. Curiosamente, vários destes TFs (por exemplo, NKX3-1, Smad1 /3, SRF, ETV4 e Elk1) são conhecidos por desempenhar papéis importantes em APC, bem como em outros tipos de cancro.

Do mesmo modo, a aplicação de GSEA em conjuntos de genes de validada experimentalmente (por análise de sequenciação de profundidade) alvos miRNA obtidos a partir miRTarBase identifica 5 miRNAs significativamente reprimidos, que não são detectadas por MHT. Listamos estes miRNAs na Tabela 1 (última 5 miRNAs). Em ambos os casos, e para cada TF ou miARN, GSEA é realizada com base na disponibilidade de conjuntos de genes nos dados.

Finalmente, a aplicação de GSEA 30 identifica significativamente as vias de sinalização desregulada, entre as vias de sinalização 186 KEGG disponíveis em mSigDB. Listamos os resultados na Tabela 2. Entre as outras vias, a lista contém as vias de sinalização Wnt e TGF-, que têm sido implicados na iniciação e progressão CaP. Naturalmente, os resultados também incluem as vias de cancro da próstata e aderentes de junção. A última via regula a adesão intercelular que desempenha um papel importante na epitelial para mesenquimal transição (EMT), considerado como sendo um passo importante para a progressão tumoral [50], [51].

Deixe uma resposta