PLOS ONE: Aumento MicroRNA Atividade em cancros humanos

Sumário

Os microRNAs (miRNAs) são pequenos RNAs reguladores que atuam bloqueando a tradução e aumentando a degradação de transcritos alvo. MiRNAs desempenhar um papel fundamental em muitos processos biológicos, incluindo o desenvolvimento e a diferenciação e muitos estudos têm mostrado que as principais alterações nos níveis de miARN ocorrem no cancro. Desde miRNAs degradar mensagens de destino, usamos essa propriedade para desenvolver um método computacional novo objetivo determinar a atividade biológica real de miRNAs usando variações na expressão gênica. Utilizando o método descrito aqui, nós quantificamos atividade miRNA em carcinoma de tireóide e câncer de mama papilar, e encontrou um sinal forte e distinto do aumento da atividade miRNA global, incorporado nos relativos medições de expressão de genes. Curiosamente, verificou-se que nestes dois tipos de cancro, a actividade de miARN é globalmente aumentada, e está associada com uma regulação negativa dos genes global de miARN alvo. Este downreguation de miRNA genes regulados é particularmente visível para os genes que transportam vários locais-alvo para miRNAs. Entre os genes reprimidos-miRNA, encontramos um significativo enriquecimento de supressores tumorais conhecidos, sugerindo, assim, que o aumento da atividade miRNA foi realmente tumorigênico

Citation:. Israel Um, Sharan R, Ruppin E, Galun E (2009) Aumento MicroRNA Atividade em cancros humanos. PLoS ONE 4 (6): e6045. doi: 10.1371 /journal.pone.0006045

editor: Joseph Alan Bauer, Bauer Research Foundation, Estados Unidos da América

Recebido: 09 de fevereiro de 2009; Aceito: 26 de maio de 2009; Publicação: 25 de junho de 2009

Direitos de autor: © 2009 Israel et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. AI é apoiado por uma bolsa da Fundação Erich et Regine Loewenthal. EG é apoiado pelo Ministério israelita da Ciência, através de uma subvenção ao Centro de Terapia Genética Knowledge Nacional e através CE concede LSHB-CT-2004-512034 (MOLEDA), LSHB-CT-2008-223317 (LIV-ES), e LSHB -CT-2005-018961 (INTHER). EG também é apoiada por doações da Blum, o Harold Grinspoon, o apoio Barbara Fox Miller, o Horowitz e as Fundações Wolfson. RS e ER são apoiados por uma bolsa de pesquisa do Ministério da Ciência e Tecnologia, Israel. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

Os microRNAs são single-stranded moléculas de RNA não codificante de cerca de 22 nucleotídeos que emparelhar com RNA mensageiro (mRNA) que transportam uma sequência complementar [1]. MicroRNAs se ligam a ARNm alvo dentro do complexo induzido por ARN de silenciamento (RISC), que contém um membro da família de proteínas Argonaute. Esta ligação evita a tradução e acelera a degradação dos ARNm-alvo [2]. Nos últimos anos, miARNs demonstraram desempenhar um papel-chave na regulação da expressão do gene, e não há evidências de que miARNs estão envolvidas em processos biológicos centrais, incluindo o desenvolvimento, organogénese, a diferenciação de tecidos, do ciclo celular, e metabolismo [3 ] – [5]. Notavelmente, a expressão espacial e temporal dos miRNAs é característica de tecidos e estágios de desenvolvimento, e vários estudos têm mostrado uma ligação entre miRNAs expressos em determinados tipos de tecidos e regulação de genes específicos de tecidos [6].

As alterações nas miARN expressão ter sido demonstrado que ocorrem no cancro [7] no entanto, a natureza e o impacto da maior parte destas alterações permanecem obscuros. Notavelmente, existem resultados conflitantes sobre a questão de saber se os níveis de miRNA são globalmente diminuído ou aumentado em câncer. miARNs maduros têm sido mostrados em alguns estudos de ser diminuída no cancro [8], enquanto que outros estudos detectaram regulação positiva de miARNs em muitos tumores [9]. Uma possível explicação para estes resultados divergentes pode haver diferenças entre os tipos de tumores, tecidos analisados, ou mesmo técnicas de medição. Outra explicação putativa é que a desregulamentação que miRNAs sofrer no câncer é um processo complexo. Ou seja, o resultado da regulação miARN na expressão do gene é dependente não só sobre os níveis dos miARNs, mas também em numerosos outros factores que medeiam a influência de miARNs seus genes alvo, tais como componentes do complexo RISC. Consequentemente, a disponibilidade destes factores poderia marcadamente modular a influência do efeito global miARNs seus genes-alvo, e, como resultado, proporcionar feedback adicional sobre os níveis de miARN si. Tais variações globais de actividade miARN são sugeridas por estudos que demonstraram que a Argonaute2 (

EIF2C2

) gene, que é incorporado no complexo RISC, é frequentemente duplicado em tumores [10]. Uma vez que este gene não está directamente envolvido na biogénese de miARN, pode-se esperar que, quando este gene é duplicado, a degradação dos genes miARN alvo aumentaria, sem aumento associado dos níveis de miARN. Por esta razão, buscou-se determinar o efeito global de miRNAs em seus genes-alvo, a sua

biológica atividade

, e projetou um método para medir esse efeito diretamente dos relativos níveis de expressão do gene alvo.

o nosso método, chamado MIRABELLE (actividade MicroRNA com base nos níveis de expressão), baseia-se na observação de que miARNs são conhecidos para acelerar a degradação dos seus transcritos alvo, e que esta actividade deixa uma assinatura sobre os níveis de mRNA dos seus genes-alvo. Uma redução nos níveis de ARNm que transportam um local de ligação para uma espécie de miARN de expressão pode ser detectado após a transfecção com os cognatos miARNs [11]. Além disso, vários estudos têm mostrado uma correlação clara entre miARNs que são altamente expressos num dado tecido e a regulação negativa dos seus transcritos alvo [6], [12], [13]. Assim, uma mudança de expressão do conjunto de genes alvo de um miARN numa amostra é uma indicação de que a actividade biológica de uma espécie de miARN correspondentes alterações nesta amostra.

A abordagem MIRABELLE assenta no princípio de que o gene os níveis de expressão reflectir o efeito regulador de módulos de ordem mais elevada, e, portanto, pode-se avaliar o impacto destes módulos, ao observar alterações de transcrição [14], [15]. Em particular, os relatórios recentes têm demonstrado que a variação na actividade de miARN pode ser detectada através da comparação dos níveis de miARN alvo genes em vários tecidos [16], [17]. Nosso método, embora semelhante em seu conceito, diverge das abordagens publicadas anteriormente em que ele é projetado para capturar características de regulação miRNA em transcrições de mRNA.

É amplamente aceito que a ligação miRNA é determinada principalmente pela 3 ‘ região não traduzida (UTR) do ARNm. A presença de um 7-mero complementar a uma semente miARN (nucleótidos 2-8) na UTR 3 ‘de um gene é um factor-chave de reconhecimento miARN; e vários algoritmos, tais como TargetScan [18], [19], conseguiram identificar associações miRNA-gene, identificando cuidadosamente genes com sequências conservadas correspondentes aos padrões de reconhecimento de miR. No entanto, uma associação estabelecida entre um miRNA e um gene alvo não implica que todos os transcritos produzidos a partir deste gene seria sujeita a regulação miRNA. Cerca de metade dos genes humanos podem ser submetidos a poliadenilação em múltiplos locais, ou ser sujeito a splicing alternativo influenciar os seus últimos exões [20], [21], e, assim, produzir transcritos que diferem nas suas sequências de UTR 3 ‘. Entre mRNAs transcritos de tal loci, apenas aqueles que carregam a sequência reconhecida miRNA entre o códon de parada ea cauda poli seriam afetados pela regulação miRNA. Esta propriedade, notavelmente diferencia miARN efeito de regulação da transcrição que ocorrem no local promotor de genes, e que afecta todas as isoformas do gene. Nós usamos essa propriedade para criar um método que especificamente avaliar o efeito da regulação miRNA.

Esta abordagem torna-se possível pelo fato de que algumas plataformas de microarray, como a Affymetrix, medir abundância transcrição utilizando várias sequências retirados do 3 ‘terminal do gene. Affymetrix dados a expressão do gene é resumido na sonda-sets, e existem vários conjuntos de sondas disponíveis para a maioria dos genes. Alguns destes sonda-conjuntos são indicadores de confiança da actividade miARN, o que significa que eles detectam sequências que só poderiam aparecer nas isoformas de um gene que incluem um sítio de ligação para um determinado miARN: todos os transcritos detectados por estes sonda conjuntos seria afectada por uma alteração na actividade de um dado miARN. O primeiro passo da nossa análise foi, assim, para identificar estes conjuntos de sondas e os miARNs para que detectem actividade. Fizemos isso mapeando a sequência das sondas, e determinação da sua posição no gene em relação aos locais de miARN alvo previsto para o gene.

MIRABELLE usa os valores de expressão medidos por estes conjuntos de sondas para calcular um escore de atividade biológica para cada semente miRNA. Basicamente, ele toma como entrada um conjunto de dados de expressão gênica e compara, em cada amostra, os níveis de expressão de sonda conjuntos que são indicadores confiáveis ​​para a atividade de uma determinada semente de miRNA “miR-semente”, com os níveis de outra sonda conjuntos de expressão presente na matriz, que servem como referência. A saída de MIRABELLE é um “matriz miR actividade”, fornecendo as contagens de actividade para cada família miARN (identificado pela sequência de semente), e cada amostra. Por convenção, as contagens positivas são dadas quando os alvos para uma regulação negativa visor família miARN, indicando que a actividade biológica dos miARNs cognatos é aumentada na amostra, enquanto que os valores negativos são obtidos por regulação positiva de alvos, sugerindo uma actividade diminuída.

Métodos

ferramenta de Mirabelle

Mirabelle toma como entrada um conjunto de dados de expressão e produz uma matriz atividade miR-semente, dando para cada amostra no conjunto de dados, os escores de atividade calculado para cada um dos miRNA espécies para as quais existem previsões. Os valores positivos são obtidos quando os alvos para uma dada miR-semente visor mais regulação negativa do que a referência, indicando que a actividade desta miR-semente é aumentada na amostra, enquanto que os valores negativos são obtidos por regulação positiva de alvos, sugerindo uma actividade diminuída. Esta ferramenta é escrito em Perl.

Mir-sementes escore de atividade cálculo

Mirabelle primeira padroniza os níveis de expressão do gene relatados no conjunto de dados de entrada usando Z-scores, para corrigir a sensibilidade variando de sonda -sets, e disparidade entre o nível médio de transcritos presentes no tecido. Em seguida, ele usa a estatística t para calcular os escores de atividade, comparando, em cada amostra, os Z-scores de sonda conjuntos que são detectores de confiança de um determinado miR-semente, com os Z-dezenas de outras sondas-sets. Usamos o, de duas amostras estatística t de duas atado, com variância desigual (duas amostras estatística t de Welch). Em um conjunto de dados de expressão de genes misturadas aleatoriamente, a variância dessa estatística é 1, e sua distribuição é normal quando se baseia em pelo menos 20 detector de sonda-sets.

miRNA tem como alvo as previsões

Neste estudo , usamos TargetScan 4,0 previsões (Julho de 2007) de alvos de miRNA [18], [19]. TargetScan 4.0 usa a conservação evolutiva e determinantes contexto específico para prever alvos de miRNA. TargetScan 4,0 previsões estão disponíveis para cerca de 158 diferentes sementes conservadas miRNA, representativas de cerca de 450 miRNAs maduros no humano. Entre estes Mir-sementes, quatro foram detectados de forma segura por menos de 20 sondas conjuntos no microarray, e foram, portanto, excluídos da análise.

Mapeamento de sonda-sets para miR-sementes

em Affymetrix micromatrizes de expressão génica, é comum ter vários conjuntos de sondas para o mesmo gene, cada um reconhecendo um sequência diferente. De acordo com a localização das sequências reconhecidas pela sonda-conjuntos, é possível determinar se uma determinada sonda-conjunto detecta apenas isoformas que transportam um local alvo de miR-semente, ou também isoformas que podem estar isentas do local alvo de miR-semente . Sonda-sets detecção exclusivamente transcrições transportando um alvo miR-semente estão mais fortemente afetada pela regulação do miRNA que sonda conjuntos que detectam uma região do gene partilhado por transcrições que não possuem a sequência alvo miR. Assim, um passo antes da nossa análise foi atribuir a cada sonda-set disponível no microarray uma lista de miR-sementes que vão afetar todas as isoformas detectados pela sonda-set. Utilizou-se a seguinte regra de atribuição de sondas conjuntos de miR-sementes: quando a sequência correspondente a uma dada miR-semente é reconhecida directamente por uma sonda-definida ou está localizado a montante para as sequências detectadas pela sonda-definido no gene e no mesmo exão, consideramos esta sonda-definido para ser um indicador confiável da atividade para este miR-semente. No entanto, se a sequência correspondente a esta miR-semente está localizada a jusante das sequências reconhecidas pela sonda-set, a sonda-set pode detectar mRNAs curtas que não contêm uma série de sites-alvo de miRNA, e nós não atribuí-lo ao miR -semente. Realizamos esse mapeamento usando o banco de dados navegador genoma UCSC [22], de construção humana 17 (https://genome.ucsc.edu). Nós baixado as previsões TargetScan do website (https://www.targetscan.org) e mapeou-los para o genoma UCSC; usamos a tabela “knownGene” para locais cromossômicos mapeamento para genes; utilizou-se o “affyU133Plus2” e tabelas “affyU133” para encontrar a localização de sequências reconhecidas pela sonda conjuntos nos genes (Texto S1).

Os conjuntos de dados analisados ​​

Pappilary carcinoma de tireóide e câncer de mama conjuntos de dados foram obtidos a partir do banco de dados GEO [23], a adesão do banco de dados GSE3467, GSE3744 e ArrayExpress [24], a adesão e-MEXP-882. Utilizou-se os valores normalizados de expressão a partir da base de dados. Quando os dados brutos estava disponível, nós o download do mesmo e renormalized-lo usando GCRMA, RMA e MAS 5.0 pacotes em Bioconductor [25]. previsões e enriquecimento dos alvos subregulado Mirabelle não foram significativamente afetadas pelo algoritmo de normalização utilizado. Experiências de validação de transfecção com microRNAs e antagomirs foram obtidos a partir do banco de dados do GEO, GDS1858 adesão, GDS2657 e GSE3425.

TF enriquecimento análise

locais (BS) para TF A ligação foi determinada por digitalizar o promotores de todos os conjuntos de sondas presentes na micromatriz Affymetrix para jogos com matrizes TRANSFAC, como descrito em [26]. Em cada promotor, os 500 pares de bases (pb) imediatamente antes do início de transcrição foram digitalizados, de acordo com o fato de que TFBS mais ativos aparecem perto do local de início da transcrição [27]. A distribuição hipergeométrica foi usado para avaliar o enriquecimento entre o conjunto de fundo da sonda-sets e um conjunto de amostras.

GO Anotações

Nós usamos as anotações processo biológico ir para a matriz U133Plus2 do site Affymetrix ( https://www.affymetrix.com).

Estatísticas

Foi utilizado o bicaudal, t de duas amostras-teste com igual variância, a fim de identificar as Mir-sementes que mostram a mais desvios significativos em tumores comparada tecidos normais, e classificou-se estes MIRs de acordo com este teste. Este teste foi realizado no Excel. Foi realizada uma amostra de Kolmogorov-Smirnov (KS) testa para avaliar a normalidade da distribuição dos escores de atividade miR computados por Mirabelle no conjunto de dados, e de duas amostragens testes KS para comparar as distribuições de escores de atividade miR computados a partir do original e uma aleatoriamente dataset baralhada. Os testes KS e os histogramas associados foram realizados em Matlab 7 (Mathworks). Os testes de enriquecimento foram realizadas utilizando a função de distribuição cumulativa hipergeométrica em Matlab.

Enriquecimento de genes regulados negativamente com o aumento do número de sítios-alvo miR (Tabela 1)

Para um dado conjunto de miR -sementes, foram realizados testes de enriquecimento de forma iterativa para cada

i

entre 0 e o número máximo de sites de destino, como se segue. O tamanho total da população (N) foi o número de sondas conjuntos informativos com pelo menos

i

locais alvo para o conjunto considerado de miR-sementes, o número de sondas conjuntos de relatórios downregulation foram contados como sucessos (m ). Testamos para o enriquecimento de regulação baixa na amostra de sonda conjuntos de detecção, pelo menos,

i + 1

locais-alvo para estas Mir-sementes.

Enriquecimento de anotações GO (Tabela S6)

Nós usamos a distribuição hiper-geométrica para identificar as anotações mais significativamente enriquecido na amostra de 9542 sonda conjuntos associados com os 77 mir-sementes, no que diz respeito à população de todas as sondas conjuntos na matriz (a). 5069 dessas metas miR foram efetivamente regulados negativamente em tumores. Na segunda análise, identificamos as anotações mais significativamente enriquecido na amostra de 5069 sonda conjuntos reprimidos, no que diz respeito à população dos 9542 metas previstas (B).

Resultados

Validação do método Mirabelle

em primeiro lugar, o método validado Mirabelle em tecidos onde a abundância de um determinado miRNA tinha sido experimentalmente aumentado. Lim et al. [11] transfectadas células HeLa com miR-124, miR-1, e miR-373 e medido de expressão do gene após 12 e 24 horas. Wang et al. [28] As células HepG2 transfectadas com miR-124 e expressão do gene medida a vários intervalos de tempo. Nós submetidos os dados de expressão de genes para análise Mirabelle, que calculou a atividade de miR-semente para cada amostra. Nas amostras que foram transfectadas com microRNAs, nossa ferramenta identificou corretamente aumentos muito significativos na atividade microRNA, especificamente para o MIR-sementes miR-124, miR-1 e miR-373, nos experimentos correspondentes (Texto S1). A fim de assegurar que MIRABELLE é adequado para a detecção de alterações de actividade miARN ocorrendo

In vivo

, foram analisados ​​os dados de expressão de gene gerados na experiência de Krützfeldt et al., Em que o miR-122 foi silenciado por injecção sistémica de um antagomir [29]. Descobrimos que a nossa ferramenta identificou corretamente a diminuição significativa da atividade de miR-122 que ocorre após o tratamento com o antagomir (Texto S1).

Inferindo atividade MicroRNA em papilar da tiróide humana Carcinoma

papilar da tiróide Carcinoma (PTC) é um tumor maligno que é responsável por ~ 80% dos cancros da tiróide humanos. Dois estudos independentes relataram alterações específicas dos níveis de miRNA em PTC. Foi, portanto, interessante para quantificar a actividade biológica do miARNs em PTC utilizando a ferramenta MIRABELLE e compará-los com as alterações nos níveis de expressão de miARN relatados nestes dois estudos.

He et al. [30] mediram os níveis de miRNA em amostras de tecido de 15 pacientes PTC utilizando microarrays miRNA. Concomitantemente, eles também utilizados microarrays Affymetrix para determinar a expressão do gene em tumores nove (t-PTC) e nove tecidos circundantes emparelhados (N-PTC). Foram analisados ​​os dados de expressão gênica utilizando Mirabelle para inferir uma matriz atividade miR-semente (Tabela S1). Como evidente a partir deste quadro, as pontuações da actividade de miR-semente foram substancialmente maior nos tumores do que nos tecidos normais, o que sugere que tumores PTC são caracterizados por uma intensificação da actividade miARN. Na verdade, o escore de atividade miRNA mediana em tumores é maior do que o escore de atividade mediana em amostras normais para 97% das Mir-sementes. Para determinar os miR-sementes para as quais o aumento da actividade é o mais pronunciadas em tumores, utilizou-se o teste t de duas amostras para comparar as pontuações da actividade obtidos a partir de amostras normais e de tumores (Tabela S2). He et al., Relataram que o miR-146, o miR-221, o miR-222 e miR-21, exibido a sobre-expressão mais dramática em tumores com níveis de 19 a 4 vezes mais elevada em tumores do que no tecido adjacente. O teste t aplicado aos nossos escores de atividade (usando apenas o subconjunto de sementes que foram usados ​​por He et al., Em sua matriz microRNA) identificou com sucesso os 3 Mir-sementes pertencentes a estes 4 microRNAs entre as seis mais significativa

p

-Valores (de 65 sementes diferentes). Assim, no caso da PTC, os principais Mir-sementes identificados pela sua atividade biológica coincidem com os principais miRNAs overexpressed.

A partida entre as nossas previsões e as medições biológicas não é incidental e como mostramos abaixo, os resultados de um sinal muito forte presente na expressão do gene. As contagens de actividade calculados pela ferramenta MIRABELLE são baseados em t-estatísticas, e na ausência de uma regulação comum destes genes, estas estatísticas seguem uma distribuição normal. A Figura 1A mostra a distribuição dos valores de actividade de miR-sementes em tecidos normais e tumorais. Pode ser visto que a actividade pontuações são significativamente maior nos tumores do que nos tecidos normais (

P

10

-125 por um teste de Kolmogorov-Smirnov (KS)). Como controle, foram computados os escores de atividade hipotéticas sobre o mesmo conjunto de dados depois de baralhar aleatório da sonda-sets (Fig. 1B). Neste último caso, o teste KS não detectar uma diferença significativa entre a distribuição de pontos de actividade em tumores e tecidos normais, como seria de esperar.

(A) Histograma mostrando a distribuição de pontos de actividade de miR-semente computados para tumor (vermelho) e amostras normais (ciano) no conjunto de dados carcinoma papilífero da tireóide. Actividade de miARNs é globalmente mais elevado nos tecidos tumorais em relação a tecidos normais. O teste KS rejeita a hipótese de igualdade das distribuições de escores de atividade em tumores e em tecidos normais, com um valor-p P≈10

-126. Normalidade dos escores de atividade é rejeitada com P 10

-300. (B) Para mostrar que o desvio entre os valores calculados para os tecidos normais e tumorais não é devido ao nosso método de cálculo dos escores de atividade, foram computados os escores de uma permutação aleatória da sonda conjuntos do conjunto de dados PTC. Para ambos os tecidos normais e tumorais, os escores de atividade seguem aproximadamente uma distribuição normal, como seria de esperar para uma estatística t. Não há desvio observável entre tumor e tecidos normais, e o teste KS não rejeitam a igualdade das duas distribuições. (C) Histograma mostrando a distribuição dos escores de atividade miR-semente computados para tumor (vermelho) e amostras normais (ciano) no conjunto de dados de câncer de mama. miARN actividade é significativamente mais elevada em tecidos tumorais em relação a tecidos normais. O teste KS rejeita a hipótese de igualdade das distribuições de escores de atividade em tumores e em tecidos normais, com um valor-p P 10

-298. (D) Histograma mostrando a distribuição dos escores de atividade miR-semente para uma permutação aleatória da sonda conjuntos do conjunto de dados de mama.

Inferindo atividade MicroRNA no cancro da mama

Tendo encontrado que a atividade microRNA é aumentado globalmente em carcinoma papilífero da tireóide, procedeu-se a investigar a atividade miRNA no câncer de mama, que é o segundo tipo mais comum de câncer, e um assunto de estudos extensivos sobre a expressão do gene, com alguns conjuntos de dados muito valiosos disponível em repositórios públicos . Richardson et al., Publicado um estudo de expressão de genes em cancro da mama [31], que se baseia num conjunto de dados, que incluiu sete amostras de tecidos normais e de 40 tumores da mama, entre os quais 18 eram cancros basais-like (BLC), um pouco diferenciado e forma altamente agressiva de câncer. A matriz de actividade inferida para este conjunto de dados aparece na Tabela S3. Como demonstrado na Figura 1C, o nível de actividade biológica de miARN em amostras de tumor é aqui também significativamente maior do que em amostras normais; o teste KS mostra que os escores de atividade em tumores e amostras normais têm uma distribuição distinta (

p Art 10

-298). Comparando-se os escores de atividade medianos em câncer e amostras de tecidos normais, todos, mas quatro Mir-sementes parecem ter maior atividade no câncer do que no tecido normal. Mesmo depois de escolher um corte restritiva da

p Art 3 · 10

4 (correspondendo a um nível de significância de 0,05, após uma correção de Bonferroni para testes de múltipla), encontramos que 77 (fora do 150) mir-sementes têm uma maior atividade significativa em tumores (Tabela S4). Ao todo, os microARNs correspondentes a estes 77 miR-sementes são previstos por TargetScan para regular a cerca de 6000 genes. O aumento da actividade de miARN observa-se, de facto reflecte-se numa diminuição marcada na expressão destes genes alvo. Dos 9.542 sonda conjuntos associados com transcritos regulados por um destes 77 miR-sementes, 5069 (53,1%) têm expressão média mais baixa em tumores (isto é, os genes alvo correspondentes são regulados negativamente) do que em tecido normal, em comparação com 41,6% de todos os 40.539 sonda conjuntos na matriz (

p Art 10

-147 por um teste hypergeometric, Figura 1)

para fornecer suporte adicional para nossa conclusão de que microRNAs. são a principal causa da regulação negativa destes genes em massa, examinou-se o grau de regulação negativa do gene-alvo, em função do número de locais de ligação associados, para as miR-sementes. Esta investigação foi motivada por observações anteriores sugerindo que a degradação do mRNA após a ligação da miRNA é mais eficiente para transcritos que transportam vários locais-alvo para miRNAs [32] – [34]. A Tabela 1 resume as tendências observadas de expressão para a sonda-conjuntos que são mapeados para os 77 miR-sementes que exibem o aumento mais significativo da actividade em tumores. Como mencionado acima, 9.542 sonda conjuntos de detectar transcritos que têm, pelo menos, um local de ligação para miR-sementes, 53,1% deles exibindo baixa regulação dos tumores. Quando se considera os 6.574 sonda conjuntos de detecção de transcritos portadores de, pelo menos 2 sítios-alvo, a percentagem aumenta para 54,4% (p 1,3 · 10

-4 por um teste hypergeometric), e continua a aumentar por sonda conjuntos de detecção transcrições que transportem mais locais para miRNA vinculativo, atingindo cerca de 70% para os 228 sonda conjuntos de detectar transcritos com mais de 15 sites de destino. É notável que, apesar de MIRABELLE algoritmo não usar o número de miRNA sites em suas pontuações cálculos da actividade de ligação foram calculados a partir da sonda conjuntos identificados como indicadores de uma miR-semente, independentemente do número de locais de ligação podem transportar-o miARNs que identificadas como sofrendo uma mudança de actividade significativa, exibido um efeito de dose-resposta claro. Assim, o aumento gradual da proporção de genes regulados negativamente com o número de sites de destino fornece um forte apoio à noção de que a diminuição da expressão de genes-alvo é de fato devido ao aumento da atividade de miRNA.

Uma vez que muitos genes são regulados por várias espécies de miRNA, queríamos garantir que a infra-regulação mundial detectado de genes alvo de miRNA não foi devido ao aumento em apenas algumas espécies específicas de miRNAs (que compartilham genes alvo com as outras espécies miRNA) fora deste conjunto de 77 miR ativa -sementes. Para este fim, foi realizado o teste de enriquecimento hipergeométrico descrito anteriormente (isto é ,. teste para o enriquecimento de genes regulados por baixo entre sonda-conjuntos que detectam alvos de, pelo menos, um de miR-sementes no conjunto examinado) de uma maneira iterativa. Na primeira iteração, examinamos o enriquecimento hypergeometric obtido quando se consideram os padrões dos alvos de apenas o primeiro miR-semente de expressão. Na segunda iteração, examinámos o enriquecimento hipergeométrico obtidos quando se analisam os padrões de os alvos dos primeiro e segundo MIR-sementes de expressão, e assim por diante. Notavelmente, o melhor resultado foi obtido quando se considera os alvos dos primeiros 74 miR-sementes, confirmando que, de facto, quase todas as 77 espécies originais biologicamente activos de miARN contribuir para a regulação negativa observada expressão. Para garantir que estes resultados não foram devido a características específicas dos dados analisados, foram investigados outros conjuntos de dados de câncer de mama, tais como E-MEXP-882 [35], e processado-los com diferentes esquemas de normalização (GC-RMA, MAS5.0) . Utilizando o teste de hypergeometric, encontramos uma regulação negativa semelhante significativo de genes alvo de miRNA (81 biologicamente activas Mir-sementes, p 10

-134 teste de enriquecimento hypergeometric), promovendo o reforço da hipótese de que a regulação negativa mundial de genes miRNA alvo observado em câncer de mama não é específico para um determinado estudo.

uma causa potencial para a regulação negativa observada de genes alvo de microRNA pode ser a ação de fatores de transcrição (TFS), que co-regulamentar esses genes [36]. Procura de locais de ligação TF conhecidos nas regiões promotoras dos transcritos-alvo de cada uma das 77 Mir-sementes, encontramos um enriquecimento significativo (

p Art 0,05) para 82 TFs (métodos). locais de ligação para estes TFs foram encontrados em 30% da sonda-conjuntos presentes na matriz. Após a exclusão de todas as transcrições com sítios de ligação putativos para os TFs, nós ainda observamos um p-valor muito significativo para o enriquecimento de genes regulados negativamente entre os alvos de miRNA (p 10

-96).

Em seguida, partimos para listar os genes que foram previstos para os locais alvo 77 miR-sementes e portanto se espera que sejam afectados pelo aumento da actividade de miARN (Tabela S5). Nós funcionalmente caracterizada-los usando ontologia gênica (GO) anotação, e olhou para o enriquecimento estatístico de anotações específicas (Tabela S6). Esta análise mostra que vários processos biológicos foram representadas entre genes alvos destes miRNAs: regulação da transcrição, desenvolvimento e diferenciação, ciclo ubiquitina, transdução de sinal, transporte e supressão do tumor (categoria sinônimo: regulamentação da progressão através do ciclo celular) (FDR

p Art 10

-9). Como se viu anteriormente, a maioria destes genes indicadas diminuiu valores de expressão em tumores, mas não todos. Nós olhamos para as anotações funcionais que pudessem caracterizar a sonda conjuntos que foram reprimidos em tumores, em comparação com as outras metas previstas que não foram eficazmente reprimidos. Descobrimos que a detenção do ciclo celular foi a anotação mais significativamente enriquecido (FDR

p Art 2 · 10

-2), sugerindo que os genes miRNA-regulados que causam paragem do ciclo celular são, na verdade reprimidos em tumores.

Uma vez que a eficiência do silenciamento de genes por microRNAs melhora com o número de sites de destino, nós olhamos para os genes que transportam o maior número de sítios-alvo para os nossos 77 mir-sementes. Isto corresponde à parte superior da Tabela S5. De acordo com os melhores identificado anotações GO, encontramos genes que regulam a transcrição de genes:

CPEB4

(elemento de poliadenilação citoplasmática de ligação 4), que codifica uma proteína acreditado para controlar a tradução induzida por poliadenilação no início do desenvolvimento, tem o número mais elevado de alvo sites (38), e é regulada negativamente. Dois outros membros da família CPEB,

CPEB2

e

CPEB3

, também aparecem no alto da lista, com 26 e 25 sites de destino, respectivamente, e também são reprimidos;

DDX3X

(DEAD caixa de polipeptídeo 3, X-linked), um RNA helicase, tem 33 sítios-alvo, e sua sonda-sets associados também relatam regulação negativa (p = 0,002, 0,00001);

Deixe uma resposta