PLOS ONE: Genes microRNA Orthologous estão localizados no cancro-associadas Genomic Regiões em Humano e do rato

Abstract

Fundo

Os microRNAs (miRNAs) são curtas RNAs não-codificantes que regulam a diferenciação e desenvolvimento em muitos organismos e desempenham um papel importante no cancro.

Metodologia /As principais conclusões

Usando uma base de dados pública de locais de inserção retrovirais mapeadas a partir de vários modelos de ratos com câncer demonstramos que inserções retrovirais MLV-derivados são enriquecidas em estreita proximidade com o mouse miRNA loci. inserções Agrupamentos de regiões associadas a cancro (Comum locais de integração, CEI) têm uma maior associação com miRNAs que as inserções não agrupados. Dez loci miARN CIS-associado contendo 22 miARNs estão localizados dentro de 10 kb de inserções CEI conhecidos. Apenas um locus de miARN associada CIS-se sobrepõe a um gene que codifica a proteína RefSeq e seis loci situam-se mais de 10 kb a partir de qualquer gene RefSeq. miRNAs CIS-associados, em média, são mais conservada em vertebrados do que miRNAs associados com inserções não da CEI e dos seus homólogos humanos também estão localizados em regiões perturbadas no câncer. Além disso, mostramos que genes de miRNA são enriquecidas em torno de regiões promotoras e /ou de terminação de genes RefSeq tanto rato e humano.

Conclusões /Significado

Nós fornecemos uma lista de dez miRNA loci potencialmente envolvidos no desenvolvimento de cancro do sangue ou tumores cerebrais. Há suporte experimental independente de outros estudos para o envolvimento dos miRNAs de loci miRNA pelo menos três CIS-associado no desenvolvimento do câncer

Citation:. Makunin IV, faisão M, Simons C, Mattick JS (2007) Orthologous MicroRNA genes estão localizados no cancro-associadas Genomic Regiões em humanos e camundongos. PLoS ONE 2 (11): e1133. doi: 10.1371 /journal.pone.0001133

Editor do Academic: Christopher Arendt, Sanofi-Aventis, Estados Unidos da América

Recebido: 26 de julho de 2007; Aceito: 15 de outubro de 2007; Publicação: 07 de novembro de 2007

Direitos de autor: © 2007 Makunin et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este trabalho foi apoiado pelo Conselho de Pesquisa australiano. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

Os microRNAs (miRNAs) são moléculas de RNA curtas, ± 22 nucleotídeos de comprimento, capazes de executar funções de regulação. Em particular, miARN pode suprimir a tradução por não-perfeito emparelhamento para 3 ‘UTRs e /ou causar a degradação de ARNm no caso de uma combinação perfeita entre o alvo de ARNm de miARN e [1]. Parece que miARNs não têm qualquer actividade catalítica, mas sim actuam como guias específicas para a sequência de complexos de proteínas associados que são responsáveis ​​pela supressão de tradução ou a degradação de ARNm [2]. O número de miRNAs conhecidos está crescendo rapidamente, e centenas de miRNAs verificados são anotados em humanos, mouse e outros organismos (miRBase, https://microrna.sanger.ac.uk).

Uma série de observações ponto de uma ligação entre miARNs e cancro, o que não é surpreendente, dado o seu papel central em muitos processos celulares e de desenvolvimento (para revisões ver [3] – [5]). Um grande número de miARNs humano e de ratinho têm também sido mostrado para ser localizado em regiões associadas com o cancro [6], [7]. A expressão de vários miARNs é alterada no cancro e perfilamento miARN pode ser usado para a classificação do cancro precisa [8]. A expressão ectópica de o

mir-17-19b aglomerado

acelera a formação de tumores em ratinhos e foi consequentemente classificados como um oncogene potencial [9].

retrovírus, tais como o vírus da leucemia murina (MLV ), podem causar a formação de tumores em mamíferos. proviral inserções podem activar proto-oncogenes ou levar à inactivação de genes supressores de tumor na proximidade dos locais de inserção. locais de integração retroviral pode ser determinada em animais com cancro utilizando PCR inversa ou técnicas semelhantes, e mapeada para a sequência do genoma. Regiões que abrigam vários locais de inserção em estreita proximidade um do outro são os candidatos mais óbvios para a causa do desenvolvimento do câncer e são muitas vezes chamado comuns Sites Integração (CISS). Em geral, os candidatos para os genes supressores de tumores ou proto-oncogenes são seleccionados a partir de genes codificadores de proteínas com base na proximidade de CISs.

telas genome-wide Numerosos foram efectuados de rato para identificar genes envolvidos na carcinogénese, especialmente tumores hematopoiéticos [10] – [18]. Os dados obtidos a partir de várias telas em diferentes modelos de cancro (incluindo estudos com ratos geneticamente modificados) foi compilado no Cancer Gene Retroviral Tagged banco de dados (RTCGD, https://rtcgd.ncifcrf.gov) [19], que também fornece anotações para o UCSC genoma navegador [20]. No RTCGD, CISS são definidas como regiões que contêm duas inserções localizadas dentro de 20 kb, 3 inserções dentro de 50 kb, e quatro ou mais inserções de até 100 kb no mesmo modelo de cancro (ver seção FAQ do RTCGD em http: //rtcgd. ncifcrf.gov) (para detalhes, ver [17]).

No entanto, alguns CISs não mapear perto de qualquer sequência de codificação de proteína conhecida ou anotada. Mostrou-se que as inserções de retrovírus na vizinhança do

mir-17-92

miARN polycistron causa formação de tumor e aumentar a expressão de miARN, indicando que a mutagénese retroviral pode ser uma ferramenta potente para a descoberta de miARNs oncogénicos [21] , [22]. Considerando o papel regulador emergente de microRNAs na diferenciação celular e câncer analisamos a associação entre locais de integração retroviral acessíveis ao público e conhecido loci miRNA no genoma do rato. Descobrimos que os loci de miARN são significativamente enriquecidas nas imediações do CISs o que sugere que alguns destes miARN loci também podem ser considerados como candidatos proto-oncogenes ou genes supressores de tumores.

Resultados

Murino miRNA loci associado com os locais comuns de integração retrovirais

Nós analisados ​​co-localização entre miRNAs do mouse e locais de integração retrovirais determinadas a partir de camundongos que desenvolveram câncer. Para esta análise foram utilizados os 363 miARNs a partir do registo de miARN (https://microrna.sanger.ac.uk) que foram mapeados para 381 locais dentro da fracção bem montada do genoma do rato (quatro miARNs mapeado para mais do que um localização). Os locais correspondem às posições genômicas de sequências precursoras de miRNA. Utilizou-se o banco de dados RTCGD contendo 2373 locais de integração retrovirais dentro comuns locais de integração (inserções CIS) e 3119 locais de integração retroviral mapeados fora do CISs (inserções não-CIS). Foram excluídos os nossos locais de integração de análise de Sleeping transposons de beleza porque inserções não-CEI de A Bela Adormecida são distribuídos de forma não aleatória entre os cromossomos: cromossomos 1, 4, 6 e 15 do porto mais de metade de todos os locais de integração Bela Adormecida não CEI.

Usando um espelho local do navegador genoma UCSC descobrimos que inserções da CEI estão localizados dentro de 5 kb de 17 miRNAs murino e dentro de 10 kb de 22 miRNAs. Exemplos de co-localização entre miARNs e inserções CEI são mostrados na Fig. 1 e uma lista completa de miARNs CIS-associado é dado na Tabela 1. Além disso o aumento da distância (passado 10 kb) não resultou num aumento significativo do número de miARN associados com inserções de cis (Fig. 2) indicando que a associação entre miARNs e inserções da CEI é máxima em distâncias curtas.

Cada painel representa 20 kb de ADN genómico. triângulos azuis indicam locais de integração retroviral, os carrapatos vermelhos representam miRNAs, caixas pretas e linhas mostram a posição de transcritos emendados. (A) CHR11: 87,562,001-87,582,000. (B) chrX: 48,977,001-48,997,000. (C) CHR14: 113,914,001-113,934,000. Genoma de montagem MM8.

Os diamantes azuis representam o número de miRNAs localizados à distância indicada ou menos a partir de inserções da CEI, e os diamantes vermelhos correspondem a miRNAs localizados à distância indicada ou menos a partir inserções não CEI. A linha de tendência para miRNAs associados com inserções não-CEI é mostrada como uma linha pontilhada vermelha.

Nós usamos uma simulação de bootstrap para estimar a significância estatística da co-localização entre os locais de integração retrovirais e miRNAs (ver Materiais e Métodos). Porque alguns miARNs estão agrupados no genoma e, por conseguinte, distribuídos de maneira não uniforme, que miARNs agrupados em loci através da adição de 5, 10, 20 ou 30 kb de cada lado do local de miARN e combinando as regiões sobrepostas. Este agrupamento é necessário para manter miRNAs em cluster e em tandem repetidas como unidades individuais (loci) durante o processo de inicialização. Regiões de os mesmos tamanhos foram colocados aleatoriamente no genoma de ratinho e casos de sobreposição com os locais de integração retrovirais foram contadas. O número de miRNA loci que estão localizados a 10 kb ou menos de inserções da CEI é de aproximadamente 5,5 vezes maior do que a observada para loci colocados aleatoriamente, e a probabilidade de obter um número tão por acaso é estimado em 1,7 × 10

-5. O enriquecimento diminui com o comprimento dos loci miARN, e a probabilidade de obtenção de uma sobreposição semelhante entre miARN loci e inserções CEI por acaso é maior para distâncias maiores (Tabela 2). Os dados do programa de inicialização indicam que a associação mais forte entre miRNA loci e inserções da CEI está em distâncias curtas, até 10 kb. De acordo com isso, o número de inserções retrovirais CEI perto miARNs individuais é também altamente enriquecido em distâncias curtas, e o enriquecimento diminui com a distância.

inserções não-cis é enriquecida na vizinhança de miARN loci

Foi analisada a co-localização entre miRNAs e inserções retrovirais mapeados fora do CISs. Essas inserções não-CEI são locais de integração retroviral não agrupado obtidos em telas de câncer. O seu papel (se houver algum) na tumorigénese não é clara e assim estas inserções são geralmente omitidos da análise. Baixa saturação em algumas telas de cancro sugere que algumas inserções não-cis pode ser localizado em regiões envolvidas na tumorigénese, mas, por outro lado, é possível especular que alguns são apenas subprodutos da tela do cancro.

o número de miARN localizada a uma determinada distância a partir de não-CIS insere aumenta proporcionalmente com a distância entre a miARN e a inserção não-cis (R

2 = 0,9396), enquanto que o número de miARNs associada com inserções da CEI não exibe tal uma dependência linear forte (Fig. 2) (R

2 = 0,7831). A associação de miRNA com inserções da CEI é melhor descrita por uma linha de tendência logarítmica com R

2 = 0,945 (ver Materiais e Métodos). A simulação de bootstrap mostrou um enriquecimento significativo de miARN loci associados com inserções não-cis, especialmente para distâncias menores do que 5 kb (Tabela 3). O número de locais de integração retroviral não-cis nas imediações do miARNs tem um enriquecimento ligeiramente maior do que o enriquecimento de miARN loci. Um exame mais aprofundado de miRNA loci associados com inserções não-CEI revelou vários loci com duas inserções não-CEI independentes localizados muito próximos uns dos outros. Por exemplo, entre 13 miRNA loci (16 miRNAs) com inserções não-CEI dentro de 10 kb, dez loci têm uma única inserção, e três loci tem duas inserções. Essas inserções em locais próximos foram isolados a partir de diferentes modelos de câncer, razão pela qual essas inserções foram classificados como não-CIS. Analisou-se a distribuição de distâncias entre inserções não-CEI no genoma. Não há aumento significativo do número de insertos de não-cis localizado dentro de 3 kb um do outro, enquanto que o número de inserções não-cis em distâncias mais longas é mais ou menos uniforme quando medido em caixas de 1 kb. Um total de 332 fora de 3119 inserções fora de CISs estão localizados dentro de 3 kb do outro.

Nós removemos todas as inserções não-CEI localizados dentro de 3 kb um do outro e repetiu a análise de bootstrap. No entanto, mesmo este conjunto de dados mostra o enriquecimento de aproximadamente duas vezes de miARN loci associados com inserções não-cis separados por 3 kb ou mais (Tabela 4). O enriquecimento é similar para todas as distâncias analisadas, mas a associação em distâncias mais longas é estatisticamente mais significativo.

Com base nesta análise de bootstrap concluímos que loci miRNA mostrar a associação mais forte com inserções da CEI em distâncias curtas (menos de 10 KB ). Em distâncias menos de 10 kb o enriquecimento de miRNA loci sobreposição com inserções da CEI é duas vezes maior do que o enriquecimento de miRNA loci sobreposição com inserções não CEI. Em longas distâncias, tais como 30 kb, loci miRNA mostram uma associação similar ambos com CEI e não CEI inserções.

loci microRNA são enriquecidas em torno começa e termina de genes codificadores de proteínas

sabe-se que a integração de vírus de leucemia murina e vectores derivados de MLV preferencialmente ocorre em torno das regiões promotoras [23]. Com efeito, dos 3119 sítios retrovirais não-CIS do banco de dados RTCGD, 1.190 (38%) estão localizados dentro de 5 kb de locais de iniciação de transcrição anotadas de genes RefSeq (ocupando ~6.8% do genoma). Isto representa mais do que o enriquecimento de 5 vezes, maior do que o enriquecimento de inserções não-cis cerca de miARN loci (Tabelas 3 e 4). Fora de 2373 inserções da CEI, 989 (42%) estão localizados dentro de 5 kb de locais de iniciação de transcrição anotadas de genes RefSeq.

Foi analisada a distribuição de miRNA loci no genoma do rato com respeito a genes RefSeq. Fora dos 381 locais de miARN, 155 (41%) Genes RefSeq sobreposição que ocupam 32% do genoma do rato. Entre estes, 22 (6%) miARNs sobrepõem exões (2% do genoma), e 133 (35%) estão localizados em intrões (30% do genoma). Surpreendentemente, descobrimos que miRNAs são enriquecidos perto do início ou o fim de genes: 69 (18%) e 72 (19%) miRNAs estão localizados dentro de 5 kb de sites de início da transcrição de genes ou finais RefSeq, respectivamente (~2.6 e ~2.8 dobrar enriquecimento). No total, 105 (51%) locais de miRNA estão localizados dentro de 5 kb, quer desde o início, final ou ambos ( enriquecimento 3 vezes). Além disso, miARNs mostrar ligeiramente maior enriquecimento em regiões onde os locais de início de genes são separados a partir de sítios de extremos do gene por menos de 10 kb (dados não apresentados).

MicroRNAs associados com inserções não-cis tendem a estar perto de promotores genes RefSeq enquanto miARNs CIS-associados tendem a ser distante a partir de promotores. Por exemplo, 13 miRNA loci (16 miRNAs) têm inserções não-CEI mapeadas dentro de 10 kb. Destes, 9 loci (69%) estão localizados dentro de 10 kb de partidas gene RefSeq, enquanto que dos 10 loci miRNA CIS-associado apenas 4 têm menos de 10 kb de partidas gene RefSeq. Seis loci miARN CIS-associado contendo 17 miARNs situam-se mais de 10 kb de distância a partir de promotores de genes RefSeq, indicando que a associação observada entre miARNs e CISs não é explicada pela co-localização de miARNs perto dos genes. Uma tendência semelhante é observada para miRNA loci 5k (miRNAs dentro de 5 kb de outro): de 10 miRNA loci 5k com os não-CIS RIS dentro de 5 kb (Tabela 3), 7 sobreposição começa gene RefSeq. De 7 miRNA loci 5k com RIS CIS dentro de 5k (Tabela 2), 3 sobreposição começa gene RefSeq.

Curiosamente, miRNAs humanos também são enriquecidos em torno dos locais de início da transcrição ou fim de genes RefSeq. Há 543 miRNAs anotados no genoma humano mapeado para 474 locais exclusivos precursores de miRNA. Fora desses locais de miARN 474 108 (23%) estão localizados dentro de 5 kb de RefSeq de início da transcrição do gene e /ou sítios de extremos de enriquecimento (2,2 vezes). Nós fundiu estes 474 locais em 311 miRNA loci 5k através da adição de 5 kb de cada lado do precursor e depois criou a união pares de bases sábio (OR) de locais. Fora dos 311 miARN loci 5k 92 (30%) se sobrepõem quer de iniciação da transcrição ou locais finais de genes RefSeq, ou ambos. Estes loci conter 92 110 (23%) de miARN precursores. Parece que miARN loci na vizinhança de locais de iniciação da transcrição ou finais contêm menos do que precursores de miARN miARN loci localizado mais longe a partir de genes (1,2 e 1,7 precursores de miARN por loci, respectivamente).

miARNs associada-cis e são conservadas seus ortólogos humanos estão localizados em regiões associadas a cancro

miRNAs CIS-associados têm algumas características comuns. A maioria (21 em 22) associado miARNs-cis estão localizadas fora de genes codificadores de proteínas RefSeq. A excepção,

mir-135a-1

Deixe uma resposta