PLOS ONE: Processamento alternativo do RNA U2 pequeno nuclear produz um fragmento 19-22nt com relevantes para a detecção de não-pequenas células do cancro do pulmão em Serum

Humana

Abstract

RNU2 existe em duas formas funcionais (RNU2 -1 e RNU2-2) distinguem-se pela presença de um único motivo de 4 bases. investigação detalhada de conjuntos de dados obtidos a partir de profunda sequenciamento de cinco tumores primários de pulmão humano revelou que ambas as formas expressar a uma taxa elevada de um fragmento 19-22nt (miR-U2-1 e -2) de sua região 3 ‘e contém as 4-bases motivo . sequenciação de profundidade de piscinas independentes de amostras de soro de dadores saudáveis ​​e de doentes com cancro de pulmão revelou que o miR-U2-1 e -2 são processados ​​de forma generalizada no tecido pulmonar por meio de clivagem endonucleolítica estavelmente e exportados para o sangue. Em seguida, as experiências de hibridação de microarranjos de amostras normais /tumorais correspondentes revelaram uma significativa sobre-expressão de miR-U2-1 em 14 de 18 tumores primários de pulmão. Posteriormente, qRT-PCR de miR-U2-1 usando soro de 62 pacientes com câncer de pulmão e 96 vários controles demonstrou que os seus níveis de expressão de identificar os pacientes de câncer de pulmão, com sensibilidade de 79% e especificidade de 80%. expressão de miR-U2-1 correlacionada com a presença ou ausência de cancro do pulmão em pacientes com doença pulmonar obstrutiva crónica (DPOC), outras doenças do pulmão – não o cancro, e em controlos saudáveis. Estes dados sugerem que é uma nova RNU2-1 ncRNA bi-funcional, que produz um fragmento de 19-22nt que podem ser úteis na detecção de cancro de pulmão de forma não invasiva em pacientes de alto risco

citação:. Mazières J, C Catherinne , Delfour O, S Gouin, Rouquette I, Delisle MB, et ai. (2013) Processamento alternativo do U2 pequeno RNA nuclear produz um fragmento 19-22nt com relevantes para a detecção de não-pequenas células do cancro do pulmão em soro humano. PLoS ONE 8 (3): e60134. doi: 10.1371 /journal.pone.0060134

editor: Liang-Hu Qu, Sun Yat-sen University, China

Recebido: 23 de novembro de 2012; Aceito: 21 de fevereiro de 2013; Publicação: 20 de março de 2013

Direitos de autor: © 2013 Mazières et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este programa , mais particularmente coleta de sangue, foi apoiado por uma bolsa do Conselho Regional Midi-Pyrénées. Os financiadores não tiveram nenhum papel no desenho do estudo, análise de dados, decisão de publicar ou preparação do manuscrito

Conflito de interesses:. Os autores declaram que não têm interesses conflitantes. A filiação de vários autores para Cepheid Empresa não altera a adesão dos autores para todas as políticas de PLoS ONE.

Introdução

A exploração do RNA não-codificantes de proteínas (ncRNAs) transcriptoma em As células e tecidos humanos tem sido focada sobre o perfil do microARNs. O surgimento de tecnologias Next Generation Sequencing de alto rendimento (NGS) permitiu a identificação de novos tipos de ncRNAs e abriu o caminho para o estudo de suas associações funcionais [1]. A maioria das novas espécies ncRNA estão agora descoberto usando NGS aproxima [2] – [5]. Desde ncRNAs funcionais são pensados ​​para ser protegido da degradação, em virtude da sua associação com proteínas e embalagem em partículas, e, portanto, são estáveis, NGS oferece a vantagem única de ser capaz de detectar a expressão simultânea de milhares de pequenas transcritos de RNA funcionais numa única tipo de tecido, revelando um novo nível de complexidade na produção de pequenas ncRNAs em células humanas, tecidos, órgãos e sob várias condições fisiológicas [2], [4], [8]. A elevada sensibilidade dos métodos NGS também permitiu a descoberta de anteriormente não detectados “isomirs« produzido por mecanismos de edição pós-transcricional, single-nucleotide não-modelo ‘de adenosina 3 ou adições uracila servindo como um exemplo [6], [7]. Além disso, foi demonstrado recentemente que uma única ncRNA pode gerar diferentes produtos não simplesmente através de degradação aleatória, mas sim através de sintonização específica dos vários passos de processamento envolvendo Dicer [9] ou outras enzimas [10], [11]. Tal processamento alternativo ncRNA poderia explicar como um único transcrito primário ncRNA pode subserve mais do que uma função, de forma análoga ao processamento alternativo dos transcritos de pré-ARNm. Assim, a crescente coleção de ncRNAs bi-funcional está oferecendo uma nova visão da biologia humana, como visto através das lentes da NGS.

Essas classes recém-descobertas de pequeno RNA produzido por ncRNAs com outro share função de algumas características em comum com microRNA. Existe agora ampla evidência que vários ARNt produzir-ARNt derivados pequenos RNAs reguladores (smRNAs) [9], [11] – [13]. pequenos RNAs abundantes 18-22 nt de comprimento, são processados ​​a partir de ambas as extremidades 5 ‘e 3’ do ARNt maduras, bem como a partir de regiões de reboque a 3 ‘do pré-ARNt. O madura “população 3 (também chamado Tipo I) foi encontrado para ser Dicer dependentes e complexado com Argonautes 1-4. Em contraste, a população de reboque do pré-ARNt 3 ‘(Tipo II) é Dicer independente e aparentemente envolve a acção da RNase Z. Além disso, os RNAs do tipo II foram encontrados para ser complexada com Argonautes 3 e 4 e, em muito menor extensão para Argonautes 1 e 2 [13]. Concentrados em nucléolos, função de várias snoRNAs no processamento de ARN ribossomal (ARNr) da subunidade do ribossoma durante a biossíntese e montagem. No entanto a maioria deles serve como guia para a modificação enzimática de ARNr alvo e snRNAs spliceosomal U6 nos nucleótidos seleccionadas pela ARN: ARN anti-sentido interacções [14], [15]. SnoRNAs são classificados em dois grupos, a caixa /D snoRNAs C que catalisam 2 ‘O ribose metilação [16], ea caixa snoRNAs H /ACA que introduzem modificações pseudouridina [17]. bioinformática recentes analisar bibliotecas de ARN pequenos têm sugerido a existência de smRNAs derivadas de certos dos snoRNAs seguinte processamento [18] – [21]. H /ACA e da caixa C /D derivado ncRNAs utilizar vias biogênese divergentes, dependendo do tipo de precursor a ser processado snoRNA [21] – [23]. ncRNAs H /ACA-derivados são predominantemente 20-24 nt de comprimento e têm origem a partir da extremidade 3 ‘. A sua produção é independente de Drosha, mas requer a acção de Dicer [18]. Em contraste, o C /D derivado ncRNAs são ou 17-19 nt ou 27 nt de comprimento e predominantemente se originam a partir da extremidade 5 ‘[21]. A grande variedade de suas estruturas secundárias, sugere um processamento independente Dicer com base na actividade de endonuclease ago2 semelhante processamento de pré-miR-451 [24]. Vários exemplos de smRNAs derivados de ARNt ou snoRNA precursores já ter sido demonstrado que têm possíveis funções biológicas [9], [11], [27], [28].

Curto lê também são produzidos a partir de uma ampla variedade de outros tipos de ncRNAs estruturado como 7SL, 5S, Y1 e Y3 [25]. Os RNAs vault que estão envolvidas na resistência a múltiplas drogas e o transporte intracelular em seres humanos têm sido recentemente demonstrado para produzir um grupo de ~ 23 nt Os ARN de uma etapa de processamento Drosha-independentes mas Dicer mediada por [26]. Um dos ncRNAs está ligado às proteínas Argonaute e medeia a clivagem do mRNA, mimicing que os principais recursos micro-RNA-like derivada da abóbada.

Todos estes exemplos sugerem que o processamento alternativo de ncRNAs podem representar um importante mecanismo pelo qual diversidade funcional de ncRNAs é alcançado, e além disso implica que a nova camada de influência e controlo regulamentar imposta pelo ncRNAs sobre a expressão gênica pode ser fundamental para a biologia. Só podemos imaginar o impacto potencial de smRNAs derivado de ncRNAs com outra função na expressão de intermediários metabólicos em diferentes estados fisiológicos, bem como a influência sobre os principais mediadores da transdução de sinal em estados fisiopatológicos alterados, como o câncer.

Em contraste com snoRNAs e ARNt, pouco se sabe sobre snRNAs que são componentes do complexo spliceossoma, dirigindo a remoção precisa de sequências intrónicas de pré-ARNm [29]. No entanto, experiências recentes NGS sugeriu que snRNAs spliceosomal U1, U2, U6 e U12 acumular seqüências de RNA pequenos [25], enquanto a imunoprecipitação com proteínas Argonaute permitiu a identificação de fragmentos de RNA Ago-vinculados a partir U1, U2 e U12 [30]. Mais recentemente, um fragmento de RNU2-1 mostrou sobre-expresso em cancros pancreáticos e colorrectais relativamente a tecido normal, a partir desses órgãos [31]. Para melhor compreender se a expressão de fragmentos pequenos ncRNA resultantes de processamento alternativo está relacionado com a presença da doença, foram medidos os níveis de fragmentos produzidos pela U2 snRNA por várias metodologias no tecido do pulmão e no soro de pacientes com cancro do pulmão, e comparou-os com os níveis RNU2 no soro de pacientes com risco de câncer de pulmão (pacientes com DPOC), bem como indivíduos de controlo saudáveis. RNU2 é um dos ncRNAs mais altamente expresso e que é preferencialmente expresso no tecido pulmonar [32]. NGS combinando, experiências de hibridação microarray e qRT-PCR, foi realizada uma análise detalhada de smRNAs derivados de RNU2 em tumores primários de pulmão, emparelhado tecido pulmonar normal adjacente dos mesmos pacientes, e amostras de soro de pacientes com câncer de pulmão e controle de indivíduos saudáveis, bem como controles com outras doenças pulmonares – não cancerosas. Os resultados sugerem que miR-U2, um produto 19-22nt de processamento alternativo RNU2, permite a discriminação de pacientes com câncer de pulmão de pessoas com DPOC, mas nenhum caso de câncer, e levanta a possibilidade de que as medições baseadas em soro de níveis de miR-U2 pode ser usado como uma ferramenta de rastreio precoce não-invasivo e de baixo custo para selecionar pacientes para uma avaliação mais aprofundada com diagnósticos avançados de imagem, como tomografia computadorizada espiral.

Materiais e Métodos

Amostras Coleção

As amostras de tecido e amostras de soro foram coletadas no Hospital Rangueil e Hospital Larrey, Toulouse, França. consentimento informado por escrito foi obtido de todos os indivíduos antes de sua inscrição neste estudo, eo estudo foi aprovado pelos conselhos de revisão institucionais adequadas. Todos os registros foram anónimos para proteger a confidencialidade individual. Os dados clínicos foram obtidos para cada indivíduo, no momento da colheita de sangue ou de tecido. estágio clínico foi determinado de acordo com o 7

th Associação Internacional para o Estudo do Câncer de Pulmão sistema [33] encenação. Durante oito pacientes dos dezoito que foram operados por câncer de pulmão, tumor primário emparelhados e amostras de tecidos normais distais foram recolhidos. O sangue de pacientes com câncer de pulmão foi coletada no momento do diagnóstico, mas antes da ressecção do tumor ou qualquer tratamento específico. Cinco ml de sangue foram coletadas de cada indivíduo em tubos de SST e imediatamente processado. Os tubos foram misturados por algumas inversões, e, em seguida, colocar à temperatura ambiente durante 30 min para a coagulação. Os tubos foram em seguida centrifugados (1.000 g, a 4 ° C) durante 10 min. Finalmente, a fracção de soro foi dividido em alíquotas em tubos de 1 ml e imediatamente armazenados a -80 ° C até ao momento da utilização. 45 amostras de controlo saudáveis ​​foram também adquiridos a partir de Asterand e processado de forma idêntica. Organizamos esta coorte em cinco grupos. Três grupos de controle conter indivíduos sem cancro do pulmão: 1) apenas as pessoas sem quaisquer sintomas da doença no momento da coleta de sangue. Eles podem ser considerados indivíduos “saudáveis”. 2) pacientes com uma doença pulmonar, não é DPOC. Este grupo é composto principalmente de pessoas que sofrem de asma, bronquite, e infecções pulmonares. 3) pacientes com DPOC, sem qualquer prova de cancro do pulmão, no momento da colheita de sangue. Pacientes com câncer de pulmão foram divididos em dois grupos: 1) todos os pacientes com câncer de pulmão sem quaisquer sintomas da DPOC, e 2) os pacientes que sofrem tanto de um câncer de pulmão e DPOC

purificação de extração de RNA

.

o ARN foi extraído a partir de 0,5 ml de soro utilizando o mini kit da Qiagen miRNeasy, de acordo com as instruções do fabricante. Um pico-in de controle (Cel-miR-39) foi adicionado após o primeiro passo de desnaturação.

arquivados ou recém-congelados instantaneamente amostras de tecido foram homogeneizadas por almofariz e pilão em Trizol® Reagente Life Technologies (Carlsbad, CA ) e o RNA foi ainda extraída de acordo com o protocolo do fabricante. A fração de RNA pequeno foi extraído usando o Flash PAGE Fracionador (Ambion). Todas as amostras de microRNA foram diluídas em água sem RNase e armazenadas a -80 ° C.

sequenciamento profundo e tratamento de dados

preparação Biblioteca e sequenciamento de experimentos usando RNA purificado a partir de tecido ou soro espécimes foram realizados por Fasteris (Suíça). Resumidamente, fragmentos de ARN (16-30 nt ou 25-50 nt) foram purificados em gel seguido por ligação de RNA de cadeia simples 3 ‘e 5’ adaptadores. Um passo de purificação em gel de acrilamida foi realizada antes da transcrição reversa e de amplificação por PCR para gerar a biblioteca de ADN molde colónia. Os ADNc foram purificados em gel e a biblioteca foi quantificada antes da diluição a 10 nM. As bibliotecas de ADNc foram diluídos em seguida, sequenciados usando a tecnologia Ilumina HiSeq. A sequência lê foram processados ​​por uma combinação de algoritmos e bioinformática curadoria manual para remover os adaptadores 5 ‘e 3’ de extremidade (Tabela S7). Apenas as leituras de 19nt longo ou mais após a remoção do adaptador foram retidas para análise. 5 ‘e 3’ descasamentos foram aparadas até perfeita do jogo lê. Lê a partir dos diferentes bibliotecas foram normalizados utilizando o número total de leituras em cada biblioteca e expressa como leituras por milhão (RPM) com a finalidade de comparar os níveis de expressão relativos. Apenas lê com um jogo exclusivo para o genoma humano foram utilizadas (NCBI construir 37). Assim, lê mapeamento para genes RNU2 funcionais mapear para nenhum outro local do genoma. Sem inadequações internas foram autorizados. Para uma maior confiança, apenas RNA com um mínimo de cinco RPM foram considerados para análise mais aprofundada.

Experimentos microarrays de hibridização

Nexterion (Schott) lâminas de vidro microarray foram utilizados como suporte sólido para o microarray. Personalizado na casa projetada oligonucleotídeos foram vistos em sua superfície. A etiquetagem do microRNA foi adaptado de Castoldi et al. 2006 [34]. A fracção microARN marcado foi hibridado com as matrizes manchadas usando a estação de hibridação Discovery (Ventana, Tucson, AZ). As matrizes foram digitalizados usando o scanner Axon (Molecular Devices, Sunnyvale, CA) e os dados foram coletados por meio de software GenePix. Seis em casa projetada spike-nos controles internos foram usadas para normalizar os dados. Estes controlos de ARN sintéticos foram adicionados à fracção de RNA total antes de hibridação. Todas as sequências para as quais a intensidade da mancha foi maior do que a intensidade média local mais fundo 1,5 vezes o seu desvio padrão foram categorizados como microARNs expressas. normalização estatística dos dados foi feita por computação o Log

2 proporção em que o Log

2 ratio = sinal de média intensidade das manchas duplicadas /intensidade mediana de todos os controles internos para o bloco. A normalização foi feito por bloco para evitar a rotulagem não homogénea (Tabela S4). dados de microarranjos foram analisados ​​utilizando o pacote de R bioconductor [35]. A expressão relativa de cada microARN foi calculada utilizando a 2

método -ΔΔCT [36]. O “MeV 4.8.1” (MultiExperimentViewer) [37] foi utilizado para análise de agrupamento hierárquico, onde miRNAs selecionados foram agrupados utilizando distância euclidiana.

qRT-PCR de miR-U2 expressão

Expression níveis de miR-U2-1 foram avaliados por qRT-PCR utilizando o costume Exiqon LNA

iniciadores TM (Exiqon, Vedbaek, Dinamarca) de acordo com as instruções do fabricante. Embora os iniciadores foram desenhados para detectar a isoforma UGGAUUUUUGGAGCAGGGAG os iniciadores Exiqon permitir a detecção das outras isoformas (Tabelas S5 e S6). As experiências foram realizadas em triplicado. Por causa da falta de arrumação soro pequenas ncRNAs, que normalizada concentração microARN ao volume inicial de soro (500 ul). Um controlo espiga em exógeno (Cel-miR-39) foi também utilizada a fim de verificar a solidez dos resultados. Calculou-se o valor ΔCt matriz para cada amostra, subtraindo o valor do número de ciclo limiar (Ct) para o miR-U2 a partir do valor de Ct de Cel-miR-39. Uma análise de uma via de variância (ANOVA) foi utilizado para a análise estatística comparando as populações de amostras e os grupos de controle. A área sob a curva (AUC) foi calculada para as curvas de operação do receptor (ROC). Resultados determinada utilizando a normalização ao Cel-miR-39 pico-in e normalização de volume de soro foram comparados.

Resultados e Discussão

tumores primários de pulmão altamente expressar uma ncRNA 19-22nt processado a partir de RNU2

O genoma humano codifica dois genes snRNA U2 funcionais, RNU2-1 e RNU2-2 que estão localizados em 17q21.31 e 11q12.3 respectivamente. A organização genómica dos dois genes RNU2 difere radicalmente. RNU2-2 está presente em uma única cópia enquanto RNU2-1 é organizado em um conjunto de 6 a ~ 30 cópias em tandem repetidas que medem de 30 a 150 kb. Cada unidade de repetição é de 6,1 kb de comprimento, contém um único gene RNU2-1 e é altamente conservada com outras unidades repetidas. Embora RNU2-1 difere em número de cópias do gene de indivíduo para indivíduo, as matrizes são estavelmente herdada, sujeito à compensação de dose e transcritas em uma taxa anormalmente elevada. A fim de descobrir se pequenos ncRNAs pode ser eficazmente processados ​​a partir dos dois genes RNU2 funcionais e para delinear tais produtos precisamente, sequenciaram o pequeno transcriptoma ARN de cinco tumores primários do cancro do pulmão humanas, bem como três grupos de amostras de soro, uma a partir de dadores saudáveis e dois doentes com cancro de pulmão (Tabela 1). Sequenciar amostras relacionadas em paralelo minimiza a taxa de falsa descoberta de ncRNAs. ncRNAs que são verdadeiramente sobre-expresso seria esperado para ser encontrados em várias amostras independentes. Num primeiro passo, nós mapeado o lê sequenciado a partir de sete bibliotecas preparados a partir de tumores primários, cinco curto tamanho (16-30nt) e dois longos tamanho (25-50nt) directamente para a sequência de ARN dos genes RNU2 funcionais. O locus RNU2-1 no cromossomo 17 foi realmente removido da montagem do genoma humano desde a versão Construir 37 (NCBI Anotação Informação Gene ID: 6066, atualizada em 20-Apr-2012). A grande maioria dos lê a partir dos cinco bibliotecas porte curtas mapeia em uma localização única entre as posições 93 e 114 da RNU2-1 (Fig. 1a-b). As gamas mais altamente expresso lê de 19 a 22nt de comprimento. Este fragmento de ARN é chamado miR-U2-1. Notavelmente, pequena seqüenciamento RNA das três piscinas de amostras de soro demonstrou que miR-U2-1 está presente na circulação sanguínea em ambos os pacientes com câncer de pulmão e indivíduos saudáveis, revelando sua expressão generalizada (Fig. 1c-d). Estes dados sugerem que o miR-U2-1 está activamente exportados, em vez de passivamente libertada para a circulação. Apenas um subconjunto de miARNs foi de facto detectado fora das células [38] -. [41], assim miR-U2-1 pode representar um outro membro desta classe

pequena lê detectada em tumores primários (a) e as amostras de soro (c). Longo lê detectada em tumores primários (e). O código de cor mostra o número de leituras normalizada detectada em cada biblioteca. A linha vermelha localiza miR-U2. O número de leituras de acordo com o seu tamanho é dado em (b) para os tumores primários, em (d) para as amostras de soro.

Entre a população de leituras presente em tumores primários como bem como no soro, observou-se uma acumulação de fragmentos de ARN a partir de posição “a-94” ou “a-95” e terminando na posição “G-113” ou “a-114” (Fig. 2). Este número limitado de 5 ‘e 3’ lê corresponde a uma população definida e pequena de variantes ou isomirs, uma funcionalidade comum de microARNs. Juntos, estes isomirs miR-U2-1 representam mais de 75% das leituras correspondentes exclusivamente a esta região de RNU2-1. Os seus níveis de expressão são na gama de microARNs canónicos como miR16, miR-17, o miR-200a ou o miR-451 (Tabela S1). Esta acumulação significativa de um único fragmento de ARN e precisamente clivado RNU2-1 representa uma clara evidência que favorece a hipótese de que os acontecimentos de processamento específicos produzir um novo ncRNA funcional, miR-U2-1, em vez de a explicação alternativa, que estes são os produtos de aleatórios degradação de ARN. Estes resultados indicam ainda que o miR-U2-1 está protegido contra endo- e exo-nucleolítica digestão de RNase em virtude da embalagem em partículas complexas de nucleoproteínas. miR-U2-1 também pode ser envolto em pequenas partículas membranosas (exossomos, microvesículas, corpos apoptóticos) antes da exportação para a circulação. A maioria dos microARNs detectáveis ​​no soro são de facto concentrada em exossomas [42], embora alguns possam simplesmente ser associada com proteínas [43]. Tomados em conjunto, isto sugere que os eventos de processamento que produzem o miR-U2-1 representam processos biológicos essenciais em humanos.

(A) indica a sequência de cada leitura detectados e o número normalizado de cada leitura é dada para cada tumor espécime. (B) o número total de cada tipo de leitura é mostrado como um histograma. Histogramas (c) e (d) exibir o número de leituras nas diversas 5 ‘começa e 3’ de miR-U2, respectivamente.

As sequências dos genes RNU2-1 e RNU2-2 (187 nt) são altamente conservadas. As diferenças entre eles são restritas a duas mutações pontuais localizadas na extremidade 3 ‘(posições 170 e 187) e para uma mutação de 4 bases localizada nas posições 108-111 (Fig. S1). Notavelmente, RNU2-2 expressa também na mesma região com um tamanho idêntico (Fig. S2). O maior número de leituras detectadas para miR-U2-1 em comparação com miR-U2-2 é consistente com o maior número de cópia genómica do RNU2-1. Felizmente, a diferença de 4 bases (GCAG e AAUA em RNU2-1 e RNU2-2 respectivamente) distinguir os dois genes U2 está localizado dentro das sequências de miR-U2, que permite a discriminação dos dois produtos. Este polimorfismo não parece ter qualquer impacto perceptível no processamento, sugerindo mecanismos de biogênese semelhantes para miR-U2-1 e miR-U2-2. No entanto, as diferenças na sequência entre o miR-U2-1 e miR-U2-2 pode refletir a diversificação funcional adicional, talvez facilitando uma afinação fina de função reguladora por meio da seleção de destino ou do diferencial da proteína factores de ligação.

O uso de tecnologia NGS não é sem suas armadilhas. Está bem estabelecido que pequenos RNAs pode ser inadvertidamente cruzada mapeados para a região genómica errado. RNU2 genes são uma família complexa compreendendo mais de 50, o que torna pseudogenes erros de mapeamento cruzado distintamente possível. Foi recentemente relatado que dois imunoprecipitadas pequenos RNAs associada-Argonaute de 23nt e 30nt foram mapeados para dois pseudogenes U2 diferentes [30], as posições 168-187 do pseudogene U2 codificados pelo cromossoma 6 e as posições 95-125 da U2 pseudogene codificada pelo cromossoma 10, respectivamente. Estes dois fragmentos de mapear o ARN U2-1 funcional com 100% de identidade. Nós já havia notado que o locus RNU2-1 no cromossomo 17 foi realmente removido da Assembleia sequência do genoma humano Construir 37 (NCBI Anotação Informação Gene ID: 6066, actualizar 20-Abril-2012), e esta é a explicação mais provável a por isso que estes fragmentos de ARN mapeados para estes pseudogenes, em vez do próprio gene RNU2 funcional. Da mesma forma, dois microARNs curtas (19 nt), miR-1246 e miR-1290, fósforo miR-U2-1 com 100% de identidade e um desfasamento, respectivamente [44]. Mapeamento lê dos seus cinco bibliotecas curtos para os respectivos precursores destes dois microARNs [45] revelou inequivocamente que os dois precursores putativos de miR-1246 e miR-1290 são o resultado de falso-mapeamento. Os dois microRNAs maduros propostas estão realmente truncado versões de miR-U2-1. Esta foi confirmada indirectamente para miR-1246, quando as tentativas para sequenciar o seu precursor, no mesmo tecido em que o miR-1246 não foi detectado, sugerindo que o suposto precursor não existe [46]. Este resultado foi confirmado independentemente recentemente [31]. No que diz respeito miR-1290, existem dois possíveis locais genómicos que codificam poderia ela (Fig. S3), no entanto, nas nossas experiências é detectado no mesmo nível que o ruído de fundo associada com erros de sequenciação (Tabela S2). Conclui-se a partir destes dados que todos os resultados relacionados com miR-1246 e miR-1290 podem ser atribuídos a miR-U2.

A dupla função para os genes RNU2

Os resultados experimentais discutidos até agora sugerir uma dupla função para o RNU2-1 e RNU2-2 snRNAs. O seu 5 ‘do domínio contém o sítio de ramificação ARNm envolvidos em splicing do mRNA, enquanto que a sua 3’ do domínio codifica miR-U2 que contém o local de ligação de Sm e pode estar envolvido na regulação da expressão do gene. Esta partição funcional de RNU2 correlaciona-se com as diferenças observadas em características estruturais que existem na molécula (Fig. 3). A porção 5 ‘contém um número impressionante de modificações pós-transcricional incluindo 14 pseudouridylations e 10 nucleótidos metilados [47] – [49]. Em contraste, nenhumas modificações são identificados a jusante da posição 90 de RNU2, e este domínio contém mais extensa estrutura secundária, especialmente quando a sequência de precursor é incluído. Estas diferenças estruturais marcantes estão provavelmente relacionados com as respectivas funções diferenciais das duas metades de RNU2. Embora a 5 ‘do domínio é suficiente para induzir splicing do mRNA in vitro [50] – [52], não há nenhuma evidência quer a partir da literatura ou dos seus NGS experiências que qualquer parte da região 5’ de RNU2 acumulam nas células. Isto sugere um mecanismo de processamento alternativo que produz o RNU2 de tamanho completo, por um lado, e miR-U2 por outro.

A dobragem da estrutura secundária do precursor RNU2 é mostrado. localizações ip são a partir de [49]. nucleótidos metilados são indicadas pelo símbolo “

m”. Nucleotídeos no correspondem azul e verde à sequência de miR-U2-1. As letras verdes localizar os quatro mutações de nucleótidos entre o miR-U2-1 e miR-U2-2. Preto e letras vermelhas mostram RNU2 e RNU2 sequências específicas de precursor, respectivamente. setas azuis apontam em 5 ‘e 3’ de isomirs miR-U2. A seta vermelha indica a extremidade 3 ‘do RNU2. As duas pontas de seta preta apontar nos dois locais de clivagem internos identificadas neste trabalho.

A fim de melhor entender o mecanismo de miR-U2 splicing, nós sequenciado duas bibliotecas de cDNA para ncRNAs mais de miR-U2 (25-50nt longo) de modo a identificar potenciais produtos intermédios (Tabela 1). O número de longo lê mapeamento para RNU2 é consideravelmente mais baixa do que a observada nas bibliotecas de ADNc de tamanho pequeno, sugerindo que o intermediário de maturação é rapidamente degradado ou aparado para produzir a final microARN madura. Examinando a distribuição de leituras (medida em rpm) ao longo da sequência pré-RNU2, observa-se dois picos correspondentes aos dois fragmentos mais pequenos, que acumulam (Fig. 1E). Como esperado, uma mapas de pico para os maduros miR-U2, enquanto surpreendentemente o segundo mapas para final do RNU2 madura 3 ‘, uma região que não produz um ncRNA estável uma vez que não observá-lo em nossos resultados de sequenciamento do curta bibliotecas -sized. Este fragmento RNU2 corresponde exactamente ao fragmento 30nt longo ago1 [30] vinculativo. Isto sugere que a degradação da extremidade 3 ‘de RNU2 é impedido pela ligação do transiente atrás, mas, porque a protecção conferida por uma atrás é temporária, não dá origem a um produto ncRNA estável. Alternativamente, este produto pode ser degradada nos tecidos do pulmão por causa da ausência de outros factores, mas pode ser expressa em outros tipos de células ou tecidos. A diminuição do número de leituras de ambos os lados dos dois picos reflecte uma degradação dos intermediários de maturação por aparamento mecanismos de ambas as extremidades, ao passo que o vale entre eles localiza a posição de um local de clivagem endonucleolítica (endo 3 ‘) na vizinhança da posição 145 dentro da haste IV (Fig. 1e e a Fig. 3). Em contraste, o “meio 5 não contém qualquer fragmento protegido da degradação. No entanto, um segundo local de clivagem endonucleolitic (endo 5 ‘) parece estar localizadas entre as posições 70 e 80 no interior da haste Ilb.

Considerando as diferentes vias de processamento possíveis para RNU2, o primeiro passo envolve provavelmente a extremidade 3? clivagem na posição 187. podemos encontrar nenhuma leitura combinando o precursor específico esperado, indicando um evento precoce e rápido. Esta primeira etapa envolve uma base-emparelhamento entre a sequência específica precursor (posições 190-200) e posiciona 100-110 de RNU2 que é uma característica estrutural chave necessária para guiar o processamento da extremidade 3 ‘[53]. Notavelmente, este emparelhamento de bases ocorre com a região de miR-U2 e delimita precisamente as duas metades estrutural e funcionalmente distintas de RNU2 (Fig. 3). Em seguida, na ausência de ago1 de ligação, a ligação da proteína de Sm, provavelmente em combinação com outros factores como o U2A ‘e U2B “, pode estabilizar a RNU2 comprimento completo. Em contraste, a ligação a sequências ago1 miR-U2 pode induzir uma mudança para a via de clivagens endonucleolítica que cliva nas posições 70-80 e 145, respectivamente. Múltiplos e adjacentes pequenos sítios de ligação de ARN para ago1 são conhecidos para facilitar interações cooperativas que estabilizam a ligação Argonaute [54]. Desde ago1 não tem actividade enzimática, uma RNase devem ser recrutados para a maturação miR-U2, à semelhança do miR-like ncRNAs produzido a partir de snoRNAs e tRNAs. Finalmente, este precursor transiente é aparado rapidamente a partir de ambas as extremidades para se obter o madura miR-U2.

a ligação exclusiva de miR-U2 para ago1 [30], ao contrário da maioria dos microRNAs canónicos que também se ligam ago2 [ ,,,0],55], sugere um papel diferente para miR-U2. Embora a preponderância dos dados indica que microARNs regular a expressão génica no citoplasma e corpos de processamento, as quatro proteínas Argonaute e um número de microARNs foram recentemente descoberto no núcleo de células humanas. O transporte de pequenos RNAs em complexo com proteínas no núcleo Ago depende importina-8 [56]. Este mecanismo sugere sua possível interação com a cromatina e abre a alternativa emocionante do seu envolvimento directo em afetar processos nucleares, como splicing ou de transcrição, visando regiões promotoras do gene. Curiosamente, vários estudos recentes revelaram separação funcional entre ago1 e ago2 [57], bem como uma distribuição diferencial no núcleo em resposta ao promotor-alvo ARNsi durante o silenciamento do gene da transcrição [58] o que sugere que as proteínas Ago mediar a localização nuclear dos pequenos RNAs . Além de definir a atividade biológica de pequenos RNAs, proteínas atrás pode também definir a duração do microRNAs maduros [59].

Isso nos permite considerar a possibilidade de que o miR-U2 pode desempenhar papéis epigenéticas no nível do DNA onde ele poderia actuar como um regulador da expressão de regiões cromossómicas grandes. é de facto sabido que muitos promotores de genes supressores de tumores apresentam níveis mais elevados de metilação, o que sugere uma ligação possível com o risco de cancro. miR-U2 pode, por exemplo, participar em guiar metilação da citosina, um processo que é conhecido para ser responsivo a estímulos ambientais.

Deixe uma resposta