PLOS ONE: transcriptoma-Wide Análise de UTRs em Non-Small Cell Lung Cancer revela genes relacionados a câncer com as mudanças SNV-induzida sobre a RNA estrutura secundária e miRNA alvo Sites

Abstract

métodos de avaliação mutação tradicionais geralmente o foco na previsão de mudanças disruptivas em regiões codificantes de proteínas, em vez de não-codificante regiões reguladoras como regiões não traduzidas (UTRs) de mRNAs. As UTRs, no entanto, são conhecidas por terem muitas sequência e motivos estruturais que podem regular a eficiência de translação e transcrição e a estabilidade do ARNm através de interacção com as proteínas de ligação a ARN e outros RNAs não-codificantes como microARNs (miARNs). Em um estudo recente, transcriptomes de células tumorais abrigar do tipo selvagem mutante e

KRAS

(V-Ki-ras2 Kirsten sarcoma de rato oncogene viral homólogo) genes em pacientes com cancro do pulmão de células não pequenas (NSCLC) foram sequenciados para identificar variações de nucleotídeo único (SNVS). Cerca de 40% do total de SNVS (73,717) detectados foram mapeados para UTRs, mas omitido na análise anterior. Para atender a essa demanda óbvia para análise das UTRs, foi elaborado um gasoduto abrangente para prever o efeito do SNVS de dois elementos principais de regulação, estrutura secundária e locais alvo de miRNA. Fora de 29,290 SNVS em 6462 genes, prevemos 472 SNVS (em 408 genes) que afectam a estrutura secundária do RNA local, 490 SNVS (em 447 genes) que afetam locais alvo de miRNA e 48, que fazer as duas coisas. Juntos, esses SNVS disruptivas estavam presentes em 803 genes diferentes, dos quais 188 (23,4%) foram previamente conhecidos para ser associado a um cancro. Notavelmente, esta proporção é significativamente maior (teste exacto de p-valor unilateral de Fisher = 0,032) do que a proporção (20,8%) de genes associados ao cancro conhecidos (n = 1347) no nosso conjunto de dados inicial (n = 6462). A análise de redes mostra que os genes que albergam SNVS disruptivas foram envolvidos nos mecanismos moleculares de cancro, e as vias de sinalização de MAPK estimulada por LPS, de IL-6, iNOS, eIF2 e mTOR. Em conclusão, nós encontramos centenas de SNVS que são altamente perturbador no que diz respeito a mudanças na estrutura secundária e locais alvo de miRNA dentro UTRs. Essas mudanças têm o potencial de alterar a expressão de genes de câncer conhecidos ou genes ligados aos caminhos associados ao câncer

Citation:. Sabarinathan R, Wenzel A, Novotny P, Tang X, Kalari KR, Gorodkin J (2014) Análise transcriptoma-Wide de UTRs em não-pequenas células do cancro do pulmão revela genes do cancro-relacionadas com SNV-induziu alterações no RNA estrutura secundária e miRNA sites de destino. PLoS ONE 9 (1): e82699. doi: 10.1371 /journal.pone.0082699

editor: Akio Kanai, da Universidade Keio, Japão

Recebido: 02 de agosto de 2013; Aceito: 26 de outubro de 2013; Publicação: 08 de janeiro de 2014

Direitos de autor: © 2014 Sabarinathan et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Centro Dinamarquês para a Computação Científica (DCSC, Deic); Conselho Dinamarquês para a Investigação Estratégica (Comissão Programa em Estratégicos Technologies Crescimento); Conselho Dinamarquês para Pesquisa Independente (Tecnologia e Ciências de Produção). Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

Próxima geração do sequenciamento do genoma agora é amplamente utilizado para a identificação de variações genéticas em genomas do câncer [1], [2]. cancro do pulmão de células não pequenas (NSCLC) é a forma mais comum de câncer de pulmão e é encontrado frequentemente com mutações ativadoras no

KRAS

oncogene que faz com que as células do tumor a ser agressivos e resistentes à quimioterapia [3] – [5]. Em um estudo recente, Kalari et al. [6] realizaram a sequenciação de todo o transcriptoma de NSCLC e identificados genes diferencialmente expressos, isoformas de splicing alternativos e variantes de nucleotídeo único (SNV) para tumores com e sem

KRAS

mutações. Uma análise da rede foi efectuada com os genes que mostram uma expressão diferencial (374 genes), o splicing alternativo (259 genes) e as alterações relacionadas com o SNV (65 genes) que estão diferencialmente presentes em grupos de tumor de pulmão com e sem>

mutações . análise via integrada identificados NFkB, vias de ERK1 /2 e AKT como os caminhos mais significativos diferencialmente desregulados em

KRAS

do tipo selvagem, em comparação com o

KRAS

amostras mutantes.

A variante de um único nucleótido (SNV) é uma alteração de nucleótido na posição de uma única base que ocorre a uma frequência baixa (também referida como uma variante rara). SNVS observadas em células tumorais são principalmente variantes somáticas e muito poucos são variantes da linha germinal. estudo de associação genômica ampla (GWAS) relatam que SNVS ocorrem principalmente em regiões não codificantes em comparação com codificação (exônico) regiões de RNAs [7]. No passado, no entanto, a maioria dos estudos têm-se centrado sobre o efeito de SNVS nas regiões de codificação (conhecido como cSNVs ou nsSNVs) [8], em vez de o efeito de SNVS no DNA não codificadora reguladora ou não codificante de ARN (rSNV) . No caso de NSCLC, Kalari et ai. [6] identificou um total de 73,717 SNVS únicos presentes e em torno de (+/- 5 Kb) genes RefSeq. Destes, 23.987 foram cSNVs e seus efeitos sobre as regiões de codificação tenham sido previamente previstos (ver [6] para mais detalhes). Os efeitos de rSNVs que estão localizadas nas regiões não traduzidas (UTRs) dos genes codificantes de proteínas, no entanto, necessitam de ser analisados.

é bem conhecido que os UTRs desempenham papéis cruciais na regulação pós-transcricional, incluindo a estabilidade do ARNm [ ,,,0],9], os transportes [10], a localização [11], [12], a ativação de translação [13] e da repressão [14], [15]. Estes regulamentos funcionais são realizadas por

cis

elementos -regulatory presentes em 5 ‘e 3’ UTRs. Notavelmente, alguns dos

cis

elementos -regulatory são estruturados, por exemplo, elemento ferro-responsive (IRE), local do ribossoma interno de entrada (IRES) e sequência de inserção selenocisteína (SECIS). A estrutura primária de

cis

elementos -regulatory também é importante para a ligação de

trans

actuando proteínas de ligação a ARN ou outros RNAs não-codificantes. Por exemplo, microRNAs (miRNAs) são pequenos RNAs não-codificantes (cerca de 22 nt) que se ligam a locais alvo principalmente presentes em 3 ‘UTRs. Esta interacção resulta quer na clivagem do ARNm alvo ou repressão da sua tradução. Vários estudos têm relatado que a regulação de genes miRNA-mediada desempenha um papel importante em células cancerosas e essa regulamentação tem sido considerada como um alvo potencial da droga (veja o comentário [16]). Todas essas evidências suporta tanto sequência e motivos estruturais de UTRs sendo importante para o controle da expressão gênica.

A ocorrência de variação genética (s) em UTRs poderiam afetar a sua sequência e /ou motivos estruturais e, assim, levar a mudanças na regulação pós-transcricional [17] – [20]. Por exemplo, um SNP num local de deixar-7 miARN alvo (miRTS) na UTR 3 ‘de

KRAS

foi identificado para afectar a ligação de let-7 miARNs. Isto resulta em sobre-expressão de

KRAS

, levando ao aumento do risco de NSCLC [21]. Além disso, estudos recentes relatam que a variação genética pode, potencialmente, criar, alterar ou destruir alvos locais de miRNA, o que resulta na desregulação do mRNA alvo [22], [23]. Notavelmente esta tem sido identificada em células tumorais e também [24]. Além disso, uma mutação dirigida-cancro presentes em um IRES em

p53 humana

ARNm altera a estrutura do elemento de IRES, que inibe a ligação de um factor trans-acting essenciais para tradução [25]. O número recente de servidores web e bases de dados desenvolvidos para lidar com variantes afetando miRTSs também demonstra a importância crescente do site de destino variantes [22], [26] – [28].

Neste estudo, prever a os possíveis efeitos de 29,290 SNVS associada com NSCLC, que estão localizados nas regiões UTR do ARNm. O efeito local de SNVS sobre a estrutura secundária de UTRs está previsto utilizando RNAsnp [29] e o efeito de SNVS em miRTSs na UTR está previsto utilizando TargetScan [30] e Miranda [31], que foram mostrados para estar entre os mais fiável miRNA métodos de previsão de destino [32]. Os mapas miRNA-RNAm experimentalmente identificadas, utilizando Argonaute (atrás) de reticulação imunoprecipitação juntamente com sequenciamento de alto rendimento (CLIP-Seq), são ainda usados ​​para reduzir as previsões falsos positivos de miRTSs [33].

materiais e Métodos

As fontes de dados

Os SNVS identificados através RNA-sequenciação de 15 tumores adenocarcinoma pulmonar primária (8 com

KRAS

mutação e 7,

KRAS

mutação) foram extraídos a partir de Kalari et ai. [6]. Deve notar-se que o estudo anterior [6] tinha não há dados de sequenciação de ARN em células normais de modo que não foi possível separar SNVS derivadas da linha germinal ou mutação somática. Assim, o conjunto de dados obtidos, 29290 UTR SNVS em 6462, que codificam os genes derivados de ambas da linha germinal e variantes somáticas que foram expressos em tumores de adenocarcinoma de pulmão. Com base na sobreposição destes SNVS com o dbSNP (135 compilação), poderíamos estimam que 40% dos 29,290 SNVS são linha germinal variantes. Para aqueles SNVS que se sobrepõem com as entradas dbSNP, nós também extraiu o SNPs em ligação dis-equilíbrio usando o servidor SNAP [34] (versão 2.2; com os parâmetros padrão: r

2≥0.8, limite de distância de 500 kb, os dados SNP set 1000 Genomas piloto 1 e o painel população CEU).

sequências de mRNA RefSeq correspondentes aos 6462 genes (Build hg19) foram baixados do navegador genoma UCSC (https://genome.ucsc.edu) [35 ]. Para genes com múltiplas transcrições, foram consideradas todas as isoformas. Por mapeamento de 29,290 SNVS a estas sequências de ARNm RefSeq, obteve-se 3646 na 5 ‘UTR 25627, em 3’ UTRs e 17 em ambas as extremidades 5 ‘e 3’ UTR de sobreposição de transcrições. Estes SNVS foram ainda submetidos a nossa linha de produção global (Figura 1) para prever o seu efeito sobre a estrutura secundária do ARN e locais de miARN alvo, o qual está descrito nas secções seguintes.

Uma lista de genes associados ao cancro foi obtido a partir de CÓSMICA [36] e Qiagen /SABioSciences [37]. Esta lista inclui 1.347 dos 6462 genes considerados nesta análise. A fim de encontrar o enriquecimento de genes que transportam SNVS perturbadores, que têm efeito sobre a estrutura secundária e /ou miRTSs, no cancro, foi realizado um teste exacto de Fisher unilateral. Isto foi calculado a partir de uma tabela de contingência 2 × 2 (n = 6462) com o número de genes que transportam /não transportando SNVS disruptivas, por um lado e o número de associados ao cancro /outros genes, por outro lado. Do mesmo modo, o enriquecimento para SNVS disruptivas em genes associados ao cancro foi calculada classificando o número total de SNVS (n = 29290) em SNVS disruptivas /sem interrupção, por um lado, e aquelas, e não estando presente nos genes associados ao cancro por outro.

Um conjunto de exemplos experimentalmente verificados de SNPs com efeitos sobre sítios-alvo de miRNA foi extraído a partir da literatura (ver Tabela S1). Estes 19 SNPs (afectando 25 interações miRNA-RNAm) têm sido utilizados para testar os critérios de filtragem utilizados na parte miRNA do nosso pipeline.

Previsão do efeito SNVS ‘na estrutura secundária de RNA

A efeito do SNVS na estrutura secundária de RNA foi previsto usando RNAsnp (versão 1.1) [29]. As sequências de mRNA do tipo selvagem e as SNVS foi dado como entrada, juntamente com os parâmetros padrão de RNAsnp. Para cada SNV, RNAsnp considerada uma janela de +/- 200 nts em torno da posição SNV para gerar o tipo selvagem (WT) e mutantes subsequências (MT) e calculado suas respectivas matrizes de pares de bases e de probabilidade. Em seguida, a diferença entre a probabilidade de pares de bases de tipo selvagem e mutante estrutura foi medida utilizando a distância euclidiana (d) e o coeficiente de correlação de Pearson (r) para todas as regiões locais dentro da subsequência. Para completar, podemos resumir essas duas medidas da seguinte forma. O primeiro calcula a diferença entre duas matrizes directamente por (1), onde é a probabilidade de bases

i

e

j

ser emparelhado. A segunda medida utiliza as probabilidades par de posição-wise. Para uma região local, o vector contém os elementos. Em seguida, a diferença entre dois vectores e é medida por (2)

Finalmente, uma região local previsto com distância máxima euclidiana (d

max) ou o coeficiente de correlação mínimo de Pearson (r

min) eo p-valor correspondente é então relatado. Nós empregamos medidas tanto de forma independente como ambas as medidas mantenha seus respectivos pontos fortes e fracos (ver [29] para mais detalhes). Geramos duas listas (cada um com p 0,1) de candidatos, d

max e R

min, e cada um deles é submetida a uma correcção de vários testes usando o procedimento Benjamini-Hochberg [38], o que limita a taxa de descoberta de falsas para não ser mais do que um limiar escolhido (normalmente 10%).

para analisar se o RNAsnp previu locais região é estruturalmente conservada, utilizamos as anotações de RNA conservada previsões estrutura secundária da nossa in- casa gasoduto [39], que faz uso de uma série de ferramentas, incluindo CMfinder [40] e RNAz [41] programas.

a previsão do efeito SNVS ‘em sites de destino microRNA

Para cada SNV no conjunto de dados, uma subsequência de 30 nts em ambos os lados da posição SNV foi recuperado. Além disso, todas as 2042 sequências madura miRNA humanos de miRBase (v19) [42] foram usados ​​para detectar possíveis locais alvo em tipo selvagem e mutante (com SNV) subsequências. Como primeiro passo, TargetScan (versão 6.0) [30] foi usado para identificar pares de SNVS e miRNAs para o qual o tipo de correspondência de sementes difere entre o tipo selvagem e mutante ou só está presente em nenhum deles. Os tipos de sementes diferentes utilizadas pela TargetScan são 7mer-1a, 7mer-M8, e 8MER-1a (no aumento da força), onde “1a” refere-se a uma adenosina nas miRTS 3 ‘para o jogo de sementes (ou seja, em frente ao primeiro nucleótido do miRNA) e ‘-m8’ refere-se a um nucleotídeo Watson-Crick-correspondido na posição 8. Posteriormente, a energia de interação desses pares foi calculado usando miranda (versão 3.3a) [31]. Como uma mudança jogo semente já é exigido pela filtração TargetScan, os parâmetros para Miranda foram definidas para não pesar região a semente muito alto ( ‘-scale 2’ em vez de padrão 4) e com cortes relaxado (escore de 45, a energia -5 kcal /mol), a fim de capturar os casos em que um jogo de sementes pobre podem ser compensados. Para classificar uma interação como o trabalho que mais tarde aplicar um limiar de energia de forma mais conservadora de -11 kcal /mol com base em nosso estudo anterior [43]. Para cada par de miARN e 61mer, apenas o local de ligação mais forte (mais baixo) que difere entre WT e SNV sequência é retida. interações putativos são classificados como

criado

,

destruída

ou

alterado

em cima de mutação baseado em previsões Miranda. O

criar

conjunto contém sítios-alvo que são induzidas pela SNV, ou seja, têm uma energia interação de -11 kcal /mol ou menos na variante SNV, enquanto nenhuma interação é prevista no tipo selvagem (ou devido ao marcar ou limiar de energia). Da mesma forma, uma perda de site de destino seria registrada no

destruir

conjunto, se a interação está prevista para o tipo selvagem, mas não com a SNV. Finalmente, o

alterar

conjunto contém interações putativos que estão previstos com uma energia de ligação de, no máximo -11 kcal /mol, pelo menos, uma variante. Para estes, a diferença de energia observadas para a ligação de miARN antes e após a introdução SNV foi medida como o seu log-rácio

LR

= ld (/), para o 0. O

lr

é 0 se não houver nenhuma mudança na energia; negativo se o tipo selvagem tem o maior interacção (menor energia), positivo o contrário. Dado o tamanho do conjunto de dados, vamos nos concentrar nas (superior) candidatos cujos

lr

valor absoluto está acima da média (μ) de absoluta

lr

valores de todos os pares classificados como alter. A eficiência desse limite varia claramente com os dados, mas será sempre manter os melhores candidatos com maior diferença de energia relativa. Mesmo que não deve ser visto como um ponto de corte fixo, que aplicou ao nosso conjunto de exemplos conhecidos, onde 14 dos 23 interações excedem o valor foi aplicado aqui (ver Tabela S1). Valores de limiar com base na distribuição de alterações MFE têm sido utilizados de uma maneira semelhante antes [24].

De forma a reduzir as previsões falsas positivas, os locais de miARN alvo prevista para a de tipo selvagem (

destruir

ou

alterar

) foram cruzados com mapas de interação microRNA-alvo experimentalmente identificados. Esses dados, derivados através Atrás CLIP-Seq, foi baixado da Base Estelar [44]. Somente SNVS que estão localizados dentro rigorosas clip-Seq aglomerados de pico atrás, com uma complexidade biológica (BC) de pelo menos dois foram mantidos. Este filtro não pode ser usado para as interações do

criar

set, como dados CLIP-Seq está disponível para o único do tipo selvagem.

Finalmente, o conjunto de miRNAs foi filtrado para aqueles expressos no sistema respiratório (traqueia e pulmão) de acordo com o mapa de miARN corpo [45]. A visão geral da análise miRNA é descrito na Figura 2.

O fluxograma mostra as diferentes etapas de previsão e filtração com o número de SNVS individuais, miRNAs e pares destes em cada fase.

a partir do PhenomiR [46] banco de dados recuperado informações sobre miRNAs que foram encontrados para ser para cima ou para baixo regulada no cancro do pulmão. Este conjunto compreende 264 miRNA indivíduo adesões haste-laço, 3 dos quais são “entradas mortas”. Os restantes 261 tronco-loops dar origem a 430 produtos miRNA maduras, que nos referimos como

câncer de pulmão associada miRNAs

. Neste conjunto de dados, 27 miRNAs são específicos para NSCLC [47] tipo de acordo com o mapa do corpo miRNA [45]. O conjunto de dados mais tarde é referido como

associada a NSCLC miRNAs

.

Ingenuity Pathways Analysis

redes interactome de genes candidatos foram construídos utilizando software Ingenuity Pathway Analysis (IPA) (Ingenuity ® Systems, www.ingenuity.com; construir versão: 220.217; versão de conteúdo: 16542223). geração da rede baseia-se no ‘Global Network Molecular “no IPA, que compreende um conjunto extenso, com curadoria manualmente de relações gene-gene com base nos resultados da literatura científica. Os genes de interesse (candidatos lançados por nosso pipeline e usados ​​como entrada para IPA) que também estão presentes nesta rede global são os chamados genes de foco. genes foco altamente interligados são os pontos de partida na geração de rede. genes adicionais não-foco da Rede Global Molecular pode ser usado como genes vinculador entre pequenas redes. As redes são prorrogadas até um tamanho aproximado de 35 genes, que é considerado ideal para a visualização e interpretação (para mais detalhes veja [48]). O valor p calculado para cada rede representa a probabilidade de encontrar o mesmo (ou superior) número de genes no foco de um conjunto seleccionado aleatoriamente a partir de genes da rede global. Ele é calculado por um teste exato de Fisher direito de cauda com moléculas de foco (não) de um lado e moléculas (ou não) na rede do outro lado de uma tabela de contingência 2 × 2. Este é transformado em uma pontuação que é o logaritmo negativo do valor de p. Além disso, o IPA foi utilizado para identificar as doenças, distúrbios e melhores funções celulares e moleculares, e vias canónicos associados com os nossos genes em conjuntos candidatos (os chamados “genes de focagem”). O p-valor para um determinado (doença, função ou via) anotação descreve a probabilidade de que a associação entre o conjunto de genes de entrada e a anotação é devido ao acaso. Isso também é baseado em um teste exato direito de cauda de Fisher, conforme especificado acima.

Resultados

Efeito do SNVS na estrutura secundária de RNA

Os efeitos estruturais de 29,290 SNVS UTR foram previsto utilizando RNAsnp (v1.1). Tanto a distância euclidiana (d

max) e Pearson coeficiente de correlação (r

min) medidas de RNAsnp (modo 1) foram empregados de forma independente para prever o efeito do SNVS na estrutura secundária de RNA local. A distribuição dos valores p calculados para a UTR 29290 SNVS é mostrado na Figura S1A. A um nível de significância de 0,1 (escolhido do nosso estudo anterior [29]), 3237 e 3062 SNVS foram previstos, respectivamente, por d

max e r

mínimo de medidas. Além disso, o ajuste para múltiplas comparações (usando procedimento Benjamini-Hochberg [38]), desde 3204 e 1813 SNVS respectivos para d

max e R

mínimo de medidas. Após a fusão dessas duas listas, temos 3561 SNVS únicos em 2411 genes.

Além disso, calculou-se a distância entre a localização destes 3561 SNVS e da região previu, onde foi detectada a mudança estrutural máxima (Figura S1B) . Isso mostra que a maioria dos SNVS causar mudanças estruturais e em torno da posição SNV. Além disso, a distribuição do comprimento da região local previsto mostra que a maioria dos SNVS têm efeito sobre a região local de tamanho de 50 a 100 nt, no entanto, certos SNVS (n = 47) tem efeito sobre uma estrutura global, em que o tamanho do previsto região local for superior a 300 nts (Figura s1c). Além disso, verificamos se estas SNVS disruptivas são enriquecidas em GC ou UA regiões ricas, como as sequências com tal conteúdo de nucleotídeos tendenciosa têm mostrado mais sensíveis às mudanças estruturais causadas por mutações [49]. Para cada SNV calculamos o conteúdo GC das suas regiões de flanqueamento (como anteriormente usando 200 nts fluxo acima e para baixo), ver Materiais e Métodos. Isto mostrou que ambos os conjuntos de dados e SNVS SNVS perturbadores são altamente enriquecidos em regiões com teor de GC de 40 a 60 por cento (ver Figura S2), o qual deve, portanto, torná-los menos sensíveis a variações. Além disso, verificou-se que não houve diferenças significativas entre as distribuições de conteúdo GC de SNVS disruptivas e as SNVS conjunto de dados (veja a Figura S2 com Kolmogorov-Smirnov).

É sabido que as UTRs de mRNAs Harbor evolutivamente conservada elementos reguladores ([50] – [52], ver também os comentários [53], [54]). Assim, controlos cruzados para a sobreposição entre a região local interrompido previsto por RNAsnp eo RNA conservada estruturas secundárias previstas usando nossa in-house gasoduto [39] (ver secções Material e Métodos para detalhes). Curiosamente, a região local previsto para 472 SNVS (p-valor 0.1) se sobrepõem com as estruturas secundárias de ARN previstas conservada. Estes 472 SNVS correspondem a 408 genes; dos quais 111 SNVS correspondem a 98 genes que estão envolvidos nas vias associadas a cancro (ver arquivo S1.xlsx)

Com base no valor de p, os acima de 111 SNVS foram classificados em dois grupos: 28. como de alta confiança para os quais tanto d

max e r

min valor de p 0,05 (Tabela 1), eo outro 83 como de médio a confiança (ou d

max ou r

min p -valor 0,1) (ver arquivo S2.xlsx). Prevemos que as alterações estruturais induzidas SNV nas regiões UTR poderia potencialmente afectar a estabilidade do mRNA ou interromper a função de elementos reguladores presentes nas UTRs. Por exemplo, o SNV A2304C (Tabela 1) presente na UTR 3 ‘de

MAPK14

ARNm mostra uma mudança estrutural significativa (valor p: 0,0076) na estrutura secundária de RNA local, que é estruturalmente conservada de acordo com ambos CMfinder e RNAz previsões do nosso pipeline de casa em [39]. Esta conservação estrutural mostra que a região está sob pressão evolutiva para manter a estrutura, que é susceptível de ter alguma importância funcional. A proteína codificada por

gene MAPK14

é um membro da família MAP quinase, que é conhecido por estar envolvido em muitas vias relacionadas com a divisão celular, maturação e diferenciação (revisto em [55]). Além disso, ele foi previsto para ser um dos principais intervenientes no interactome câncer de pulmão [6]. Assim, a alteração na expressão gênica de

MAPK14

em um nível pós-transcricional devido à mudança estrutural induzida SNV poderiam afetar as vias de sinalização relacionadas com MAKP14.

Como outro exemplo, o gene da

GPx3

é responsável pela codificação de glutationa peroxidase de plasma, uma enzima antioxidante que contém selenocisteína no seu sítio activo e catalisa a redução do peróxido de hidrogénio. A selenocisteína de aminoácidos é codificada pelo codão UGA, que normalmente funciona como um codão de paragem. Na

GPx3

mRNA, o reconhecimento alternativa de um códon UGA como um códon selenocisteína é mediada pela

cis

actuando elemento regulador, sequência de inserção selenocisteína (SECIS), presente em 3 ‘ UTR e outras

trans

actuando co-fatores [56]. A SNV U1552G (Tabela 1) localizado na 3 ‘UTR de

GPx3

ARNm foi previsto para causar efeito estrutural significativa (valor p: 0,0474) na região local, que contém o elemento regulador SECIS. A Figura 3 mostra as probabilidades de pares de bases correspondentes à região local (NM_002084: 1544-1692), do tipo selvagem e mutante do mRNA. Pode ser visto que o de tipo selvagem tem maiores probabilidades de pares de bases que formam a estrutura de haste-laçada estável de SECIS (destacadas com um círculo na Figura 3), enquanto que na forma mutante é interrompido devido à SNV, que está localizado fora da região de SECIS. estudo anterior mostrou que a estrutura haste-laço característico de SECIS é essencial para a eficiência da UGA recodificação

in vivo

e

in vitro

[56]. Com base nisso, podemos especular que a SNV U1552G induzida mudança estrutural no elemento SECIS pode afetar a eficiência da UGA recodificação.

O gráfico de pontos a partir do servidor web RNAsnp [67] mostra as probabilidades de pares de bases corresponde ao local, região previsto com diferença significativa (

d

max valor-p: 0,0474) entre o tipo selvagem e mutante. O triângulo superior representa as probabilidades de pares de bases relativamente ao tipo selvagem (verde) e no triângulo inferior para o mutante (vermelho). Nos lados, a estrutura mínima de energia livre (MFE) do tipo selvagem e os mutantes são apresentados na representação gráfica planar. A região SECIS é destaque em círculo azul ea posição SNV é indicado com a marca de seta.

Além disso, considerando tanto o conjunto de alta confiança e SNVS médio de confiança, descobrimos que os genes (n = 15) listados na Tabela 2 porto mais do que uma SNV perturbador na região estrutural conservada previsto de ARNm. Por exemplo, o gene da

ID2

codifica para a ID-2 inibidor da proteína de ligação do ADN, que é um factor importante na proliferação e diferenciação celular no desenvolvimento normal dos vertebrados. Superexpressão da proteína ID-2 é frequentemente observada em vários tumores humanos, incluindo NSCLC [57]. Na sequência de mRNA de

gene ID2

, dois SNVS localizados na região 5 ‘UTR foram independentemente previsto para causar mudança estrutural local significativa na região conservada. Estudos anteriores demonstraram que o SNP ou mutação induzida por alterações estruturais na direcção 5 ‘UTR podem conduzir a tradução descontrolada ou a sobre-expressão das proteínas respectivas [58], [59]. Prevemos que as duas SNVS que causam a mudança significativa na região estruturalmente conservada poderia afetar a eficiência da tradução de

ID2

mRNA.

Dos 472 SNVS disruptivas obtidos a partir da estrutura secundária análise (antes de intersecção com os genes associados ao câncer), 199 sobreposição com SNPs de dbSNP (build 135). Destes 199 SNVS, 17 estão em ligação dis-equilíbrio (LD) com outros SNPs que estão localizados proximal (+/- 200 NTS) para a posição SNV. Estes 17 pares foram testados com RNAsnp para verificar se o SNP em LD com (disruptiva) SNV é um haplótipo de estabilização da estrutura [60]. Destes 17 pares, cinco foram previstos para causar quaisquer alterações estruturais significativas, que poderiam ser possíveis haplótipos de estabilização da estrutura; enquanto que os outros 12 pares têm mostrado mudanças estruturais significativas (ver S3.xls Arquivo).

Efeito do SNVS em locais-alvo de microRNA

Triagem todos os miRNAs maduros humanos contra todas SNVS identificados com flanqueando rendimentos de sequência 2 × 59.810.180 combinações possíveis. O passo inicial é um filtro TargetScan conservadora e reduz o conjunto de pares SNV-miARN a 0,2% deste. Em seguida, aplicam-se miRanda como um segundo método de predição alvo, seguido por um conjunto de filtros. A distribuição de

lr

valores no

alterar

conjunto é mostrado na Figura S3, apenas os casos com mudanças relativas maiores do que as descritas cortadas são considerados (ver Materiais e Métodos). A Figura 2 mostra os diferentes passos com contagens individuais dos sítios de interacção putativos em cada fase. Isso nos dá 490 SNVS em 447 genes previstos para afetar 707 interações com 344 miRNAs (ver S4.xlsx arquivo). Após cruzamento com genes conhecidos associados ao câncer (etapa final do gasoduto, figura 1), encontramos 124 SNVS e 148 miRNAs de estar envolvido em 186 interações que diferem com a mutação. Estes SNVS que induzem alterações miRTS putativos podem ser ainda classificados em aqueles reforço da interacção com o mutante (80) ou de tipo selvagem (52) variante.

A Tabela 3 lista todos os genes que contêm mais do que um miRTS previstos para ser mudou entre o tipo selvagem e SNV. Isto inclui exemplos em que a mesma muda SNV o local alvo para diferentes miARNs maduros a partir da mesma família, mas também exemplos em que diferentes SNVS dentro do gene causam um ganho ou perda de um miRTS. Da mesma forma, todos os miARNs com mais de dois locais alvo alterados são apresentados na Tabela 4. A lista de membros da família de miR-29 que foram previamente relatado para agir como supressores de tumores, assim como oncogenes (ver [61] para uma revisão).

dos 148 miRNAs (responsáveis ​​por 186 interações putativos) em nosso conjunto candidato final, 89 são

pulmonares miRNAs associados ao câncer

(em 117 interações) (indicado em S4.xlsx arquivo). A Tabela 5 lista todos os 14 locais-alvo putativos em nosso conjunto candidato final que incluem

associada a NSCLC miRNAs

. Notavelmente, a lista inclui quatro miRNAs com mais de um alvo previsto alterados. Para o miR-184 um local alvo é criado enquanto um outro é enfraquecido após a introdução da mutação. Além disso, o miR-30a, d, e e são previstos para orientar a UTR 3 ‘de

SUZ12

gene. No entanto, as interacções preditos são susceptíveis de ser funcional na de tipo selvagem e perdido no mutante devido a alterações induzidas SNV na região da semente. SUZ12 foi anteriormente mostrado para ser directamente objecto de miR-200b e a inibição desta miARN aumenta a formação de cancro de células estaminais (CSCs) [62], que contribuem para a agressividade do tumor. A perda de miR-30 regulação por (uma das) as três SNVS adjacentes na semente do site de destino poderia ter um efeito similar em NSCLC.

Além disso, para 48 SNVS as miRTSs previstos foram encontrados para ser localizado no interior da região local onde uma mudança estrutural secundário significativo foi prevista por RNAsnp. Destes, 15 foram SNVS localizado nos genes associados ao cancro (ver Tabela 6). Com base nos estudos anteriores [63], [64], especula-se que os miRTS induzidas SNV mudar junto com as mudanças estruturais secundárias e em torno dos miRTS pode afetar a ligação de miRNA previsto.

Deixe uma resposta