PLOS ONE: Cancer específicos padrões de expressão longa não-codificante RNAs Mostrar diferenciais e competindo endógena RNA potencial em hepatocelular Carcinoma

Abstract

RNAs não codificadores Longo (lncRNAs) regular a expressão gênica agindo com microRNAs (miRNAs). No entanto, os papéis de lncRNA específico do câncer e sua rede relacionados RNAs endógenos competitivos (CERNA) no carcinoma hepatocelular (HCC) não são totalmente compreendidos. Os perfis lncRNA em 372 pacientes com HCC, incluindo 372 tumor e 48 tecidos do fígado não tumorais adjacentes, a partir do Cancer Genome Atlas (TCGA) e NCBI GEO omnibus (GSE65485) foram analisados. lncRNAs específicos de câncer (ou lncRNAs relacionados HCC) foram identificados e correlacionados com características clínicas. Baseado em bioinformática gerados a partir miRcode, Base Estelar, e miRTarBase, construímos uma rede lncRNA-miRNA-mRNA (rede CERNA) no HCC. Encontramos lncRNAs específicas 177 por câncer em HCC (dobre mudança ≥ 1,5, P 0,01), 41 deles foram também expressou discriminativamente com sexo, raça, grau do tumor, estágio do tumor AJCC, e sistema de estadiamento AJCC TNM. Foram encontrados seis lncRNAs (CECR7, LINC00346, MAPKAPK5-AS1, LOC338651, FLJ90757 e LOC283663) a ser significativamente associada à sobrevida global (OS,-rank log P 0,05). Coletivamente, nossos resultados mostraram os padrões de expressão lncRNA e uma rede Cerna complexo no HCC, e identificou uma rede de Cerna específica por câncer complexo, que inclui 14 lncRNAs e 17 miRNAs em HCC

Citation:. Zhang J, Fan D, Jian Z, Chen GG, Lai PBS (2015) Cancer específicos de longo não codificante RNAs Mostrar diferenciais padrões de expressão e competindo endógena RNA potencial em carcinoma hepatocelular. PLoS ONE 10 (10): e0141042. doi: 10.1371 /journal.pone.0141042

editor: Xin-Yuan Guan, The University of Hong Kong, China

Recebido: 06 de agosto de 2015; Aceito: 02 de outubro de 2015; Publicação: 22 de outubro de 2015

Direitos de autor: © 2015 Zhang et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Disponibilidade de dados: Todos os dados relevantes estão dentro do papel e seus arquivos de suporte de informação

Financiamento:. Este estudo foi apoiado pelo Fundo de Investigação especializada para o Programa de Doutorado do Ensino Superior e Bolsas de Investigação Esquema Research Grants Research Council destinou conjunta (nº M-CUHK406 /13) ea National Science Foundation Natural da China (No. 81.472.339). Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

RNAs não codificantes são moléculas de ARN que não são codificam para proteínas. Eles podem ser divididos em vários subtipos incluindo longo ARN não codificante (lncRNA), microARN (miARN), ARN ribossómico (ARNr), pequeno ARN nucleolar (snoRNA), e ARN de transferência de acordo com HUGO Comité Gene Nomenclatura (HGNC) (http: //www.genenames.org).

Após a identificação de lncRNA em doenças de malignidade, um número crescente de estudos sobre as funções biológicas de lncRNAs foram realizados em vários tipos de câncer, incluindo HCC [1], epidermóide de esôfago carcinoma de células [2], o cancro colo-rectal [3], carcinoma de células renais [4] e do cancro da próstata [5]. A expressão anormal de lncRNAs através de interações com miRNAs ou mRNAs está envolvido na regulação da progressão tumoral e tumorais comportamentos biológicos no HCC [6-8]. Os lncRNAs específicos de câncer também podem afetar a invasão e metástases de HCC [9].

Em 2011, Salmena

et al

. apresentou uma hipótese competindo endógena RNA (CERNA), que unificou o transcriptoma e formaram uma rede de RNA de regulamentação [10]. A idéia principal é que todos os tipos de transcrições de RNA se comunicar uns com os outros por competir pela ligação a locais de ligação de miRNA compartilhados ( “elementos de resposta miRNA” ou “MRE”). Este tipo de RNA interferência concorrência existe entre RNAs mensageiros de codificação de proteínas e RNAs não-codificantes, tais como lncRNA, pseudogenes e RNAs circulares [11]. Além disso, esponjas miRNA artificiais também podem participar nesta rede para regular a expressão gênica [12].

Zhu et al. relataram que o perfil de expressão de lncRNA HCC por análise de microarray de três doentes com HCC [13]. No entanto, não é a falta de estudos com tamanho de amostra em grande escala e alta através de métodos de detecção sobre os padrões de lncRNA específica câncer em HCC expressão, e não se sabe se lncRNAs estão correlacionados com a sobrevida global, sexo ou outras características clínicas ou se a aberrante expressão de lncRNAs no HCC tem algum potencial Cerna. Recentemente, dados de RNA de sequenciação a partir do projeto Cancer Genome Atlas (TCGA) ou GEO fornecer ao público de dados lncRNA, miRNA e mRNA para HCC. Para abordar as questões acima mencionadas, nós exploramos lncRNAs em HCC usando conjuntos de dados de TCGA e GEO. Estes dois conjuntos de dados incluídos resultados de sequências de ARN para um total de 372 tecidos tumorais de carcinoma hepatocelular e 48 amostras de tecido de fígado não tumorais adjacentes. Para o melhor de nosso conhecimento, este estudo é o primeiro a fazer uso do grande banco de dados de sequenciação escala para investigar os padrões de expressão lncRNA específicos de câncer e rede de Cerna em HCC. Esta nova abordagem de prever lncRNA específica câncer e rede Cerna pode nos ajudar a entender a função de lncRNAs no HCC.

Métodos

Pacientes e amostras

Um total de 360 ​​pacientes com HCC foram obtidos a partir do portal de dados TCGA. Os critérios de exclusão foram definidas como se segue: 1) o diagnóstico histológico não é HCC; 2) amostras sem dados completos em análise; e 3) A sobrevida global de mais de 2000 dias. No geral, um total de 322 pacientes com carcinoma hepatocelular foram incluídos em nosso estudo. Entre esses 322 pacientes com HCC, os tecidos do fígado não tumorais adjacentes foram recuperados a partir de 43 assuntos. Este estudo atende às normas de publicação fornecidas por TCGA (https://cancergenome.nih.gov/publications/publicationguidelines). Outro conjunto de dados GEO (GSE65485) foi descarregado a partir GEO (https://www.ncbi.nlm.nih.gov/geo/), que incluiu 50 fragmentos de CCH e 5 tecidos do fígado não tumorais adjacentes. Como os dados foram obtidos a partir TCGA e GEO, uma nova aprovação por um comité de ética não era necessária.

procissão RNA dados de seqüência e análise computacional

Os dados de expressão de RNA (nível 3) do correspondente pacientes (tumor e /ou tecidos não tumorais adjacentes) foram baixados do portal de dados TCGA (até 24 de fevereiro de 2015). Os perfis de expressão lncRNA e mRNA foram gerados a partir de RNA sequenciamento cru lê por RNASeqV2 pipelines de pós-processamento e demonstrou como RSEM (RNA-Seq por Expectativa de Maximização) dados de contagem normalizados. O perfil de expressão miRNA foi realizada utilizando as plataformas miRNA seqüenciamento Illumina HiSeq 2000 (Illumina Inc, EUA) e demonstrada como lê por milhão de miRNA (RPM) mapeados dados. Uma vez que os dados de perfil de expressão de ARNm, lncRNA, e miARN já foram normalizados por TCGA, não há mais normalizations foram aplicadas a estes dados. O conjunto de dados GEO também foi gerado a partir da plataforma Illumina HiSeq 2000 e normalizada como FPKM (fragmentos por bases quilo de exons para por milhão mapeados lê) dados. O lncRNA análises foram realizadas utilizando BRB-ArrayTools (versão 4.4), desenvolvido pelo Dr. Richard Simon ea equipe de desenvolvimento BRB-ArrayTools [14].

Construção da rede de Cerna e KEEG Análise Caminho

A construção de rede Cerna incluiu três etapas: (i) o câncer específica filtração lncRNA: lncRNAs específicos de câncer com a mudança vezes absoluta ≥ 3.0 (ou aumento da regulação ou para baixo-regulação) e P 0,05 foram retidos. Para melhorar a confiabilidade dos dados, lncRNAs específicos de câncer não foram anotados por GENCODE (https://www.gencodegenes.org/) foram descartados; (Ii) interações lncRNA-miRNA foram previstas por miRcode (https://www.mircode.org/) e base estelar v2.0 (https://starbase.sysu.edu.cn/); (Iii) mRNAs alvo de miRNAs com suporte experimental foram recuperados a partir miRTarBase (https://mirtarbase.mbc.nctu.edu.tw/). Para aumentar ainda mais a robusta desta rede Cerna, a exploração não paramétrico estatísticas máximos baseadas em informação (meu) coeficiente de informações máxima (MIC) algoritmo e foram usados ​​em dados TCGA definidas para filtrar as relações par-sensatas [15]. Uma rede gráfico foi construído e visualizada utilizando Cytoscape v3.0 [16]. Os genes que codificam envolvidos na rede de Cerna foram inseridos no banco de dados para anotação, visualização e integrado Discovery (DAVID) [17] para a análise KEEG via de enriquecimento.

A análise estatística

Os dados foram apresentados como média SD ±. As diferenças entre os grupos foram avaliadas pelo teste t de duas amostras eo nível de significância foi fixado em 0,001 como padrão para controlar a taxa de falsas descobertas (FDR). O univariada de Cox de regressão foi realizada para descobrir os lncRNAs correlacionaram com a sobrevida global [18]. valor de P inferior a 0,05 foi considerado como estatisticamente, a menos que especificamente indicado. As análises estatísticas foram realizadas por BRB-ArrayTools ou linguagem R [19].

Resultados

lncRNAs específica por câncer em HCC

Foram identificados 604 lncRNAs de dados TCGA definir e 357 lncRNAs de GSE65485. Para qualquer único lncRNA, ele apareceu em dados TCGA definidos ou ambos os conjuntos de dados TCGA e GEO. Nós descobrimos que 177 lncRNAs e 37 lncRNAs foram diferencialmente expressos entre os fragmentos de CCH e tecidos não tumorais adjacentes no conjunto de dados TCGA e conjunto de dados GEO (mudança vezes absoluta ≥ 1,5, P 0,01, S1 Table), respectivamente. Para aumentar ainda mais a confiabilidade dos dados, foram selecionados 28 lncRNAs incluído no GENCODE e estes lncRNAs teve uma mudança vezes absoluta ≥ 3,0 a partir de qualquer de dados GEO definidos para construir uma rede Cerna [20] TCGA ou. Finalmente, 28 lncRNAs (18-regulada, 10 regulada para baixo). Foram selecionados para a rede Cerna (Tabela 1)

Esta tabela mostrou lncRNAs específicas 28 cancerosas para construção de rede Cerna com a mudança vezes absoluta ≥ 3,0, P 0,01 e incluído no GENCODE.

As correlações entre câncer específica lncRNAs e características clínicas

Os 177 lncRNAs da seção acima foram analisados ​​de acordo com as características clínicas, incluindo sexo, raça, tumor série, sistema de estadiamento, AJCC estágio patológico, invasão vascular, evento novo tumor, o estado do tumor e idade no momento do diagnóstico em TCGA e /ou conjuntos de dados GEO AJCC TNM. Havia no total lncRNAs 41 cancerosas específicas, os níveis dos quais também foram significativamente diferentes em comparações de recursos clínicos (P 0,001, Tabela 2). Cinco lncRNAs (LINC01554, LOC255167, A1BG-AS1, LINC00526 e MIR22HG) foram diferencialmente expressos em três ou quatro comparações de recursos clínicos.

Esta tabela mostrou lncRNA específica 41 do câncer que também foram expressas diferencialmente em comparações de recursos clínicos.

em seguida, identificar os potenciais lncRNAs com características prognósticos, foram encontrados os níveis de 177 lncRNAs nos dados TCGA estabelecidos foram perfilado usando o modelo de regressão univariada de Cox e seis lncRNAs a ser significativamente associada com sobrevida global (log-rank P 0,05). Entre os seis lncRNAs significativos, três lncRNA (CECR7, LINC00346 e MAPKAPK5-AS1) foram associados negativamente com OS, enquanto os restantes três (LOC338651, FLJ90757 e LOC283663) foram positivamente correlacionadas com OS (Fig 1).

(eixo horizontal: tempo de sobrevivência global: dias, de eixo vertical: função de sobrevivência).

miRNA alvo lncRNAs previstos por miRcode e Base Estelar

O nosso estudo anterior descobriu 207 HCC- miARNs associadas que foram diferencialmente expressos entre os tecidos de carcinoma hepatocelular e tecidos não tumorais adjacentes [21]. Foram selecionados 33 miRNAs de 207 miRNAs associados a HCC no atual conjunto de dados TCGA (mudança vezes absoluta ≥ 3,0, P 0,001, S2 Tabela). Aqui, nós nos concentramos em se estes miRNAs teria como alvo acima lncRNAs específicas 28 cancerosas. Na rede Cerna, miRNAs interagir com lncRNAs através MRE, que assim procurou os potenciais MRE em lncRNAs usando miRcode [22] e base estelar v2.0 [23]. Os resultados mostraram que 17 de 33 cancro da miRNAs específicos podem interagir com 15 de 28 lncRNAs específicos de câncer (Tabela 3).

miR-199A-1 e miR-199A-2 eram considera como um único miRNA em nosso estudo

alvos miRNA previstos por miRTarBase

para criar a rede lncRNA-miRNA-mRNA (rede CERNA), o próximo passo foi procurar mRNA alvo de miRNAs. Com base nos miARNs descritas na Tabela 3, que procurou miARN-segmentados de ARNm com evidência experimental utilizando miRTarBase [24]. Os resultados identificaram 17 miARNs incluindo miR-10B, o miR-135A-1, miR-139, o miR-182, o miR-183, o miR-184, o miR-195, miR-199A-1/2, o miR-214, miR- 33B, o miR-34C, o miR-375, miR-376c, o miR-383, o miR-424, miR-93, e miR-96 (Tabela 4). Cada miARN-ARNm par foi validado experimentalmente por, pelo menos, dois dos seguintes métodos, incluindo ensaio de repórter, western blot, qPCR, microarray, pSILAC (pulsado rotulagem isótopo estável com aminoácidos em cultura de células) ou NGS (CLIP-seq ou Degradome-SEQ ). De acordo com o banco de dados allOnco (https://www.bushmanlab.org/links/genelists), a maioria de seus alvos são genes associados ao câncer, como SIRT1, VEGFA, RASA1, RAF1, PTEN, MAPK9, MAPK8, MAPK1, MYC, MYB, KRAS, JAK2, IGF1R, IDH2, FOXO3, FOXO1, E2F3, E2F1, MAPK14, CDKN2A, CDKN1A, CDK6, CD44, CCNF, CCNE1, CCND3, CCND2, Runx2, BCL2, CCND1, APC, AKT2, AKT1, ABCA1, etc.

construção de rede Cerna e KEEG via análise

com base nos dados acima (Tabelas 3 e 4), construímos uma rede lncRNA-miRNA-mRNA Cerna. Para obter resultados mais robustos, foi utilizado o coeficiente de informações máxima (MIC) algoritmo para rastrear as relações par-sensatas com base nos níveis da lncRNA, miRNA e mRNA no conjunto de dados TCGA (MIC 0,15 e MIC-p

2 0,15, consulte Métodos). 14 lncRNAs e 17 miRNAs foram envolvidos na rede Cerna proposta (Fig 2).

A fim de compreender as vias de sinalização envolvidos na rede de Cerna, os mRNAs foram analisados ​​pelo banco de dados DAVID. De acordo com o número de genes envolvidos, listamos os 15 melhores KEGG vias em nosso estudo (Tabela 5). Dez vias relacionadas com o cancro, incluindo percursos no câncer, câncer pancreático, melanoma, cancro da próstata, leucemia mielóide crónica, cancro colorectal, glioma, cancro do pulmão de pequenas células, cancro da bexiga e câncer de pulmão não-pequenas células, foram enriquecidas com a mRNAs, outra 5 vias relacionadas não cancerosas, tais como MAPK via de sinalização, adesão focal, ciclo celular, neurotrofina via de sinalização, T receptor celular via de sinalização também foram enriquecidos.

o valor P foi corrigido para a hipótese de múltiplos testes usando o Benjamini- método de Hochberg (consulte também S3 Tabela)

Discussão

recentemente, lncRNAs foram surgiu como reguladores abundantes de fisiologia celular no HCC e suas funções podem variar [25, 26] . Apenas alguns estudos têm tentado revelar os perfis de expressão lncRNA em HCC por microarray com dezenas de ou tamanho da amostra ainda menor [13]. LncRNA e ARNm de rede co-expressão foi construído por anormalmente expressos lncRNA ARNm e [13]. Alguns estudos interacções entre miARN e lncRNAs [27, 28] ou ARNm e lncRNA [29] descrita no carcinoma hepatocelular, cujos resultados indicaram que lncRNAs pode funcionar como uma parte de rede de cerna, mas tal rede cerna ainda é pouco explorado. No presente estudo, identificamos lncRNAs específicas do tumor no HCC e investigou suas distribuições em diferentes características clínicas e as suas associações com sobrevida global com base em perfis de ARN do genoma de 372 fragmentos de CCH e 48 tecidos do fígado não tumorais adjacentes. Além disso, construímos uma rede Cerna com lncRNAs específicos de câncer e miRNAs, que prevê um sistema de pontos de vista biológicas de interações lncRNA-miRNA-RNAm.

Com base nos dados de sequência de RNA próxima geração de TCGA e GEO, descobrimos que 177 lncRNAs específicos de cancro foram diferencialmente expressos em tecidos tumorais de carcinoma hepatocelular e tecidos do fígado não tumorais adjacentes. Em seguida, revelou que lncRNAs específicas 41 de câncer, também foram expressos de forma anormal em diferentes grupos de características patológicas clínicas, tais como sexo, raça, grau do tumor, sistema de estadiamento AJCC TNM, estágio patológico AJCC, invasão vascular, evento novo tumor, o estado do tumor e idade no momento do diagnóstico. Entre os lncRNAs que diferencialmente expressos em três ou quatro grupos, MIR22HG foi relatado para ser um indicador de stress respostas químicas em células-tronco pluripotentes induzidas pelo homem [30]. Concluímos que a expressão de alguns lncRNAs não é igualmente distribuído em certas situações. Estudos futuros neste domínio devem ser devidamente concebidos para lidar com este fato. Estudos anteriores relataram disparidade sexual de HCC incidência [31], a diferencialmente expressos lncRNA entre feminino e masculino encontrada neste estudo podem contribuir para este fenómeno. No entanto, estes lncRNAs desigualmente distribuídos não pode ser significativamente associada à sobrevida global.

No que diz respeito às associações entre lncRNAs específicos de câncer e sobrevida dos pacientes, verificou-se que seis lncRNAs estavam relacionados com a sobrevida global HCC. Entre os três lncRNAs arriscadas, CECR7 é um lncRNA candidato para a síndrome do olho do gato [32]. As funções das outras duas arriscado e três novos lncRNAs de protecção não são ainda claras. É também de notar que cinco destes seis lncRNAs (CECR7, LINC00346, LOC338651, FLJ90757 e LOC283663) não foram diferencialmente expressos em qualquer comparação característica clínica. Portanto, lncRNAs que não diferencialmente expressam em comparações de recursos clínicos podem ser correlacionados com a sobrevida global, enquanto lncRNAs que diferencialmente expresso em comparações de recursos clínicos pode não ser necessário para ser associado com a sobrevida global.

Acreditamos que pode haver haver algumas transversais conversações entre lncRNA, miRNA e mRNA no progresso da HCC. Aplicamos várias medidas para aumentar a precisão da previsão da rede Cerna. Em primeiro lugar, nós só incluiu os lncRNAs específicos de câncer e miRNAs que tiveram uma dobra absoluta mudança ≥ 3,0 e foi anotado por GENCODE. Em segundo lugar, as relações entre lncRNA e miARN, e miARN e ARNm foram previstos por experi- algoritmos suportados ou bases de dados, tais como miRcode, starbase e miRTarBase. Estas duas medidas assegurou que as relações identificadas ocorreria não só

em situações silico

mas também por evidências experimentais-suportada.

Para melhorar ainda mais o desempenho da nossa previsão, o coeficiente de informações máxima (MIC ) algoritmo e exploração não paramétrico estatísticas máximos baseadas em informação (meu) foram usadas para filtrar as relações par-sensatas com base em correlações de expressão lncRNA-miRNA-RNAm. Na análise geral de rede de co-expressão do gene, de correlação de Pearson é uma medida para a regressão linear, mas é muito sensível a outliers. MIC e os meus são capazes de analisar e caracterizar todas as relações potencialmente interessantes em um conjunto de dados complexos [33].

A rede Cerna nós construímos traz à luz uma rede reguladora desconhecido Cerna no HCC. Nesta rede Cerna recém-identificados, muitos oncogenes e supressores tumorais participação no desenvolvimento e tratamentos HCC. Um estudo recente identificou também que as interações lncRNA-miRNA-RNAm estavam ativos e podem atuar como potenciais biomarcadores de prognóstico em cancros [34].

Em conclusão, nosso estudo encontrou os lncRNAs específicos de câncer em HCC usando centenas de candidatos lncRNAs e amostras de grande escala, e divulgada padrão de expressão anormal de lncRNAs específicos de câncer, sob diferentes aspectos clínicos. Importante, nós construímos uma rede Cerna propor uma nova abordagem da investigação lncRNA no HCC. Nossos resultados sugerem que o câncer lncRNAs específicas em HCC pode participar de uma rede Cerna complexa.

Informações de Apoio

Tabela S1. 177 e 37 lncRNAs diferencialmente expressos entre fragmentos de CCH e tecidos não tumorais adjacentes em dados TCGA E CONJUNTO DE DADOS GEO

doi:. 10.1371 /journal.pone.0141042.s001

(XLS)

S2 Table. 33 miRNAs associados a HCC entre fragmentos de CCH e tecidos não tumorais adjacentes no conjunto de dados TCGA

doi: 10.1371. /Journal.pone.0141042.s002

(XLS)

S3 Tabela. Todos os caminhos KEEG enriquecidos pelos genes que codificam envolvidos na rede de Cerna (P 0,05)

doi: 10.1371 /journal.pone.0141042.s003

(XLS)

Reconhecimentos

Agradecemos ao Sr. Rocky Ho para a sua assistência técnica. Os resultados publicados ou apresentados aqui estão total ou parcialmente com base em dados gerados pelo TCGA Research Network: https://cancergenome.nih.gov/. Este estudo foi apoiado por SRFDP e RGC ERG Comum de Investigação (Não: M-CUHK406 /13). Ea National Science Foundation Natural da China (No.81472339)

Deixe uma resposta