PLOS ONE: Análise Integrative do Normal Longo Intergenic não-codificante RNAs na próstata Cancer

Abstract

Recentemente, um grande número de tecidos humanos normais foram perfiladas de RNAs não-codificantes e mais de catorze mil longa não intergênico RNAs -coding (lincRNAs) encontram-se expressos em tecidos humanos normais. Os papéis funcionais destes lincRNAs normais (nlincRNAs) na regulação dos genes codificadores de proteínas na biologia normal e doença estão ainda a ser estabelecida. Aqui, temos perfilado dois conjuntos de dados de RNA-seq, incluindo câncer e combinados tecidos não neoplásicas de 12 indivíduos de demografia diversa para ambos os genes que codificam e nlincRNAs. Encontramos 130 nlincRNAs regulada de forma significativa no cancro, com 127 regulada na mesma direção nos dois conjuntos de dados. Curiosamente, de acordo com Ilumina Mapa do corpo, um número significativo destes nlincRNAs exibir expressão nula basal em tecidos normais da próstata, mas são específicos para outros tecidos, tais como tiróide, rim, fígado e testículos. Um número do nlincRNAs regulamentados loci compartilhar com genes que codificam, que são ou co-regulados ou oposta regulamentada em todas as amostras de câncer estudados. Por exemplo, em todas as amostras de câncer i) o nlincRNA, TCONS_00029157, e um factor supressor de tumor vizinha, SIK1, são ambos para baixo regulamentada; ii) vários nlincRNAs específicos de tireóide no bairro da TPO gene específico da tiróide, são ambos up-regulamentada; e iii) o TCONS_00010581, uma isoforma de HEIH, é regulada para baixo, enquanto o gene EZH2 vizinho é sobre-regulada no cancro. Vários nlincRNAs de um cancro da próstata associado locus cromossómico, 8q24, são regulados positivamente em cancro, juntamente com outros genes associados com cancro da próstata conhecido, incluindo PCAT-1, PVT1, e PCAT-92. Observamos que há viés significativo no sentido de aumento da regulação do nlincRNAs com tão alto quanto 118 de 127 up-regulada no cancro, apesar de o regulamento dos genes que codificam é desviada para baixo-regulação. Considerando que todos os lincRNAs relatados de câncer associado (clincRNAs) são desviadas para a sobre-regulação, concluímos que esse viés pode ser funcionalmente relevantes

Citation:. Bawa P, Zackaria S, Verma M, Gupta S, Srivatsan R, Chaudhary B, et al. (2015) Análise Integrative do Normal Longo Intergenic não-codificante RNAs no câncer de próstata. PLoS ONE 10 (5): e0122143. doi: 10.1371 /journal.pone.0122143

Editor do Academic: Xia Li, Harbin Medical University, CHINA

Recebido: 13 de novembro de 2014; Aceito: 10 de fevereiro de 2015; Publicado em: 01 de maio de 2015

Direitos de autor: © 2015 Bawa et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Disponibilidade de dados: Todos os dados relevantes estão dentro do papel e seus arquivos de suporte de informação

Financiamento:. Este estudo foi financiado pelo Departamento de Biotecnologia, Governo da Índia; Departamento de Tecnologia da Informação, Governo da Índia; DST-FIST, Governo da Índia; e do Departamento de Tecnologia da Informação, Governo de Karnataka. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

a promessa do Projeto Genoma Humano foi para entregar centenas de milhares de proteínas para uso como alvos de drogas. No entanto, para surpresa de todos, os esforços de anotação em larga escala por grandes consórcios, como o projeto ENCODE [1], entregues dezenas de milhares de alvos de drogas de um tipo diferente; RNAs não-codificantes. Sabe-se agora que a maioria do genoma humano é transcrito mesmo que apenas uma pequena fracção traduz em proteínas. Ele agora compreende-se que um grande número de não-codificante RNAs, tanto a longo e curto, desempenham papéis críticos na regulação complexa do número relativamente pequeno de codificação de proteínas que são essenciais para a vida.

Entre os diversos tipos de RNAs não-codificantes, longos RNAs não-codificantes intergénicas (lincRNA) são atraente porque eles podem ser facilmente descobertos com alta confiança de conjuntos de dados de ARN-SEQ existentes e correlacionada com a expressão do gene de informação a partir do mesmo conjunto de dados utilizando ferramentas da bioinformática existentes. Mais recentemente, dezenas de milhares de lincRNAs foram descobertos a partir de conjuntos de dados de ARN-SEQ partir de diversos tecidos humanos normais, aqui referidos para nlincRNAs, tal como um mapa do corpo Ilumina [2]. Os papéis funcionais destes nlincRNAs estão ainda a ser estabelecida.

Apesar do fato de que lincRNAs são novos para biologia do câncer e seus mecanismos moleculares ainda na sua infância, vários artigos de revisão já apareceram na literatura detalhando o progresso nesta área a data [3] [4]. Dos cerca de 60 + lincRNAs que foram mostrados para ser associado com vários tipos de câncer, a maioria deles são sobre-regulada no cancro [3] [4] e apenas alguns lincRNAs são mostrados para ser regulada para baixo em amostras de câncer, incluindo GAS5 [5] e MEG3 [6].

Os relatórios recentes que ligam os níveis de expressão de lincRNA com câncer de oferecer uma excelente oportunidade para o estabelecimento de papel funcional da lincRNAs na regulação da expressão gênica. Um dos a pesquisa mais exaustiva para lincRNAs associados com câncer de próstata incluem, identificação de 121 lincRNAs, chamados PCATs (Prostate Cancer Associated Transcrições) descobertos a partir de 102 doenças tecidos da próstata estratificados e linhas celulares [7]. Destes, PCAT-1 com ARNsi de inibição é mostrado para reduzir a proliferação de celllines que expressam altos níveis de PCAT-1. Desde a publicação deste relatório, foi mostrado PCAT-1 sobre-expressão para ser um biomarcador para o cancro colorectal [8]. Mais recentemente, a partir de dados de ARN lincRNAs-SEQ de um grande número de amostras de cancro de pulmão a partir do repositório público tem sido usado para identificar o cancro do pulmão 111 lincRNAs associado, chamados LCALs [9]. O viés de lincRNAs para cima-regulação no câncer requer interrogatório.

É tentador concluir que a tendência para aumento da regulação do lincRNAs em câncer, nos esforços de grande escala já referido, pode resulta da prática de descobrir lincRNAs de amostras de câncer. Aqui, o nosso objectivo foi realizar uma análise integrativa de ambos codificação e nlincRNAs não-codificantes (lincRNAs descobertos a partir de tecidos humanos normais) em vários conjuntos de dados de RNA-seq referentes ao câncer de próstata a partir do repositório público tanto para o endereço esse viés e descubra romance co-regulação de genes e nlincRNAs.

Materiais e Métodos

Os conjuntos de dados utilizados

Nós usamos dois conjuntos de dados de RNA-seq do repositório público NCBI gerada por dois grupos independentes com IDs de adesão de SRP002628 e ERP000550. Como mostrado na Tabela 1, 5 pares tumor-normal, de SRP002628 e 7 a partir de conjuntos de dados ERP000550 são considerados neste estudo, quer porque os pares correspondentes não estavam disponíveis para alguns indivíduos ou a profundidade de sequenciação não eram compatíveis para obter boas estatísticas. Estes dois conjuntos de dados são de dois demografia diversas. Por exemplo, os pacientes selecionados para gerar dados dentro do ERP000550 adesão são de origem chinesa e, embora a demografia dos doentes no conjunto de dados SRP002628 não é conhecido, é seguro assumir que os indivíduos considerados para gerar dados dentro do SRP002628 adesão não são chineses . A Tabela 1 dá a profundidade, IDs de adesão individual e percentagens de mapeamento para cada amostra nestes conjuntos de dados.

Para perfis conhecidos e novos lincRNAs usamos GENCODE (https://www.gencodegenes.org/) e lincRNA-catálogo (https://www.broadinstitute.org/genome_bio/human_lincrnas/?q=lincRNA_catalog). Também para análise da expressão gênica temos usado o navegador tabela a partir da URL https://genome.ucsc.edu/cgi-bin/hgTables para hg19 com pista como genes RefSeq e formato de saída como a cama.

Para linha de base expressão de codificação de dados gene temos usado tanto e-MTAB-513 com 16 e e-MTAB-1733 com 27 tecidos humanos normais de expressão Atlas sob ArrayExpress. Neste estudo, utilizamos um valor FPKM inferior a 0,5 para fazer chamadas de linha de base nulos e valor FPKM superior a 100 chamá-los específico do tecido.

Método usado para calcular a expressão transcrição

conjuntos de dados seleccionados foram mapeados para genoma de referência hg19 usando Bowtie [10] com percentagem mapeadas mostrados na Tabela 1. para o lê sob a SRP002628 adesão de todo o comprimento das leituras, que é 36mer, foram mapeados. No entanto, para lê sob ERP000550 25 bases foram cortadas a partir de ambas as extremidades das leituras de comprimento 90 levando a mapeamento de 40mers a partir do meio. A ferramenta coverageBed de BEDTools foram usadas para extrair contagem por transcrição por amostra usando os arquivos de anotação e lincRNA-catálogo mencionadas na secção acima. Esses arquivos de contagem individuais foram recolhidos em uma tabela com linhas representando transcrições.

Computing expressão diferencial

Para calcular expressão diferencial foram selecionados dois pacotes R baseado em contagem amplamente utilizados, edger [11] e DESeq [12]. Embora estes dois métodos são muito semelhantes que diferem na utilização de dispersão. O aparador pacote usa único fator de dispersão comum em oposição a uma estimativa de variância flexível usado pelo DESeq pacote. A distinção importante de facetadora é que é anti-conservadora a genes expressos baixos e mais conservadora para genes altamente expressos. Onde, como o modelo utilizado por dispersão flexível DESeq permite a menor polarização na selecção de genes com base nos seus níveis de expressão. Desta forma DESeq e facetadora complementam um ao outro na selecção de genes expressos diferencialmente. Em outras palavras Edger é mais sensível a outliers onde como DESeq é menos sensível a outliers, mas fornece resultados imparcial através da gama dinâmica [13].

DESeq e Edger ambos aceita um arquivo de contagem coligidos como entrada e produzir única p -valor e log fold-change por transcrição por conjunto de dados que representa o estado geral expressão diferencial dos transcritos no arquivo de anotação entre dois estados dadas, tumor e combinados tecidos não-neoplásicas. Para obter transcritos específicos de cancro que são estatisticamente significativa foi utilizado um valor de p de corte de menos do que 0,05 e um ABS (log dobrar mudança para a base 2) maior do que 1,0 para a codificação de genes e maior do que 0,59 para nlincRNAs. A variação nos critérios de filtragem escolhidas para a mudança vezes é refletir os níveis relativamente baixos de expressão nlincRNA em comparação com genes que codificam relatados na literatura [2].

Clustering heatmap

Para gerar heatmaps nós utilizada a correlação de Pearson Coeficiente e para dendrogramas usamos distância euclidiana usando ‘pheatmap “e funções” hclust’ do pacote estatístico R, respectivamente. A fim de produzir mapas térmicos para amostras de conjuntos de dados em toda a normalização adicional foi necessário para ter em conta a variação na dispersão dos níveis de expressão do gene entre os conjuntos de dados resultantes de diferentes protocolos de preparação da amostra por diferentes investigadores. Embora os valores RPKM são computados para normalizar os níveis de expressão em todo amostras, esta normalização é suficiente para explicar variação no protocolo de preparação de amostras. Normalizar por fileiras, representando transcrições, entre conjuntos de dados, dividindo-os por médio de linha foi utilizada para lidar com a dispersão diferencial entre os dois conjuntos de dados resultantes de variação de protocolos de preparação de amostras. Tal abordagem já foi implementado no pacote DESeq para amostras dentro de um determinado conjunto de dados [12].

Validação de conjuntos de dados

Para mostrar que os dois conjuntos de dados selecionados são adequados para perfilar RNAs não-codificantes , os níveis de expressão de lincRNAs conhecidos, que são relatados como implicado no cancro, foram perfilados ao longo dos dois conjuntos de dados de RNA-Seq selecionados para este estudo. Nós identificamos que várias de câncer de próstata lincRNAs associados são regulados positivamente em uma forma específica de tumores em ambos os conjuntos de dados. Por exemplo, PCAT-1, um lincRNA cancro da próstata associado do locus do gene-deserto no cromossoma 8q24 é significativamente regulada para cima em todas as amostras de tumor de ambos os conjuntos de dados em comparação com os tecidos não neoplásicos adjacentes. Vários outros próstata e outros lincRNAs específicos do cancro, tais como PVT1, PCA3, CCAT-1 PCAT-92, PCAT-114, PCAT-120, PCAT-19, PCAT-27, PCAT38, PCAT-39, PCAT-43, PCAT -59, PCAT-72, PCAT-80, e PCAT-83 também são encontrados para ser regulado para cima em ambos os conjuntos de dados de uma forma específica ao câncer. Estas descobertas, não só autentica o uso desses dois conjuntos de dados para nlincRNA perfilar mas fornecem uma validação adicional para estes lincRNAs recém-formados no câncer de próstata.

Gene Rede

rede Gene neste manuscrito é criado por GeneMANIA, um pacote sob Cytoscape [14].

resultados e Discussão

profiling genes codificadores

perfil de expressão gênica dos dois conjuntos de dados de RNA-seq, SRP002628 [15] e ERP000550 [16], foram realizadas utilizando dois pacotes R análise estatística comumente usados, edger [11] e DESeq [12]. Genes com valores de p inferiores a 0,05 e alterações absolutas registo de dobragem (base 2) superiores a 1,0 são utilizados para fazer uma chamada que um gene é regulado em cancro da próstata. Convergindo número de genes significativamente regulada em cada fase do gasoduto análise é apresentada na Figura 1. Utilizando Edger, 4449 e 5034 transcrições são encontrados diferencialmente regulados a partir dos dois conjuntos de dados, SRP002628 e ERP000550 respectivamente. Destes, 1358 transcrições representam 786 genes são encontrados comumente regulada entre os dois conjuntos de dados com 302 genes regulados positivamente e 455 genes regulados negativamente em câncer. Curiosamente, apenas 29 genes mostrou padrão de expressão oposta nos dois conjuntos de dados. Da mesma forma, usando o pacote DESeq 2942 e 4260 transcrições são identificados como diferencialmente regulada no cancro da próstata a partir dos dois conjuntos de dados, SRP002628 e ERP000550 respectivamente. Os 881 transcrições comuns representam 497 genes, que são regulados no cancro da próstata com 180 genes para cima e para baixo 313 genes regulados. Mais uma vez, apenas 4 genes exibir regulação oposta nos dois conjuntos de dados com base em gasodutos DESeq.

A lista de genes diferencialmente expressos (degs) a partir dos dois conjuntos de dados usando os dois métodos, aparador e DESeq, está listado em S1 Table, que contêm 366 genes que codificam com 117 para cima e 249 sub-regulada no cancro da próstata. Curiosamente, com a excepção de apenas um gene, são regulados todos na mesma direcção em ambos os conjuntos de dados de cancro (Fig 2). Na Figura 2, mostra-se também que os valores normalizados RPKM linha por linha a partir de dois conjuntos de dados para os todos os 366 degs, todos os agrupamentos 12 e 12 amostras de cancro normais em dois clados distintos. Também se mostra na Figura 2, são a aglomeração das cinco amostras adicionais a partir do ERR000550 adesão, não utilizados na extracção da assinatura, nos respectivos clados.

estudos de enriquecimento gene no 366 genes sugere inactivação de genes em ambos os 17q21 e 19q13 loci, os quais são ambos avaliado como susceptibilidade a cancro da próstata loci [17], [18], [19]. Figura 3 mostra o gene para a rede loci 17q21 e 19q13. Curiosamente, os genes inactivados em 17q21, incluindo KRT15, ​​ITGA, AOC3, HOXB3, RND2, ASCG, WFKKN2, ARHGAP27, NGF, e NOG, estão implicados na interacção célula-célula, a reorganização do citoesqueleto, matriz e morte celular extra-celular; falta de que poderia convencer epitelial para mesenquimal transformação e migração.

Profiling nlincRNAs

Um total de quatorze mil, trezentos e cinquenta e três (14,353) lincRNAs, aqui referidos como nlincRNAs, tem sido relatada a ser expressos em vários tecidos humanos normais [2]. Destes, existem 9.600 nlincRNAs que mostram muito baixa evidência de transcrição na próstata normal e tão baixo como 196 nlincRNAs são relatados como específico para tecidos da próstata.

Como se mostra na figura 1, utilizando facetadora, 1140 (773 e 367 sub-regulada) e 1702 (1258 para cima e 444 sub-regulada) nlincRNAs são encontrados diferencialmente regulados a partir dos dois conjuntos de dados, SRP002628 e ERP000550, respectivamente. Destes, 316 nlincRNAs (252 e 42 para baixo) são comumente regulada no cancro da próstata em ambos os conjuntos de dados. análise similar usando gasoduto DESeq resultou em 576 (383 e 193 para baixo) e 988 (867 e 121 para baixo) nlincRNAs regulamentados no câncer de próstata em ambos os conjuntos de dados, SRP002628 e ERP000550, respectivamente. O número de nlincRNAs comumente regulados diferencialmente em ambos os conjuntos de dados usando pacote DESeq é de 135, com 124 para cima e 9 sub-regulada no cancro.

O número de nlincRNAs que são encontrados diferencialmente regulados de câncer em ambos os conjuntos de dados usando tanto Edger e métodos DESeq, é de 130, com 118 para cima, 9 jusante e tão baixa quanto 3 oposta regulamentado. Fig 4 mostra o mapa de calor dos 127 nlincRNAs, listadas na Tabela S2, que são regulados diferencialmente no cancro. Com a excepção de C13_5, um cancro da amostra de SRP002628 adesão, os 127 nlincRNAs permitir que o agrupamento de todas as amostras normais e de cancro nos respectivos clados. Usando análise de componentes principais, mostrada na Figura 4, confirma-se que C13_5 é mais normal-like.

Dentre os 127 nlincRNAs diferencialmente reguladas, 58 têm expressão basal nula no tecido normal da próstata de acordo com ambos esforços internos e o relatório do Instituto Broad [2]. Destes nlincRNAs, muitos são específicos do testículo e um certo número deles são específicos da tiróide. Como mostrado na Tabela S2, perfis destes nlincRNAs na próstata linhas celulares de conjunto de dados de ARN-SEQ com IDs de adesão de SRP004637 [7], revelam que 12 fora da expressão significativa 58 de exibição em uma ou mais das três celllines próstata. Esta tendência é observada no cancro da próstata associado genes que codificam tais como EZH2 [20], que é diferencialmente regulados positivamente em amostras de cancro a partir de ambos os conjuntos de dados de linha de base exibir expressão nula na próstata. Além disso, como mostrado na S3 Tabela, muitos relataram cancro da próstata lincRNAs associado, como PCAT-1, de PCA3, PCAT-92, PCAT-114, PCAT-120-PCAT-27, PCAT-38, PCAT43, PCAT72, e PCAT-80 [7], que também são diferencialmente regulados positivamente no cancro em ambos os conjuntos de dados, não tem nlincRNAs sobreposição de acordo UCSC faixas.

Existem muitas nlincRNAs de cromossomo 8q24 lócus, listadas na Tabela 2, que são expressas em condições normais tecidos humanos. Enquanto um número de compartilhar exons nlincRNAs com lincRNAs conhecidos, tais como PVT1 e CCAT1, vários outros, incluindo TCONS_00014535 (BC042052, CASC11), TCONS_00015171 (BC106081), TCONS_00015167 (PCAT2), TCONS_00015170 e TCONS_00015168 (JX003871), TCONS_00015498, TCONS_00015165 e TCONS_00015166 são nlincRNAs novos que são diferencialmente regulados positivamente em cancro da próstata em pelo menos um dos dois conjuntos de dados utilizados neste estudo. Mais uma vez, muitos deles são específicos para testículo e fígado e não são expressos em próstata normal.

Co-regulação da lincRNAs e genes vizinhos

Como mostrado na Figura 5, 15 diferencialmente nlincRNAs regulamentados fora do 127 estão perto de 12 genes diferencialmente regulados em vários cromossomos. Tabela 3 fornecem significado de nlincRNAs e o seu respectivo gene de codificação. Por exemplo, o nlincRNA, TCONS_00029157, e um factor supressor de tumor conhecido, SIK1, são ambos regulados para baixo em todas as amostras de cancro. expressão SIK1 reduzida está correlacionada com mau prognóstico em dois grandes conjuntos de dados de câncer de mama humano e está ligada com anoikis dependente da p53 que podem ser alvo durante tumerogenesis [21].

O específico da tireóide gene TPO é sobre-regulada no cancro da próstata, juntamente com alguns nlincRNAs específicos de tireóide, TCONS_00004663-4666 e TCONS_00004668-4669. A TPO é um dos genes conhecidos por estarem associados com o stress oxidativo. Tem sido demonstrado que a lente epitelial factor de crescimento derivado de p75 (LEDGF) em PC3, resulta na alteração da expressão de TPO [22]. Esta mudança é susceptível de desempenhar um papel de protecção contra o stress oxidativo e fármacos quimioterapêuticos.

TCONS_00010581, uma isoforma de HEIH, que é conhecido por ser sobre-regulada no carcinoma hepatocelular [23], é na proximidade do EZH2 gene do complexo Polycomb-2 [24] a EZH2 gene é também encontrado sobre-regulada em todas as amostras de cancro em comparação com os tecidos não neoplásicos adjacentes em ambos os conjuntos de dados.

Um nlincRNA específicos do testículo, TCON_00025002, é no bairro do TOX3 gene no cromossomo 16, que são ambos-up regulada de uma forma específica para o câncer em nosso estudo. TOX3 é uma proteína de quadro de alta grupo motilidade envolvido na mediação da transcrição dependente de cálcio. TOX3 mapeia para a susceptibilidade locus do cancro da mama triplo-negativo conhecido; uma mutação neste locus implicada no desenvolvimento de cancro da mama [25]. Um SNP no gene TOX3 também está implicado na pancreático [26] e o cancro do pulmão [27].

nlincRNAs específico da próstata, e TCONS_00017728 TCONS_00010086, são encontrados para estar na proximidade dos genes GATA3 e ADAMTS19 respectivamente. Todos os quatro, incluindo o nlincRNAs e genes, para baixo são regulados de um modo específico do cancro neste estudo. GATA3 é um importante factor de transcrição conhecido por estar envolvido na regulação do gene de PSA de androgénio [28]. Um padrão de metilação global em cancro da próstata independente de androgénio e sensível androgénio mostra uma diferença significativa no padrão de metilação em GATA3 sob estas duas condições [29]. biópsias de tumores e várias linhas celulares de cancro têm apresentam elevados níveis de expressão de ADAMTS19 em osteossarcomas [30].

Alguns nlincRNAs específicas do fígado, TCONS_00014531, TCONS_00015169 e TCONS_000015171, são todos sobre-regulada no cancro da próstata neste estudo, juntamente com a POU5F1 pseudogene vizinha, que é adjacente ao locus de myc em grande locus de susceptibilidade a cancro da próstata em 8q24 [31]. Outra TCONS_00016903 específica do fígado é justaposta a EGFL7 gene, ambos registrados como regulada para baixo em nossa análise. Contrariamente às nossas constatações EGFL7 tem sido demonstrado que têm uma expressão elevada em vários tipos de cancro incluindo cancro do pulmão, cancro da mama, cancro da próstata e o carcinoma hepatocelular [32]. No entanto, tem havido um relatório de um microRNA, miR-126, localizada dentro do intrão de EGFL7, o qual é mostrado para ser sub-regulada em linhas celulares de cancro da bexiga e em tumores da próstata primários e [33].

Entre os nlincRNAs mais interessantes, TCONS_00028940, no bairro do TMPRSS2 gene, é altamente diferencialmente expressos em todas as amostras de câncer estudados aqui. A fusão do gene TMPRSS2-ERG é um dos rearranjos cromossómicos mais amplamente espalhadas em carcinomas [34], embora o TMPRSS2 gene não é expresso de uma forma específica do cancro em amostras estudadas aqui Descobrimos que este nlincRNA mostra expressão significativa em VCaP e não em PC3 e LnCaP.

Conclusão

recentemente, mais do que catorze mil lincRNAs foram descobertos a partir de grande número de tecidos humanos normais, o que sugere que estes lincRNAs normais (nlincRNAs) desempenham um papel na biologia normais . Pode-se supor que nlincRNAs com funções de regulação de genes em condições normais pode realmente ser regulada no cancro. Para este propósito, aqui temos tentado levar dois conjuntos de dados de RNA-seq gerados independentemente de coorte demograficamente diversa ao perfil ambas as proteínas genes codificadores e nlincRNAs. Nós identificamos 127 nlincRNAs que não são regulamentados apenas de forma significativa em amostras de câncer de ambos os conjuntos de dados, mas poderiam ser usados ​​para agrupar dados de amostras, não utilizados neste estudo, pelo contexto doença. Contrariamente à nossa hipótese, a caracterização de genes que codificam e nlincRNAs sugere que a maioria dos nlincRNAs são supra-regulados em cancro apesar 2 vezes mais genes codificadores de proteínas são sub-regulada no cancro. Isto, juntamente com a activação de muitos genes não-codificantes em 8q24 e inactivação de diversos genes que codificam em 17q21 e 19q13 loci sugeriria sistemas de activação nível de muitas nlincRNAs durante o cancro.

Verificou-se que um número de genes que codificam e nlincRNAs específicos para outros tecidos com base expressão nula no tecido da próstata são regulados positivamente no cancro da próstata. Talvez estes genes e nlincRNAs são responsáveis ​​pela perda de identidade celular levando a tumerogenesis. Para nosso conhecimento, este é a primeira tentativa ao perfil nlincRNAs juntamente com genes codificadores no câncer. Acreditamos que a abordagem utilizada aqui para caracterização funcional de nlincRNAs permitirá aos investigadores avançar a compreensão do papel da nlincRNAs na biologia normal e doença, em geral.

Informações de Apoio

Tabela S1. Genes diferencialmente regulados em amostras de câncer de ambos os conjuntos de dados identificados com as duas condutas de análise DESeq e aparador.

Colunas 2-5 dá os p-valores médios e dobre mudança obtida a partir de gasoduto DESeq e Edger tanto para SRP002628 e ERP000550.

Doi : 10.1371 /journal.pone.0122143.s001

(XLS)

S2 Table. Listas de p-valor e dobre-a mudança para todos os nlincRNAs regulados diferencialmente em ambos os conjuntos de dados que utilizam ambos os métodos. Tours A tabela lista genes vizinhos, juntamente com os seus respectivos p-valor e dobre-a mudança nos dois conjuntos de dados. Três últimas colunas lista os valores RPKM para estes lincRNAs em três celllines próstata

doi:. 10.1371 /journal.pone.0122143.s002

(XLS)

S3 Tabela. Listas de p-valor e log fold-change para lincRNAs conhecidos que são regulados diferencialmente em ambos os conjuntos de dados, juntamente com o estatuto da transcrição sobreposição com nlincRNAs no navegador UCSC

doi:. 10.1371 /journal.pone.0122143.s003

(XLS)

Reconhecimentos

os autores gostariam de reconhecer o Departamento de Biotecnologia, Nova Deli, Índia para apoio a SS através do Ramalingaswamy Fellowship (Ref nº: BT /DRH /35/02 /17/2009). Os autores também reconhecem o Departamento de Tecnologia da Informação, Governo da Índia, por seu apoio ao instituto no âmbito do “Centro de Excelência em Bioinformática Formação e Investigação ‘. Os autores gostariam de agradecer DST-FIST, Governo da Índia e do Departamento de Tecnologia da Informação, Governo de Karnataka, para bolsas de infra-estrutura para IBAB.

Deixe uma resposta