PLOS ONE: Análise abrangente de longo RNAs no câncer de ovário não-codificante revela padrões globais e orientadas RNAs não-codificantes longas DNA Amplification

Abstract

(lncRNAs) estão emergindo como reguladores potentes de fisiologia celular e recente estudos destacam o seu papel no desenvolvimento do tumor. No entanto, enquanto supressores de oncogenes codificadores de proteínas e tumor estabelecido muitas vezes exibem padrões marcantes do DNA copy-número alteração focal em tumores, a evidência similar é muito insuficientes para lncRNAs. Aqui, nós relatamos em uma análise genômica de GENCODE lncRNAs no adenocarcinoma de ovário seroso de alto grau, com base no Cancer Genome Atlas (TCGA) perfis moleculares. Usando genômica dados copy-número e sequenciamento cobertura transcriptoma profunda, derivado número de cópias e expressão de dados dupla para 10.419 lncRNAs todo 407 tumores primários. Descrevemos correlações globais entre lncRNA copy-número e expressão, e associados estabelecidos subtipos de expressão com assinaturas lncRNA distintas. Por regiões, examinando de focal mudança copy-número que não possuem metas de codificação de proteínas, identificamos um lncRNA intergênicas no cromossomo 1,

OVAL, que mostra a amplificação genómica focal estreita em um subconjunto de tumores. Enquanto fracamente expresso na maioria dos tumores, a amplificação focal coincidiu com

OVAL

activação transcricional forte. Triagem de 16 outros tipos de câncer revelaram padrões semelhantes em carcinomas do endométrio serosa. Isso mostra que lncRNAs intergênicas pode ser especificamente visados ​​por amplificação copy-número somático, sugestivo de comprometimento funcional na iniciação e progressão tumoral. Nossa análise fornece hipóteses testáveis ​​e abre o caminho para um estudo mais aprofundado de lncRNAs baseado em TCGA e outros genômica do câncer conjuntos de dados em larga escala

Citation:. Akrami R, Jacobsen A, Hoell J, Schultz N, Sander C, Larsson e (2013) Análise abrangente de longo RNAs no câncer de ovário não-codificante revela padrões globais e alvejado DNA Amplification. PLoS ONE 8 (11): e80306. doi: 10.1371 /journal.pone.0080306

editor: Aedín C. Culhane, Harvard School of Public Health, Estados Unidos da América

Recebido: 13 de junho de 2013; Aceito: 01 de outubro de 2013; Publicação: 12 de novembro de 2013

Direitos de autor: © 2013 Akrami et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este trabalho foi apoiada por doações do Conselho de Investigação médica da Suécia; Cancer Society sueco; A Fundação Sueca para a Investigação Estratégica; a Fundação Assar Gabrielsson; a Fundação Magnus Bergvall; a fundação Åke Wiberg; eo Memorial Foundation Lars Hierta. O financiamento para AJ, NS, e CS foi fornecido pelo Instituto Nacional do Câncer dos Estados Unidos como parte da subvenção TCGA Genome Data Analysis Center (NCI-U24CA143840 e NCI-R21CA135870) e por um Stand Up To Cancer Dream Team Translational Research Grant, um Programa da Fundação da Indústria do Entretenimento (SU2C-AACR-DT0209). Os cálculos foram em parte executadas em recursos de computação de alto desempenho fornecidos por Infra-estrutura Nacional Sueco para a Computação (SNIC), através de Uppsala Multidisciplinar Centro Avançado de Ciência Computacional (UPPMAX) sob b2012108 projeto. Os resultados publicados aqui estão total ou parcialmente com base em dados gerados pelo projecto-piloto Cancer Genome Atlas estabelecida pelo Instituto Nacional do Câncer e Instituto National Human Genome Research (NHGRI). Informações sobre TCGA e os investigadores e instituições que constituem a rede de pesquisa TCGA pode ser encontrada em “https://cancergenome.nih.gov”. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

estudos transcriptomic recentes em mamíferos têm revelado uma abundância de RNAs não-codificantes longos (lncRNAs) que se encontram intercalados com genes codificadores de formas complexas [1-3]. transcrições lncRNA normalmente têm propriedades mRNA semelhantes, tais como estruturas de genes multiexonic e caudas poli (A), mas não têm capacidade de codificação da proteína aparente. Embora exemplos funcionais precoces (por exemplo,

H19

[4] e

XIST

[5]) foram descrita pela primeira vez mais de 20 anos atrás, lncRNAs estão agora emergentes como reguladores generalizados de fisiologia celular com diversos papéis tanto no núcleo e citoplasma, incluindo o recrutamento de histona-modificando complexos a cromatina, regulação da transcrição e splicing, e controle da tradução do mRNA.

Vários estudos recentes sugerem que lncRNAs podem ter papéis importantes na oncogênese [6 , 7]. Por exemplo,

HOTAIR

expressão é elevada em tumores de câncer de mama metastático, e sua blocos de inibição de metástase em modelos de roedores [8],

MALAT1

expressão se correlaciona com metástases e sobrevida no câncer de pulmão [9] , e poliA + transcriptoma sequenciação (ARN-SEQ) recentemente identificado

PCAT-1

como um promotor do crescimento lncRNA no cancro da próstata [10]. No entanto, é notável que os dados genéticos fornecidos, assim, refere-se agora principalmente a alterações na expressão de genes. A transformação maligna requer a activação genética de oncogenes promotores do crescimento e inactivação de supressores tumorais, e isto é facilitado em tumores por instabilidade genómica, a variabilidade genética adquirida, e a expansão clonal [11]. Em grandes conjuntos de dados de genômica do câncer, tais como aqueles produzidos pelo consórcio Cancer Genome Atlas (TCGA), genes de câncer importantes, portanto, revelar-se através de padrões marcantes da recorrente alteração no nível do DNA, incluindo a amplificação copy-número focal e eliminação [12,13]. No entanto, enquanto lncRNAs e codificação genes deve, em princípio, ser suscetível a ativação ou desativação através de mecanismos semelhantes, não há, até agora, pouca evidência de que lncRNAs sejam especificamente visados ​​por alterações no número de cópias no câncer independentemente dos genes que codificam proximais (recentemente revisto em 6,14 ).

Nós aqui realizou uma análise genômica em larga escala de lncRNAs no carcinoma de alto grau seroso do ovário (HGS-OVCA), uma das principais causas de morte por câncer entre as mulheres nos Estados Unidos [15], com base em perfis moleculares de alto rendimento gerados dentro TCGA [12]. Baseamos nossas análises sobre o catálogo completo GENCODE lncRNA, que tem sido sujeito a ampla caracterização e curadoria manual do [16,17], enquanto estiver usando uma abordagem de anotação-imparcial se for o caso. Nós consequentemente focar lncRNAs com expressão reprodutível em conjuntos de dados independentes, com base no pressuposto de que lncRNAs cancro relevante deve, semelhantes a genes que codificam, têm funções importantes também em células normais. Usando dados de RNA-seq cobertura profundos e de DNA de alta resolução número de cópias matrizes, nós derivada perfis número de cópias simultâneas e dados de expressão para 10.000 genes GENCODE lncRNA todo 407 tumores primários (dados disponíveis em www.larssonlab.org/tcga- lncRNAs). Nós investigamos a relação global entre DNA copy-número e expressão lncRNA, e avaliar lncRNAs em relação aos subtipos de expressão estabelecidos em HGS-OVCA. Além disso, nos dirigimos se lncRNAs podem ser especificamente visados ​​por focal alteração copy-número no câncer.

Resultados e Discussão

perfil molecular de lncRNAs em 407 tumores

Foi utilizado o GENCODE [17] anotação como nosso principal quadro para investigar padrões de lncRNA copy-número alteração e expressão através de 407 tumores fase-II-IV HGS-OVCA [12]. Descobrimos que o subconjunto GENCODE lncRNA [16], que engloba 10.419 genes lncRNA anotados manualmente (Versão 11, Figura 1A), mostraram um elevado grau de poliadenilação, tal como determinado por sequenciação normal de RNA de tecido (ARN-SEQ) de dados (Figura 1B). Copiar dados de número de matrizes comparativas hibridização genômica (CGH) estava disponível para 486 tumores primários, e a grande maioria dos GENCODE lncRNAs (97%) expectedly residia em regiões abrangidas. A seguir processado um total de 25,7 mil milhões de pares de leitura mapeado-GENCODE de poliA + de ARN-SEQ (em média 63,1 milhões por amostra) para derivar perfis de expressão para todos GENCODE lncRNAs em 407 destes tumores (Figura 1C). Apenas 225 milhões de pares de leitura mapeado para lncRNA loci (em média 553 mil por amostra), enfatizando a necessidade de cobertura de alta sequência de quantificar com precisão lncRNAs

.

A, abundância relativa das categorias de genes na anotação GENCODE 11 (loci única ). B, estado poliadenilação do lncRNAs, determinada por poliA + de ARN total versus-SEQ partir de uma mistura de 16 tecidos. C, expressão lncRNA de perfil utilizando poliA + RNA-seq através de 407 tumores. No total, 25,7 bilhões de pares de leitura mapeados exclusivamente, abrangendo 3 terabases, foram contados em genes GENCODE. A tabela mostra a profundidade sequenciamento per-tumor, com base em todas GENCODE-mapeados lê ou subconjuntos lncRNA. D, Distribuições de lncRNA e os níveis de expressão do gene de codificação (RPKM máxima em todos os tumores). RPKM, leituras por quilobases por milhão lê. E, histogramas de correlações entre o DNA copy-número e nível de RNA (baseado em 407 tumores com dados dupla). Painel esquerdo: lncRNAs globais (painel esquerdo,

n

= 10.066), mostrando correlações mais baixas em comparação com genes que codificam. Painel direito: melhorou correlações quando se considera genes expressos em RPKM 3 (19% superior lncRNAs,

n

= 1920) que também foram amplificados ou excluídos em 15 amostras (painel direito,

n

= 125)

Comparação das normalizado de comprimento (do tipo RPKM [18]) valores de expressão entre codificação e genes lncRNAs confirmou que lncRNAs foram expressos em níveis substancialmente mais baixos (Figura 1D), de acordo com relatórios anteriores de uma ampla variedade de fontes celulares [1 , 16,19]. Enquanto 87% dos genes que codificam mostrou um nível RPKM 1 em, pelo menos, um tumor, apenas 36% de lncRNAs atingiu este nível de expressão. correlações genoma escala entre DNA copy-número amplitude e os níveis de RNA foram menores para lncRNAs em comparação com genes que codificam, mas esta discrepância foi reduzida quando considerando apenas abundantes e freqüentes número de cópias alteradas genes (Figura 1E). A análise complementar com base em matrizes Affymetrix Exon 1.0ST, que pode interrogar um subconjunto de lncRNAs, obtiveram resultados semelhantes (481 amostras, Figura S1 S1 Arquivo).

lncRNAs associados com subtipos de expressão

análise prévia de codificação de expressão gênica em HGS-OVCA identificados quatro subtipos robustos, que foram denominadas ‘imunorreativo’, ‘proliferativa’ ‘diferenciado’ e ‘mesenquimais “com base em seu conteúdo genético [12,20]. Os subtipos foram ainda demonstrado estar associado a alterações específicas genômicos, onde o grupo proliferativa tem uma menor frequência de

MYC

amplificação e

RB1 ​​

exclusão, enquanto o grupo imunorreativo tem uma maior frequência de

MECOM

amplificação. Nós aqui testado se os subtipos estabelecidos em HGS-OVCA também têm padrões distintos de expressão lncRNA.

Os tumores com o subtipo disponíveis, dados clínicos e de expressão foram divididos aleatoriamente em dois grupos (

n

= 200 cada ), a retenção de um meio para posterior validação. Foram identificados 455 lncRNAs que foram induzidos ou reprimidos especificamente em um dos quatro subtipos relativamente a amostras restantes (Figura 2A, tal como descrito em Métodos). Estes padrões de expressão foram claramente mantida no conjunto de validação, confirmando que as associações subtipo eram não-aleatório (Figura 2B). Além disso, a expressão do subtipo de um tumor pode ser previsto com base em lncRNAs-associado subtipo, usando um classificador simples (Métodos) na maioria (77%) dos tumores (Figura 2B).

, 455 mostraram um aumento ou lncRNAs expressão reduzida em um dos quatro subtipos de expressão previamente definidos (200 tumores aleatórios, esquerda). Estes lncRNAs mantiveram os seus padrões de expressão do subtipo selectivo em 200 tumores independentes, e o subtipo poderia ali ser previsto com base na sua expressão na precisão de 77% (para a direita). B, A mesma análise com base em um subconjunto lncRNA intergênico (

n

= 152, 73% de precisão, à esquerda). para cima mais próxima e vizinhos codificadores de proteínas a jusante destas lncRNAs (278 genes únicos) não tinham padrões de expressão fortes específicos do subtipo e sua assinatura combinado foi de menos informativa do subtipo (precisão de 51%, à direita).

análise lncRNA pode mostrar fortes correlações positivas com os seus anfitriões de codificação [16] sobreposição antisense, motivando baseado em lncRNAs intergênicas sozinho. Por isso, investigou um subconjunto de 152 lncRNAs com localização intergênico, e encontrou seus padrões de expressão a ser semelhante ao conjunto completo dos dados de validação (Figura 2B, Tabela S1 no arquivo S1, 73% de precisão). Apesar de codificação de genes vizinhos dos 152 lncRNAs ainda estavam moderadamente preditivo do subtipo (51%), que apresentaram padrões consideravelmente mais fracos da expressão específica de subtipo (Figura 2B). Notavelmente, entre lncRNAs intergênicas induzidas no subtipo mesenquimais foram

MIAT

/Gomafu, um alvo conhecido e co-ativador de Oct4, com um papel na pluripotência de células-tronco [21].

NEAT1

e

UCA1

foram reprimidos no subtipo proliferativa:

NEAT1

é essencial para a estrutura de paraspeckles nucleares [22] e foi mostrada para ser regulada positivamente em cancro do ovário [23], enquanto

UCA1

é conhecido um regulador de crescimento de células de carcinoma da bexiga em [24]. Nós, adicionalmente, avaliaram os níveis lncRNA em relação à sobrevida do paciente, mas não encontraram associações reprodutíveis. Os nossos resultados mostram que os subtipos de expressão em HGS-OVCA, originalmente definido com base na expressão do gene de codificação, estão cada um associado com assinaturas de expressão lncRNA distintas, e especula-se que estes lncRNAs poderia contribuir para a reprogramação transcricional ou agir nos circuitos celulares que são alterados em estes tipos de tumores.

lncRNAs em regiões de focal copy-número alteração

genomas do tumor são mosaicos de aberrações cromossómicas, alguns dos quais estão sob seleção para ativar ou desativar oncogenes ou supressores de tumor específico. Em grandes grupos de pacientes, os genes-alvo individuais podem, portanto, ser deduzido através de padrões de recorrência, em particular quando as regiões alteradas são estreitas (focal) [25]. O algoritmo GISTIC, quando aplicado a número de cópias de dados a partir de cancro do ovário TCGA, identificadas várias regiões de cópia-focal número alteração recorrente [12]. Muitos destes abranger genes do cancro bem conhecidos, mas em alguns casos, os alvos permanecem mal definidos. Nossa hipótese é que lncRNAs poderia ser motoristas em alguns desses eventos, e, portanto, exibido regiões focais estreitas para sobreposições com lncRNAs.

Houve 35 estreita (sobrepondo-se, no máximo, 5 genes codificantes) amplificações ou exclusões que foram significativos na uma taxa de falsos descoberta (residual

q

) de 0,05 (Figura 3A, Tabela S2 em S1 Arquivo). Muitos sobreposto com estabelecidas proto-oncogenes, tais como

CCNE1

e

MYC

, eo

RB1 ​​

,

NF1

e

PTEN

supressores de tumor, mas lncRNAs também estavam presentes em conjunto com os genes de codificação em vários casos (Figura 3A). Apesar de selecção para a cópia-número alteração nestes loci poderia, em princípio, ser explicada pelo lncRNAs, quer isoladamente ou em combinação com os seus vizinhos de codificação [26], que focada em vez de dois picos focais que careciam de genes codificadores de proteínas: uma amplificação em 1q25 e uma deleção no cromossoma 4q34 (indicado com * na Figura 3A). A região excluída estava em um grande espaço intergênico ~ 1 Mb de

ODZ3

; um gene encontrado recentemente para ser alvo de L1 retrotransposição no cancro colorectal [27] e eliminada no neuroblastoma [28]. Enquanto segmentos excluídos em HGS-OVCA foram claramente separada da

ODZ3

e abrangeu dois genes lncRNA anotado (Figura S2A no arquivo S1), estes não tinham expressão relevante ( 5 mapeados lê em 99% dos tumores) , e que não conseguiu revelar outros candidatos de investigar a cobertura de leitura ARN-seq na região (dados não mostrados). Uma análise mais aprofundada sugeriu que as exclusões poderiam ser indiretamente dirigida a

ODZ3

através da ruptura de DNA regulatório associado (Figura S2B no arquivo S1), e a região não foi ainda caracterizado.

A, lncRNAs e codificação de genes em regiões estreitas de amplificação recorrente ou eliminação identificadas por GISTIC (

q Art 0,05) em 486 tumores HGS-OVCA. contagens gene para 35 picos focais apertados com um máximo de cinco genes que codificam sobreposição são mostrados. genes de câncer conhecidos e metas de codificação inequívocas são indicados. *, Regiões investigadas em maior detalhe. B, Vista detalhada do

ACBD6 Restaurant –

contexto genômico XPR1 e região intergénica (região AXI, linha pontilhada) em um ~ 1 Mb. O pico focal AXI é centrada em

RP11-522D2.1 /Tablet OVAL, um lncRNA descaracterizado em chr1q25. sombreamento vermelho mostra perfis número de cópias para os tumores individuais. C, os tumores ordenados por expressão

OVAL

.

OVAL

ARN (eixo dos y) foi principalmente baixo ou não detectável, mas foi induzida em casos focalmente amplificado (como definido nos Métodos). D: Nem

ACBD6

nem

XPR1

foram nomeadamente induzida pela amplificação focal região AXI.

OVAL

RNA foi baixa também em casos amplamente amplificados. ND, não detectado. E, a densidade de leitura RNA-seq média na região de AXI (linha pontilhada) para tumores com amplificação focal AXI acentuada (

n

= 10) em relação ao restante tumores (contagens de leitura normalizada por 1000 segmento nt). F, a análise mostrou que GSEA determinada experimentalmente P53 genes regulados são induzidos em tumores

OVAL

focally amplificados.

amplificação somática Focal da OVAL lncRNA

A seguir, investigou a 1q25 amplificação, que foi focally ganhou em 16/407 pacientes (3,9%), e centrada em um 128 kb região intergénica entre o

ACBD6 Comprar e genes (doravante região AXI a)

XPR1

. A região AXI carece de genes codificadores de proteínas, mas contém um único gene lncRNA anotada,

RP11-522D2.1

, perto do seu centro (Figura 3B). Este lncRNA, que nós aqui termo

OVAL

(adenocarcinoma de ovário amplificado lncRNA), coincide estreitamente com o pico focal identificada por GISTIC, e está posicionado 55 kb e 65 kb dos vizinhos de codificação de proteínas de codificação mais próximos. Notavelmente, os segmentos cromossômicos amplificados foram muitas vezes pequenos (50-100 kb) e abrangeu a plena

gene OVAL

, enquanto está a ser constrangido a região AXI ou estender apenas parcialmente para os genes vizinhos (Figura 3B).

Uma vez que o padrão de amplificação de DNA focal apontou para

OVAL

como o gene de condução alteração nesta região, o próximo investigado se este foi apoiado pelo padrão de

OVAL expressão

na tumores.

OVAL

expressão era baixa ou ausente em ambos os trompa de Falópio normal (Figura S3 em S1 Arquivo) e, na maioria dos tumores, incluindo a maioria dos casos com amplificação 1T largura. No entanto, a amplificação focal da

OVAL

lócus coincidiu notavelmente com

OVAL

activação da transcrição (Figura 3C).

OVAL

RNA foi, em média, 46 vezes maior nos casos focais em comparação com amostras restantes (

P

= 3.5E-8, Wilcoxon rank sum), e

OVAL

classificou 74 de todos os lncRNAs GENCODE com base na expressão máxima em todos os tumores (Tabela S3 em S1 Arquivo). Resultados semelhantes foram obtidos utilizando dados Exon 1.0ST à base de hibridação (Figura S4 no arquivo S1).

Apesar de amplificação focal região AXI não pareceu alvejar diretamente os genes de codificação de flanco, estes podem ainda ser afetados indiretamente na nível de expressão do gene. Isto seria compatível com as suas sequências regulatórias sendo alteradas, ou

OVAL

ter um

cis

papel regulamentares no controle de sua transcrição. No entanto, nem

ACBD6

nem

XPR1

foram nomeadamente induzida em casos focally amplificados (Figura 3D). Além disso, esses genes não são previamente descrito como alterada no cancro, apoiando ainda que

OVAL

é alvo de forma independente na região intergênica AXI.

Investigação de cobertura leitura RNA-seq na região de AXI revelou que

OVAL

foi o principal lócus expressa em tumores focally amplificadas, enquanto as amostras restantes apresentaram baixa atividade transcricional nesta região (Figura 3E). Embora a transcrição adicional foi observada fora do

OVAL

lugar, principalmente na região a montante (Figura 3E), estes sinais não eram consistentes entre os tumores individuais (Figura S5 em S1 Arquivo). O exame dos dados disponíveis no GenBank revelou apenas algumas sequências de ESTs singulares na região de AXI de distância do centro focal, enquanto

RP11-522D2

.

1 | /

OVAL

foi apoiada por 12 ESTs de splicing e sequências de cDNA 6. Um putativo Y-ARN (prevista a partir de famílias Rfam), perto da borda AXI região 50 kb a partir do pico central, não foi apoiada pela evidência de cDNA /RNA-EST ou SEQ em tumores ou tecidos normais (dados não mostrados). Conclui-se que ambos os perfis de expressão tumor HGS-OVCA e disponíveis cDNA /EST ponto de evidência para

OVAL

como a principal unidade de transcrito de forma estável na região AXI amplificado.

análise de conjunto enriquecimento Gene (GSEA) revelou que os objectivos previamente definidos de P53 (TANG_SENESCENCE_TP53_TARGETS_DN) foram significativamente elevados em

OVAL

tumores amplificados (Figura 3F). Enquanto isso indica que

OVAL

activação pode coincidir com a atividade P53 alterada,

TP53

estado de mutação e níveis de mRNA foram semelhantes em ambos os grupos. Genes que codificam proteínas contráteis relacionados com os músculos (STRUCTURAL_CONSTITUENT_OF_MUSCLE) foram enriquecidas entre aqueles reprimida em

OVAL

tumores amplificados.

Caracterização molecular de OVAL

Tendo estabelecido

OVAL

como um alvo provável na região da AXI, que caracterizado pelo facto adicional deste gene, em termos de estrutura do gene e a expressão tecido normal. O gene de

OVAL

contém três exões anotados que dão origem a um ARN de 1489 nt previsto não codificante, em que o terceiro exão grande contribui maior parte da sequência. Esta estrutura foi confirmada por múltiplas sequências de ARNm GenBank (Figura 4A) e de ESTs splicing, bem como ARN-SEQ partir de linhas celulares, tais como Gm12878 (dados não mostrados). Muitos dos

OVAL

ESTs e mRNAs originado a partir de células de melanoma humano, e a transcrição foi, consequentemente, localizaram em uma tela de bioinformática recente para ESTs públicos específicos de melanoma [29].

OVAL

também foi mapeada em uma pesquisa recente da lncRNAs intergênicas humanos [19], e semelhante à nossa própria análise de dados de RNA-seq tecido normal, este estudo identificou uma primeira isoforma do exão alternativo (Figura 4A) não suportada por os dados de expressão de tumor. Embora os padrões de splicing adicionais possíveis foram observadas nos tumores, estes mostrou fraca expressão e inconsistentes entre as amostras (dados não mostrados).

,

OVAL

locus no cromossoma 1. GenBank mRNAs, transcrição conservada vinculativo fator locais (TFBS) previsto pelo brower UCSC, e outras características são indicadas. B, perfil de expressão tecido normal do

OVAL

(RNA-seq). Coração expressão foi confirmada por PCR de transcrição inversa. PC3, linha celular de cancro da próstata humano; Coração, aurícula do coração; A7, linha de células de melanoma humano C,

OVAL

e os seus vizinhos de codificação têm perfis de expressão diferentes. D, subcelular RNA-seq de 7 reunidas linhas celulares (Gm12878, HelaS3, HepG2, HUVEC, H1hesc, NHEK e K562) mostra localização citoplasmática predominante.

conservação evolutiva, com base num alinhamento múltiplo genómica de mamífero , foi baixa, em geral, mas em regiões específicas do último exão demonstrou elevada conservação (Figura 4A). A base de dados de locais alvo miRcode microARN putativos em lncRNAs [30] revelou um local de miR-30 conservados, presentes na maioria dos mamíferos e primatas, em uma destas manchas. Embora a sequência madura é principalmente não-repetitivo, RepeatMasker [31] identificado LTR THE1A-int e L2b linha derivada elementos, bem como uma possível sequência de snRNA U2 no último exão (Figura 4A). No entanto, encontramos nenhum resultado para snRNAs ou outras estruturas conhecidas na Rfam [32], e

OVAL

é, portanto, pouco provável que funcionar como um precursor para um RNA estrutural clássica.

lncRNAs tenham sido previamente definida a partir das pontuações de frequência de substituição de codão e a falta de uma estrutura de leitura aberta (ORF) maiores que 100 aminoácidos [1]. Além de ser classificadas como não-codificante pelo gasoduto GENCODE, o madura

OVAL

sequência não codificadora foi de acordo com o algoritmo de CPC [33] e utilizando PhyloCSF [34] com base num alinhamento de mamífero. ORF em

OVAL

tudo falta o consenso Kozak e não mais do que 98 aminoácidos são. A análise conjunta recente em tandem massa de dados de espectrometria e sequências GENCODE lncRNA, incluindo

RP11522-D2

.

1 | /

OVAL, identificado apenas um único jogo lncRNA ao excluir misannotated casos, apoiando uma total falta de codificação capacidade para estas transcrições [35]. Importante, nenhuma homologia com qualquer sequência conhecida da proteína foi revelado pela análise BLASTx. A função de codificação, portanto, parece improvável, e concluímos que

OVAL

provavelmente representa um

bona fide

lncRNA.

RNA-seq de tecidos humanos normais mostrou que

OVAL

é expresso selectivamente no músculo cardíaco, o que foi confirmado por PCR de transcrição reversa (Figura 4B). Dois putativo fator-2 conservada miócitos potenciador (MEF2) locais, posicionados perto do exão primeiro (Figura 4A) alternativa, a ligação pode conduzir a expressão no tecido muscular, tanto como células humanas de mioblastos de músculo esquelético (HSMM) músculo do coração e expressar exclusivamente esta alternativa isoforma (dados não mostrados). O

OVAL

padrão de expressão é muito diferente de seus vizinhos de codificação (Figura 4C), e sua localização subcelular foi predominantemente citoplasmática (Figura 4D). Isto fala ainda mais contra um

cis

papel -regulatory em genes próximos, e é consistente com a nossa conclusão de que

OVAL

amplificação não influenciou nomeadamente a sua expressão (Figura 4D). Em resumo,

OVAL

parece ter uma função citoplasmática não-codificante que é independente de seus vizinhos codificadores de proteínas.

amplificação OVAL em carcinomas do endométrio serosa

A seguir, investigou se

OVAL

amplificação é exclusivo para câncer de ovário e considerados perfis número de cópias de 16 cânceres adicionais TCGA, que variam em tamanho de 57 a 825 tumores. Curiosamente, observou-se a amplificação focal de baixa frequência do

OVAL

lócus também no carcinoma endometrióide corpo uterino, enquanto nenhum sinal focal óbvio foi visto nos cancros restantes (Figura S6 em S1 Arquivo). Uma inspeção mais detalhada revelou que o pico focal novamente coincidiu estreitamente com o

OVAL

gene (Figura 5A).

A, amplificação focal de baixa frequência do

OVAL

lócus no câncer endometrial , mas não 16 outros cancros TCGA (veja a Figura S6 em S1 Arquivo). B, 56% dos casos focally amplificados eram do subtipo serosa, em comparação com 21% no total (

P

= 0,025, teste exato de Fisher). C,

OVAL

ARN foi fortemente induzido em um subconjunto de tumores, e isto coincidiu com a amplificação da região focal da AXI. ND, não detectado. D, a densidade de leitura RNA-seq média na região de AXI para tumores com amplificação focal marcado (

n

= 4) em relação ao restante tumores (contagens de leitura normalizada por 1000 segmento nt). E, semelhante ao câncer de ovário, análise GSEA revelou indução de metas de p53 em tumores

OVAL

amplificados.

Uma fração dos tumores do endométrio são classificados como serosa ou serosa-like. Estes têm uma semelhança morfológica perto de sua contraparte ovário [36], e também são geneticamente semelhantes ao câncer de ovário [37]. Consequentemente, observou-se que os tumores do subtipo serosa foram 4 vezes mais susceptíveis de transportar

amplificação focal OVAL

comparação com tumores não-serosa (5/91 vs. 4/331,

P

= 0,025, Figura 5B). Semelhante ao câncer de ovário, amplificação focal da região de AXI foi associada com forte aumento da expressão de

OVAL

(Figura 5C), e cobertura de leitura RNA-seq mostrou que

OVAL

foi a principal unidade transcrita na região (Figura 5D). análise GSEA revelou que os genes P53 regulados determinados experimentalmente foram upregulated em

OVAL

amostras amplificadas, replicando nossos resultados anteriores de câncer de ovário (Figura 5E). Tomados em conjunto, os resultados de câncer ovariano e endometrial sugerem que

OVAL

amplificação é selecionado para especificamente em tumores serosos, independentemente da localização do tumor.

Conclusões

lncRNAs já foram testadas em materiais clínicos utilizando próxima geração seqüenciamento, incluindo um estudo recente de 64 carcinomas e sarcomas usando extremidade 3 ‘sequenciamento [38], e sequenciamento do transcriptoma de 102 tecidos da próstata e linhas celulares [10]. Além disso, foram lncRNAs perfilado em tecidos normais e de cancro com base em 272 bibliotecas SAGE comuns [39]. A presente análise é a primeira a fazer uso de TCGA RNA-seq ao perfil lncRNAs no cancro, e para facilitar a investigação futura fazemos perfis moleculares lncRNA para tumores TCGA disponível em www.larssonlab.org/tcga-lncrnas.

Há apenas evidência limitada para somática focal copy-número de alteração de lncRNAs no cancro, e descreveu casos envolvem lncRNAs que são co-alterados com genes de câncer de codificação proximais. Dois lncRNAs no

LSAMP

locus de supressor de tumor no cromossoma 3q13,

OC285194

e

BC040587

, foram frequentemente focally excluído no osteossarcoma, muitas vezes em conjunto com

LSAMP

[26]. Estes lncRNAs são co-expressos com

LSAMP

, e os três genes são susceptíveis funcionalmente interligadas. O

PVT1

locus no 8q24, o que dá origem a uma variedade de RNAs não-codificantes emendados, é muitas vezes co-amplificados com a vizinha

MYC

oncogene [40,41]. No entanto, com o tempo tornou-se claro que

PVT1

codifica vários microRNAs, e seu papel principal poderia, portanto, ser a de um precursor microRNA [42,43].

No caso de

RP11 /522D2.1 /OVAL

, várias observações independentes nomeie-a como um alvo independente da amplificação do gene somática. Ele está localizado no centro de um segmento amplificado intergénica estreita que carece de outros genes anotados, e o pico focal coincide estreitamente com o gene de

OVAL

. cobertura ARN-SEQ de leitura, bem como ADNc disponíveis e evidência EST, falha a revelar outros candidatos credíveis na região. Focal, mas não ampla, amplificação coincidiu com forte indução de

OVAL

RNA.

OVAL

não foi co-expressa com os seus vizinhos de codificação, nenhum dos quais são previamente associados ao câncer e sendo a mais próxima mais de 50 kb de distância, e

OVAL

amplificação não nomeadamente alterar a sua expressão . Isto, em combinação com uma localização predominantemente citoplasmática, fala contra

OVAL

ter um

cis

papel -regulatory em genes vizinhos. A replicação destes padrões no cancro endometrial seroso reforça a hipótese.

amplificação Focal da região de AXI é relativamente rara (3,9%), e ganhos de amplitude geralmente baixos. No entanto, HGS-OVCA é caracterizado por uma grande diversidade mutacional, com uma relativa falta de alterações individuais de condução freqüentes, ea frequência é comparável a alterações funcionais conhecidos, tais como BRCA1 e BRCA2 mutação somática (3,5% e 3,2%, respectivamente [44]) .

Deixe uma resposta