Abstract
(lncRNAs) estão emergindo como reguladores potentes de fisiologia celular e recente estudos destacam o seu papel no desenvolvimento do tumor. No entanto, enquanto supressores de oncogenes codificadores de proteínas e tumor estabelecido muitas vezes exibem padrões marcantes do DNA copy-número alteração focal em tumores, a evidência similar é muito insuficientes para lncRNAs. Aqui, nós relatamos em uma análise genômica de GENCODE lncRNAs no adenocarcinoma de ovário seroso de alto grau, com base no Cancer Genome Atlas (TCGA) perfis moleculares. Usando genômica dados copy-número e sequenciamento cobertura transcriptoma profunda, derivado número de cópias e expressão de dados dupla para 10.419 lncRNAs todo 407 tumores primários. Descrevemos correlações globais entre lncRNA copy-número e expressão, e associados estabelecidos subtipos de expressão com assinaturas lncRNA distintas. Por regiões, examinando de focal mudança copy-número que não possuem metas de codificação de proteínas, identificamos um lncRNA intergênicas no cromossomo 1,
OVAL, que mostra a amplificação genómica focal estreita em um subconjunto de tumores. Enquanto fracamente expresso na maioria dos tumores, a amplificação focal coincidiu com
OVAL
activação transcricional forte. Triagem de 16 outros tipos de câncer revelaram padrões semelhantes em carcinomas do endométrio serosa. Isso mostra que lncRNAs intergênicas pode ser especificamente visados por amplificação copy-número somático, sugestivo de comprometimento funcional na iniciação e progressão tumoral. Nossa análise fornece hipóteses testáveis e abre o caminho para um estudo mais aprofundado de lncRNAs baseado em TCGA e outros genômica do câncer conjuntos de dados em larga escala
Citation:. Akrami R, Jacobsen A, Hoell J, Schultz N, Sander C, Larsson e (2013) Análise abrangente de longo RNAs no câncer de ovário não-codificante revela padrões globais e alvejado DNA Amplification. PLoS ONE 8 (11): e80306. doi: 10.1371 /journal.pone.0080306
editor: Aedín C. Culhane, Harvard School of Public Health, Estados Unidos da América
Recebido: 13 de junho de 2013; Aceito: 01 de outubro de 2013; Publicação: 12 de novembro de 2013
Direitos de autor: © 2013 Akrami et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados
Financiamento:. Este trabalho foi apoiada por doações do Conselho de Investigação médica da Suécia; Cancer Society sueco; A Fundação Sueca para a Investigação Estratégica; a Fundação Assar Gabrielsson; a Fundação Magnus Bergvall; a fundação Åke Wiberg; eo Memorial Foundation Lars Hierta. O financiamento para AJ, NS, e CS foi fornecido pelo Instituto Nacional do Câncer dos Estados Unidos como parte da subvenção TCGA Genome Data Analysis Center (NCI-U24CA143840 e NCI-R21CA135870) e por um Stand Up To Cancer Dream Team Translational Research Grant, um Programa da Fundação da Indústria do Entretenimento (SU2C-AACR-DT0209). Os cálculos foram em parte executadas em recursos de computação de alto desempenho fornecidos por Infra-estrutura Nacional Sueco para a Computação (SNIC), através de Uppsala Multidisciplinar Centro Avançado de Ciência Computacional (UPPMAX) sob b2012108 projeto. Os resultados publicados aqui estão total ou parcialmente com base em dados gerados pelo projecto-piloto Cancer Genome Atlas estabelecida pelo Instituto Nacional do Câncer e Instituto National Human Genome Research (NHGRI). Informações sobre TCGA e os investigadores e instituições que constituem a rede de pesquisa TCGA pode ser encontrada em “https://cancergenome.nih.gov”. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito
CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes
Introdução
estudos transcriptomic recentes em mamíferos têm revelado uma abundância de RNAs não-codificantes longos (lncRNAs) que se encontram intercalados com genes codificadores de formas complexas [1-3]. transcrições lncRNA normalmente têm propriedades mRNA semelhantes, tais como estruturas de genes multiexonic e caudas poli (A), mas não têm capacidade de codificação da proteína aparente. Embora exemplos funcionais precoces (por exemplo,
H19
[4] e
XIST
[5]) foram descrita pela primeira vez mais de 20 anos atrás, lncRNAs estão agora emergentes como reguladores generalizados de fisiologia celular com diversos papéis tanto no núcleo e citoplasma, incluindo o recrutamento de histona-modificando complexos a cromatina, regulação da transcrição e splicing, e controle da tradução do mRNA.
Vários estudos recentes sugerem que lncRNAs podem ter papéis importantes na oncogênese [6 , 7]. Por exemplo,
HOTAIR
expressão é elevada em tumores de câncer de mama metastático, e sua blocos de inibição de metástase em modelos de roedores [8],
MALAT1
expressão se correlaciona com metástases e sobrevida no câncer de pulmão [9] , e poliA + transcriptoma sequenciação (ARN-SEQ) recentemente identificado
PCAT-1
como um promotor do crescimento lncRNA no cancro da próstata [10]. No entanto, é notável que os dados genéticos fornecidos, assim, refere-se agora principalmente a alterações na expressão de genes. A transformação maligna requer a activação genética de oncogenes promotores do crescimento e inactivação de supressores tumorais, e isto é facilitado em tumores por instabilidade genómica, a variabilidade genética adquirida, e a expansão clonal [11]. Em grandes conjuntos de dados de genômica do câncer, tais como aqueles produzidos pelo consórcio Cancer Genome Atlas (TCGA), genes de câncer importantes, portanto, revelar-se através de padrões marcantes da recorrente alteração no nível do DNA, incluindo a amplificação copy-número focal e eliminação [12,13]. No entanto, enquanto lncRNAs e codificação genes deve, em princípio, ser suscetível a ativação ou desativação através de mecanismos semelhantes, não há, até agora, pouca evidência de que lncRNAs sejam especificamente visados por alterações no número de cópias no câncer independentemente dos genes que codificam proximais (recentemente revisto em 6,14 ).
Nós aqui realizou uma análise genômica em larga escala de lncRNAs no carcinoma de alto grau seroso do ovário (HGS-OVCA), uma das principais causas de morte por câncer entre as mulheres nos Estados Unidos [15], com base em perfis moleculares de alto rendimento gerados dentro TCGA [12]. Baseamos nossas análises sobre o catálogo completo GENCODE lncRNA, que tem sido sujeito a ampla caracterização e curadoria manual do [16,17], enquanto estiver usando uma abordagem de anotação-imparcial se for o caso. Nós consequentemente focar lncRNAs com expressão reprodutível em conjuntos de dados independentes, com base no pressuposto de que lncRNAs cancro relevante deve, semelhantes a genes que codificam, têm funções importantes também em células normais. Usando dados de RNA-seq cobertura profundos e de DNA de alta resolução número de cópias matrizes, nós derivada perfis número de cópias simultâneas e dados de expressão para 10.000 genes GENCODE lncRNA todo 407 tumores primários (dados disponíveis em www.larssonlab.org/tcga- lncRNAs). Nós investigamos a relação global entre DNA copy-número e expressão lncRNA, e avaliar lncRNAs em relação aos subtipos de expressão estabelecidos em HGS-OVCA. Além disso, nos dirigimos se lncRNAs podem ser especificamente visados por focal alteração copy-número no câncer.
Resultados e Discussão
perfil molecular de lncRNAs em 407 tumores
Foi utilizado o GENCODE [17] anotação como nosso principal quadro para investigar padrões de lncRNA copy-número alteração e expressão através de 407 tumores fase-II-IV HGS-OVCA [12]. Descobrimos que o subconjunto GENCODE lncRNA [16], que engloba 10.419 genes lncRNA anotados manualmente (Versão 11, Figura 1A), mostraram um elevado grau de poliadenilação, tal como determinado por sequenciação normal de RNA de tecido (ARN-SEQ) de dados (Figura 1B). Copiar dados de número de matrizes comparativas hibridização genômica (CGH) estava disponível para 486 tumores primários, e a grande maioria dos GENCODE lncRNAs (97%) expectedly residia em regiões abrangidas. A seguir processado um total de 25,7 mil milhões de pares de leitura mapeado-GENCODE de poliA + de ARN-SEQ (em média 63,1 milhões por amostra) para derivar perfis de expressão para todos GENCODE lncRNAs em 407 destes tumores (Figura 1C). Apenas 225 milhões de pares de leitura mapeado para lncRNA loci (em média 553 mil por amostra), enfatizando a necessidade de cobertura de alta sequência de quantificar com precisão lncRNAs
.
A, abundância relativa das categorias de genes na anotação GENCODE 11 (loci única ). B, estado poliadenilação do lncRNAs, determinada por poliA + de ARN total versus-SEQ partir de uma mistura de 16 tecidos. C, expressão lncRNA de perfil utilizando poliA + RNA-seq através de 407 tumores. No total, 25,7 bilhões de pares de leitura mapeados exclusivamente, abrangendo 3 terabases, foram contados em genes GENCODE. A tabela mostra a profundidade sequenciamento per-tumor, com base em todas GENCODE-mapeados lê ou subconjuntos lncRNA. D, Distribuições de lncRNA e os níveis de expressão do gene de codificação (RPKM máxima em todos os tumores). RPKM, leituras por quilobases por milhão lê. E, histogramas de correlações entre o DNA copy-número e nível de RNA (baseado em 407 tumores com dados dupla). Painel esquerdo: lncRNAs globais (painel esquerdo,
n
= 10.066), mostrando correlações mais baixas em comparação com genes que codificam. Painel direito: melhorou correlações quando se considera genes expressos em RPKM 3 (19% superior lncRNAs,
n
= 1920) que também foram amplificados ou excluídos em 15 amostras (painel direito,
n
= 125)
Comparação das normalizado de comprimento (do tipo RPKM [18]) valores de expressão entre codificação e genes lncRNAs confirmou que lncRNAs foram expressos em níveis substancialmente mais baixos (Figura 1D), de acordo com relatórios anteriores de uma ampla variedade de fontes celulares [1 , 16,19]. Enquanto 87% dos genes que codificam mostrou um nível RPKM 1 em, pelo menos, um tumor, apenas 36% de lncRNAs atingiu este nível de expressão. correlações genoma escala entre DNA copy-número amplitude e os níveis de RNA foram menores para lncRNAs em comparação com genes que codificam, mas esta discrepância foi reduzida quando considerando apenas abundantes e freqüentes número de cópias alteradas genes (Figura 1E). A análise complementar com base em matrizes Affymetrix Exon 1.0ST, que pode interrogar um subconjunto de lncRNAs, obtiveram resultados semelhantes (481 amostras, Figura S1 S1 Arquivo).
lncRNAs associados com subtipos de expressão
análise prévia de codificação de expressão gênica em HGS-OVCA identificados quatro subtipos robustos, que foram denominadas ‘imunorreativo’, ‘proliferativa’ ‘diferenciado’ e ‘mesenquimais “com base em seu conteúdo genético [12,20]. Os subtipos foram ainda demonstrado estar associado a alterações específicas genômicos, onde o grupo proliferativa tem uma menor frequência de
MYC
amplificação e
RB1
exclusão, enquanto o grupo imunorreativo tem uma maior frequência de
MECOM
amplificação. Nós aqui testado se os subtipos estabelecidos em HGS-OVCA também têm padrões distintos de expressão lncRNA.
Os tumores com o subtipo disponíveis, dados clínicos e de expressão foram divididos aleatoriamente em dois grupos (
n
= 200 cada ), a retenção de um meio para posterior validação. Foram identificados 455 lncRNAs que foram induzidos ou reprimidos especificamente em um dos quatro subtipos relativamente a amostras restantes (Figura 2A, tal como descrito em Métodos). Estes padrões de expressão foram claramente mantida no conjunto de validação, confirmando que as associações subtipo eram não-aleatório (Figura 2B). Além disso, a expressão do subtipo de um tumor pode ser previsto com base em lncRNAs-associado subtipo, usando um classificador simples (Métodos) na maioria (77%) dos tumores (Figura 2B).
, 455 mostraram um aumento ou lncRNAs expressão reduzida em um dos quatro subtipos de expressão previamente definidos (200 tumores aleatórios, esquerda). Estes lncRNAs mantiveram os seus padrões de expressão do subtipo selectivo em 200 tumores independentes, e o subtipo poderia ali ser previsto com base na sua expressão na precisão de 77% (para a direita). B, A mesma análise com base em um subconjunto lncRNA intergênico (
n
= 152, 73% de precisão, à esquerda). para cima mais próxima e vizinhos codificadores de proteínas a jusante destas lncRNAs (278 genes únicos) não tinham padrões de expressão fortes específicos do subtipo e sua assinatura combinado foi de menos informativa do subtipo (precisão de 51%, à direita).
análise lncRNA pode mostrar fortes correlações positivas com os seus anfitriões de codificação [16] sobreposição antisense, motivando baseado em lncRNAs intergênicas sozinho. Por isso, investigou um subconjunto de 152 lncRNAs com localização intergênico, e encontrou seus padrões de expressão a ser semelhante ao conjunto completo dos dados de validação (Figura 2B, Tabela S1 no arquivo S1, 73% de precisão). Apesar de codificação de genes vizinhos dos 152 lncRNAs ainda estavam moderadamente preditivo do subtipo (51%), que apresentaram padrões consideravelmente mais fracos da expressão específica de subtipo (Figura 2B). Notavelmente, entre lncRNAs intergênicas induzidas no subtipo mesenquimais foram
MIAT
/Gomafu, um alvo conhecido e co-ativador de Oct4, com um papel na pluripotência de células-tronco [21].
NEAT1
e
UCA1
foram reprimidos no subtipo proliferativa:
NEAT1
é essencial para a estrutura de paraspeckles nucleares [22] e foi mostrada para ser regulada positivamente em cancro do ovário [23], enquanto
UCA1
é conhecido um regulador de crescimento de células de carcinoma da bexiga em [24]. Nós, adicionalmente, avaliaram os níveis lncRNA em relação à sobrevida do paciente, mas não encontraram associações reprodutíveis. Os nossos resultados mostram que os subtipos de expressão em HGS-OVCA, originalmente definido com base na expressão do gene de codificação, estão cada um associado com assinaturas de expressão lncRNA distintas, e especula-se que estes lncRNAs poderia contribuir para a reprogramação transcricional ou agir nos circuitos celulares que são alterados em estes tipos de tumores.
lncRNAs em regiões de focal copy-número alteração
genomas do tumor são mosaicos de aberrações cromossómicas, alguns dos quais estão sob seleção para ativar ou desativar oncogenes ou supressores de tumor específico. Em grandes grupos de pacientes, os genes-alvo individuais podem, portanto, ser deduzido através de padrões de recorrência, em particular quando as regiões alteradas são estreitas (focal) [25]. O algoritmo GISTIC, quando aplicado a número de cópias de dados a partir de cancro do ovário TCGA, identificadas várias regiões de cópia-focal número alteração recorrente [12]. Muitos destes abranger genes do cancro bem conhecidos, mas em alguns casos, os alvos permanecem mal definidos. Nossa hipótese é que lncRNAs poderia ser motoristas em alguns desses eventos, e, portanto, exibido regiões focais estreitas para sobreposições com lncRNAs.
Houve 35 estreita (sobrepondo-se, no máximo, 5 genes codificantes) amplificações ou exclusões que foram significativos na uma taxa de falsos descoberta (residual
q
) de 0,05 (Figura 3A, Tabela S2 em S1 Arquivo). Muitos sobreposto com estabelecidas proto-oncogenes, tais como
CCNE1
e
MYC
, eo
RB1
,
NF1
e
PTEN
supressores de tumor, mas lncRNAs também estavam presentes em conjunto com os genes de codificação em vários casos (Figura 3A). Apesar de selecção para a cópia-número alteração nestes loci poderia, em princípio, ser explicada pelo lncRNAs, quer isoladamente ou em combinação com os seus vizinhos de codificação [26], que focada em vez de dois picos focais que careciam de genes codificadores de proteínas: uma amplificação em 1q25 e uma deleção no cromossoma 4q34 (indicado com * na Figura 3A). A região excluída estava em um grande espaço intergênico ~ 1 Mb de
ODZ3
; um gene encontrado recentemente para ser alvo de L1 retrotransposição no cancro colorectal [27] e eliminada no neuroblastoma [28]. Enquanto segmentos excluídos em HGS-OVCA foram claramente separada da
ODZ3
e abrangeu dois genes lncRNA anotado (Figura S2A no arquivo S1), estes não tinham expressão relevante ( 5 mapeados lê em 99% dos tumores) , e que não conseguiu revelar outros candidatos de investigar a cobertura de leitura ARN-seq na região (dados não mostrados). Uma análise mais aprofundada sugeriu que as exclusões poderiam ser indiretamente dirigida a
ODZ3
através da ruptura de DNA regulatório associado (Figura S2B no arquivo S1), e a região não foi ainda caracterizado.
A, lncRNAs e codificação de genes em regiões estreitas de amplificação recorrente ou eliminação identificadas por GISTIC (
q Art 0,05) em 486 tumores HGS-OVCA. contagens gene para 35 picos focais apertados com um máximo de cinco genes que codificam sobreposição são mostrados. genes de câncer conhecidos e metas de codificação inequívocas são indicados. *, Regiões investigadas em maior detalhe. B, Vista detalhada do
ACBD6 Restaurant –
contexto genômico XPR1 e região intergénica (região AXI, linha pontilhada) em um ~ 1 Mb. O pico focal AXI é centrada em
RP11-522D2.1 /Tablet OVAL, um lncRNA descaracterizado em chr1q25. sombreamento vermelho mostra perfis número de cópias para os tumores individuais. C, os tumores ordenados por expressão
OVAL
.
OVAL
ARN (eixo dos y) foi principalmente baixo ou não detectável, mas foi induzida em casos focalmente amplificado (como definido nos Métodos). D: Nem
ACBD6
nem
XPR1
foram nomeadamente induzida pela amplificação focal região AXI.
OVAL
RNA foi baixa também em casos amplamente amplificados. ND, não detectado. E, a densidade de leitura RNA-seq média na região de AXI (linha pontilhada) para tumores com amplificação focal AXI acentuada (
n
= 10) em relação ao restante tumores (contagens de leitura normalizada por 1000 segmento nt). F, a análise mostrou que GSEA determinada experimentalmente P53 genes regulados são induzidos em tumores
OVAL
focally amplificados.
amplificação somática Focal da OVAL lncRNA
A seguir, investigou a 1q25 amplificação, que foi focally ganhou em 16/407 pacientes (3,9%), e centrada em um 128 kb região intergénica entre o
ACBD6 Comprar e genes (doravante região AXI a)
XPR1
. A região AXI carece de genes codificadores de proteínas, mas contém um único gene lncRNA anotada,
RP11-522D2.1
, perto do seu centro (Figura 3B). Este lncRNA, que nós aqui termo
OVAL
(adenocarcinoma de ovário amplificado lncRNA), coincide estreitamente com o pico focal identificada por GISTIC, e está posicionado 55 kb e 65 kb dos vizinhos de codificação de proteínas de codificação mais próximos. Notavelmente, os segmentos cromossômicos amplificados foram muitas vezes pequenos (50-100 kb) e abrangeu a plena
gene OVAL
, enquanto está a ser constrangido a região AXI ou estender apenas parcialmente para os genes vizinhos (Figura 3B).
Uma vez que o padrão de amplificação de DNA focal apontou para
OVAL
como o gene de condução alteração nesta região, o próximo investigado se este foi apoiado pelo padrão de
OVAL expressão
na tumores.
OVAL
expressão era baixa ou ausente em ambos os trompa de Falópio normal (Figura S3 em S1 Arquivo) e, na maioria dos tumores, incluindo a maioria dos casos com amplificação 1T largura. No entanto, a amplificação focal da
OVAL
lócus coincidiu notavelmente com
OVAL
activação da transcrição (Figura 3C).
OVAL
RNA foi, em média, 46 vezes maior nos casos focais em comparação com amostras restantes (
P
= 3.5E-8, Wilcoxon rank sum), e
OVAL
classificou 74 de todos os lncRNAs GENCODE com base na expressão máxima em todos os tumores (Tabela S3 em S1 Arquivo). Resultados semelhantes foram obtidos utilizando dados Exon 1.0ST à base de hibridação (Figura S4 no arquivo S1).
Apesar de amplificação focal região AXI não pareceu alvejar diretamente os genes de codificação de flanco, estes podem ainda ser afetados indiretamente na nível de expressão do gene. Isto seria compatível com as suas sequências regulatórias sendo alteradas, ou
OVAL
ter um
cis
papel regulamentares no controle de sua transcrição. No entanto, nem
ACBD6
nem
XPR1
foram nomeadamente induzida em casos focally amplificados (Figura 3D). Além disso, esses genes não são previamente descrito como alterada no cancro, apoiando ainda que
OVAL
é alvo de forma independente na região intergênica AXI.
Investigação de cobertura leitura RNA-seq na região de AXI revelou que
OVAL
foi o principal lócus expressa em tumores focally amplificadas, enquanto as amostras restantes apresentaram baixa atividade transcricional nesta região (Figura 3E). Embora a transcrição adicional foi observada fora do
OVAL
lugar, principalmente na região a montante (Figura 3E), estes sinais não eram consistentes entre os tumores individuais (Figura S5 em S1 Arquivo). O exame dos dados disponíveis no GenBank revelou apenas algumas sequências de ESTs singulares na região de AXI de distância do centro focal, enquanto
RP11-522D2
.
1 | /
OVAL
foi apoiada por 12 ESTs de splicing e sequências de cDNA 6. Um putativo Y-ARN (prevista a partir de famílias Rfam), perto da borda AXI região 50 kb a partir do pico central, não foi apoiada pela evidência de cDNA /RNA-EST ou SEQ em tumores ou tecidos normais (dados não mostrados). Conclui-se que ambos os perfis de expressão tumor HGS-OVCA e disponíveis cDNA /EST ponto de evidência para
OVAL
como a principal unidade de transcrito de forma estável na região AXI amplificado.
análise de conjunto enriquecimento Gene (GSEA) revelou que os objectivos previamente definidos de P53 (TANG_SENESCENCE_TP53_TARGETS_DN) foram significativamente elevados em
OVAL
tumores amplificados (Figura 3F). Enquanto isso indica que
OVAL
activação pode coincidir com a atividade P53 alterada,
TP53
estado de mutação e níveis de mRNA foram semelhantes em ambos os grupos. Genes que codificam proteínas contráteis relacionados com os músculos (STRUCTURAL_CONSTITUENT_OF_MUSCLE) foram enriquecidas entre aqueles reprimida em
OVAL
tumores amplificados.
Caracterização molecular de OVAL
Tendo estabelecido
OVAL
como um alvo provável na região da AXI, que caracterizado pelo facto adicional deste gene, em termos de estrutura do gene e a expressão tecido normal. O gene de
OVAL
contém três exões anotados que dão origem a um ARN de 1489 nt previsto não codificante, em que o terceiro exão grande contribui maior parte da sequência. Esta estrutura foi confirmada por múltiplas sequências de ARNm GenBank (Figura 4A) e de ESTs splicing, bem como ARN-SEQ partir de linhas celulares, tais como Gm12878 (dados não mostrados). Muitos dos
OVAL
ESTs e mRNAs originado a partir de células de melanoma humano, e a transcrição foi, consequentemente, localizaram em uma tela de bioinformática recente para ESTs públicos específicos de melanoma [29].
OVAL
também foi mapeada em uma pesquisa recente da lncRNAs intergênicas humanos [19], e semelhante à nossa própria análise de dados de RNA-seq tecido normal, este estudo identificou uma primeira isoforma do exão alternativo (Figura 4A) não suportada por os dados de expressão de tumor. Embora os padrões de splicing adicionais possíveis foram observadas nos tumores, estes mostrou fraca expressão e inconsistentes entre as amostras (dados não mostrados).
,
OVAL
locus no cromossoma 1. GenBank mRNAs, transcrição conservada vinculativo fator locais (TFBS) previsto pelo brower UCSC, e outras características são indicadas. B, perfil de expressão tecido normal do
OVAL
(RNA-seq). Coração expressão foi confirmada por PCR de transcrição inversa. PC3, linha celular de cancro da próstata humano; Coração, aurícula do coração; A7, linha de células de melanoma humano C,
OVAL
e os seus vizinhos de codificação têm perfis de expressão diferentes. D, subcelular RNA-seq de 7 reunidas linhas celulares (Gm12878, HelaS3, HepG2, HUVEC, H1hesc, NHEK e K562) mostra localização citoplasmática predominante.
conservação evolutiva, com base num alinhamento múltiplo genómica de mamífero , foi baixa, em geral, mas em regiões específicas do último exão demonstrou elevada conservação (Figura 4A). A base de dados de locais alvo miRcode microARN putativos em lncRNAs [30] revelou um local de miR-30 conservados, presentes na maioria dos mamíferos e primatas, em uma destas manchas. Embora a sequência madura é principalmente não-repetitivo, RepeatMasker [31] identificado LTR THE1A-int e L2b linha derivada elementos, bem como uma possível sequência de snRNA U2 no último exão (Figura 4A). No entanto, encontramos nenhum resultado para snRNAs ou outras estruturas conhecidas na Rfam [32], e
OVAL
é, portanto, pouco provável que funcionar como um precursor para um RNA estrutural clássica.
lncRNAs tenham sido previamente definida a partir das pontuações de frequência de substituição de codão e a falta de uma estrutura de leitura aberta (ORF) maiores que 100 aminoácidos [1]. Além de ser classificadas como não-codificante pelo gasoduto GENCODE, o madura
OVAL
sequência não codificadora foi de acordo com o algoritmo de CPC [33] e utilizando PhyloCSF [34] com base num alinhamento de mamífero. ORF em
OVAL
tudo falta o consenso Kozak e não mais do que 98 aminoácidos são. A análise conjunta recente em tandem massa de dados de espectrometria e sequências GENCODE lncRNA, incluindo
RP11522-D2
.
1 | /
OVAL, identificado apenas um único jogo lncRNA ao excluir misannotated casos, apoiando uma total falta de codificação capacidade para estas transcrições [35]. Importante, nenhuma homologia com qualquer sequência conhecida da proteína foi revelado pela análise BLASTx. A função de codificação, portanto, parece improvável, e concluímos que
OVAL
provavelmente representa um
bona fide
lncRNA.
RNA-seq de tecidos humanos normais mostrou que
OVAL
é expresso selectivamente no músculo cardíaco, o que foi confirmado por PCR de transcrição reversa (Figura 4B). Dois putativo fator-2 conservada miócitos potenciador (MEF2) locais, posicionados perto do exão primeiro (Figura 4A) alternativa, a ligação pode conduzir a expressão no tecido muscular, tanto como células humanas de mioblastos de músculo esquelético (HSMM) músculo do coração e expressar exclusivamente esta alternativa isoforma (dados não mostrados). O
OVAL
padrão de expressão é muito diferente de seus vizinhos de codificação (Figura 4C), e sua localização subcelular foi predominantemente citoplasmática (Figura 4D). Isto fala ainda mais contra um
cis
papel -regulatory em genes próximos, e é consistente com a nossa conclusão de que
OVAL
amplificação não influenciou nomeadamente a sua expressão (Figura 4D). Em resumo,
OVAL
parece ter uma função citoplasmática não-codificante que é independente de seus vizinhos codificadores de proteínas.
amplificação OVAL em carcinomas do endométrio serosa
A seguir, investigou se
OVAL
amplificação é exclusivo para câncer de ovário e considerados perfis número de cópias de 16 cânceres adicionais TCGA, que variam em tamanho de 57 a 825 tumores. Curiosamente, observou-se a amplificação focal de baixa frequência do
OVAL
lócus também no carcinoma endometrióide corpo uterino, enquanto nenhum sinal focal óbvio foi visto nos cancros restantes (Figura S6 em S1 Arquivo). Uma inspeção mais detalhada revelou que o pico focal novamente coincidiu estreitamente com o
OVAL
gene (Figura 5A).
A, amplificação focal de baixa frequência do
OVAL
lócus no câncer endometrial , mas não 16 outros cancros TCGA (veja a Figura S6 em S1 Arquivo). B, 56% dos casos focally amplificados eram do subtipo serosa, em comparação com 21% no total (
P
= 0,025, teste exato de Fisher). C,
OVAL
ARN foi fortemente induzido em um subconjunto de tumores, e isto coincidiu com a amplificação da região focal da AXI. ND, não detectado. D, a densidade de leitura RNA-seq média na região de AXI para tumores com amplificação focal marcado (
n
= 4) em relação ao restante tumores (contagens de leitura normalizada por 1000 segmento nt). E, semelhante ao câncer de ovário, análise GSEA revelou indução de metas de p53 em tumores
OVAL
amplificados.
Uma fração dos tumores do endométrio são classificados como serosa ou serosa-like. Estes têm uma semelhança morfológica perto de sua contraparte ovário [36], e também são geneticamente semelhantes ao câncer de ovário [37]. Consequentemente, observou-se que os tumores do subtipo serosa foram 4 vezes mais susceptíveis de transportar
amplificação focal OVAL
comparação com tumores não-serosa (5/91 vs. 4/331,
P
= 0,025, Figura 5B). Semelhante ao câncer de ovário, amplificação focal da região de AXI foi associada com forte aumento da expressão de
OVAL
(Figura 5C), e cobertura de leitura RNA-seq mostrou que
OVAL
foi a principal unidade transcrita na região (Figura 5D). análise GSEA revelou que os genes P53 regulados determinados experimentalmente foram upregulated em
OVAL
amostras amplificadas, replicando nossos resultados anteriores de câncer de ovário (Figura 5E). Tomados em conjunto, os resultados de câncer ovariano e endometrial sugerem que
OVAL
amplificação é selecionado para especificamente em tumores serosos, independentemente da localização do tumor.
Conclusões
lncRNAs já foram testadas em materiais clínicos utilizando próxima geração seqüenciamento, incluindo um estudo recente de 64 carcinomas e sarcomas usando extremidade 3 ‘sequenciamento [38], e sequenciamento do transcriptoma de 102 tecidos da próstata e linhas celulares [10]. Além disso, foram lncRNAs perfilado em tecidos normais e de cancro com base em 272 bibliotecas SAGE comuns [39]. A presente análise é a primeira a fazer uso de TCGA RNA-seq ao perfil lncRNAs no cancro, e para facilitar a investigação futura fazemos perfis moleculares lncRNA para tumores TCGA disponível em www.larssonlab.org/tcga-lncrnas.
Há apenas evidência limitada para somática focal copy-número de alteração de lncRNAs no cancro, e descreveu casos envolvem lncRNAs que são co-alterados com genes de câncer de codificação proximais. Dois lncRNAs no
LSAMP
locus de supressor de tumor no cromossoma 3q13,
OC285194
e
BC040587
, foram frequentemente focally excluído no osteossarcoma, muitas vezes em conjunto com
LSAMP
[26]. Estes lncRNAs são co-expressos com
LSAMP
, e os três genes são susceptíveis funcionalmente interligadas. O
PVT1
locus no 8q24, o que dá origem a uma variedade de RNAs não-codificantes emendados, é muitas vezes co-amplificados com a vizinha
MYC
oncogene [40,41]. No entanto, com o tempo tornou-se claro que
PVT1
codifica vários microRNAs, e seu papel principal poderia, portanto, ser a de um precursor microRNA [42,43].
No caso de
RP11 /522D2.1 /OVAL
, várias observações independentes nomeie-a como um alvo independente da amplificação do gene somática. Ele está localizado no centro de um segmento amplificado intergénica estreita que carece de outros genes anotados, e o pico focal coincide estreitamente com o gene de
OVAL
. cobertura ARN-SEQ de leitura, bem como ADNc disponíveis e evidência EST, falha a revelar outros candidatos credíveis na região. Focal, mas não ampla, amplificação coincidiu com forte indução de
OVAL
RNA.
OVAL
não foi co-expressa com os seus vizinhos de codificação, nenhum dos quais são previamente associados ao câncer e sendo a mais próxima mais de 50 kb de distância, e
OVAL
amplificação não nomeadamente alterar a sua expressão . Isto, em combinação com uma localização predominantemente citoplasmática, fala contra
OVAL
ter um
cis
papel -regulatory em genes vizinhos. A replicação destes padrões no cancro endometrial seroso reforça a hipótese.
amplificação Focal da região de AXI é relativamente rara (3,9%), e ganhos de amplitude geralmente baixos. No entanto, HGS-OVCA é caracterizado por uma grande diversidade mutacional, com uma relativa falta de alterações individuais de condução freqüentes, ea frequência é comparável a alterações funcionais conhecidos, tais como BRCA1 e BRCA2 mutação somática (3,5% e 3,2%, respectivamente [44]) .