PLOS ONE: Análise integrada de todo Genome Sequencing e transcriptoma revela Aberrações transcriptomic Diversos Conduzido por somáticas Genomic Alterações no fígado Cancers

Abstract

Os estudos recentes que apliquem tecnologias de sequenciamento de alto rendimento identificaram vários genes e vias recorrentemente mutado em múltiplos genomas do câncer. No entanto, as consequências de transcrição dessas alterações genômicas em genoma do câncer permanecem obscuros. Neste estudo, realizamos análises integradas e comparativos de genomas inteiros e transcriptomes de 22 vírus da hepatite B (HBV) relacionados com carcinoma hepatocelular (HCC) e seus controles pareados. A comparação da sequência do genoma completo (WGS) e RNA-Seq revelou evidências de que vários tipos de mutações genómicas desencadeada diversas alterações da transcrição. Não só mutações splice-site, mas também mutações silenciosas em regiões codificantes, mutações intrônicas profundas e as mudanças estruturais causadas aberrações splicing. integrações HBV gerado diversos padrões de transcrições de fusão humana por vírus, dependendo gene afetado, como

TERT,

CDK15

,

FN1

e

MLL4

. variações estruturais podem conduzir a sobre-expressão de genes, tais como ligandos de WNT, com /sem criar fusões de genes. Além disso, tendo em conta as mutações genômicas causando aberrações transcrição, poderíamos melhorar a sensibilidade da detecção de mutações deletérias nos genes motorista câncer conhecido (

TP53, AXIN1, ARID2, RPS6KA3

) e interrupções recorrentes identificadas no driver de câncer putativa genes, tais como

HNF4A

,

CPS1

,

TSC1

e

THRAP3

no HCC. Estes resultados indicam alterações genômicas em genoma do câncer têm diversos efeitos transcriptomic e análise integrada de WGS e RNA-Seq pode facilitar a interpretação de um grande número de alterações genômicas detectadas no genoma do câncer

Citation:. Shiraishi Y, Fujimoto Um, Furuta M, Tanaka H, ​​Chiba Ki, Boroevich KA, et al. (2014) Análise integrada de todo Genome Sequencing e transcriptoma revela Aberrações transcriptomic Diversos Conduzido por somáticas Genomic Alterações de cânceres de fígado. PLoS ONE 9 (12): e114263. doi: 10.1371 /journal.pone.0114263

editor: Chad Creighton, Baylor College of Medicine, Estados Unidos da América

Recebido: 28 de maio de 2014; Aceito: 05 de novembro de 2014; Publicação: 19 de dezembro de 2014

Direitos de autor: © 2014 Shiraishi et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Data Availability:. O autores confirmam que todos os dados subjacentes às conclusões estão totalmente disponíveis sem restrições. dados de mutação somática foi depositada no banco de dados ICGC (https://dcc.icgc.org/), que está livremente disponível. arquivos de sequência de dados brutos de WGS e RNA-Seq tenham sido depositados na Genome-Phenome Arquivo Europeia sob o código adesão EGAD00001001035, e seu acesso é controlado por ICGC DACO

Financiamento:. O financiamento para este trabalho veio do RIKEN do presidente do Fundo 2011, o Fundo princesa Takamatsu Cancer Research, Takeda Science Foundation, o Grand-in Aid para a Investigação científica em áreas inovadoras (Integrative Sistemas compreensão do câncer de Diagnóstico Avançado, Terapia e Prevenção) e Grant-in-Aid para Jovens cientistas ( B) 24700272. os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

Conflito de interesses:.. os autores declararam que não existem interesses conflitantes

Introdução

Cada ano, mais de meio milhão de pessoas no mundo são diagnosticadas com carcinoma hepatocelular (HCC), o quinto e sétimo tipo de câncer mais comum em homens e mulheres, respectivamente [1]. Na maioria dos casos, HCCs desenvolver-se após hepatite ou cirrose causada pelo vírus da hepatite B (VHB), infecção vírus da hepatite C, alcoolismo ou doenças metabólicas, dos quais HBV é o mais importante fator, especialmente no Sudeste da Ásia e sub-Sahariana África [1]. Embora várias alternâncias genéticas têm sido detectados em HCC, tais como mutações de

TP53

e

CTNNB1

que codifica β-catenina [2], é necessária caracterização mais detalhada do genoma do cancro do fígado para a identificação de biomarcadores para a medicina personalizada e desenvolvimento terapêutico mais eficaz de drogas.

os recentes avanços em tecnologias de sequenciamento de alto rendimento nos permitir a detecção abrangente de mutações somáticas em genomas do câncer [3] e o sequenciamento de alto rendimento de genomas HCC revelou vários novela genes motorista câncer, como os reguladores de cromatina [4], [5] e integrações vírus recorrentes no

TERT

e

MLL4

loci [4], [6] – [8]. estudos genômicos atuais centram-se principalmente sobre mutações em regiões codificantes, e outros tipos de mutações tais como substituição das bases ou indels em regiões não codificantes, e as variações estruturais (SVS) são geralmente ignoradas, uma vez que o seu impacto no desenvolvimento do câncer é difícil de avaliar e interpretar tão longe. Uma abordagem para avaliar a deleteriousness destas mutações é verificar as consequências da transcrição dessas alterações genômicas. Para este efeito, o entendimento mais amplas das relações entre mutações genómicas e aberrações transcricional do genoma do cancro são necessárias. Vários exemplos de aberrações splicing [9], [10] e de genes fusões [11] causadas por mutações genômicas são conhecidos, e estudos utilizando dados recentes de sequenciamento de alto rendimento aberrações de transcrição específicos do cancro identificados em vários tipos de câncer [12], [13 ]. No entanto, ainda existem poucos estudos que comparam sistematicamente mutações genômicas e aberrações transcrição de sequenciamento do genoma inteiro (WGS) e sequenciamento do transcriptoma dados (RNA-Seq). Como tal, ainda temos pouco conhecimento sobre a paisagem do transcriptoma câncer e suas relações com mutações somáticas.

Anteriormente, sequenciado e analisado WGS de 27 diversos tipos de cânceres de fígado [4], mas os efeitos da grande parte de diversas mutações somáticas, incluindo mutações e SVs não-codificantes, dificilmente eram interpretar usando apenas os dados WGS. Portanto, no presente estudo, foi adicionado mais WGS e os seus dados de RNA-Seq correspondentes, totalmente a partir de 22 amostras de HCC-HBV relacionados, para determinar as alterações genéticas em conjunto com a sua consequência da transcrição. e realizamos análises comparativas e integrados de seus WGS e dados de RNA-Seq (ver Fig. 1A para a visão geral do estudo). Primeiro, identificamos uma variedade de eventos genómicas somáticas, incluindo mutações pontuais, indels curtas, SVs e integrações de HBV a partir de dados WGS. Então, depois de caracterizar sistematicamente aberrações transcriptomic específicos do cancro, tais como vários tipos de alterações splicing (falha de exão, emenda local desliza, inclusões pseudo-exão e retenções intron, ver Fig. 1B), fusões de genes incluindo as sequências de HBV que envolvem, ao longo eventos -expression e alterações de nucleótidos a nível RNA, investigou relações entre alterações genômicas e transcriptomic detectados. Finalmente, fornecendo um perfil de mutações genômicas e aberrações de transcrição, discutimos os benefícios da análise integrada de WGS e WTS para detecção sensível de genes motorista câncer.

(A) Em primeiro lugar, foram detectados vários tipos de genômica e transcriptomic alterações a partir de dados de RNA-Seq de 22 HCC. As mudanças caracterizadas detectadas por cada análise foram comparados para revelar os efeitos das alterações genómicas somáticas sobre aberrações transcriptomic. (B) Os quatro tipos de aberrações splicing definidos neste estudo. linhas verdes e setas indicam a transcrição normal, enquanto que as linhas vermelhas e setas indicam transcrições aberrantes.

Resultados

eventos somáticos detectados pelo WGS

Nós extraído DNA de 22 HBV congelada relacionados com fragmentos de CCH e seus linfócitos normais correspondentes, e sequenciaram todo seus genomas por sequenciamento paralelo em massa. informação clínica e patológica é mostrada na Tabela S1 no arquivo S1. profundidade média sequenciamento do (linfócitos) genomas do câncer e controle foram de 36,8 × e 29.9x, respectivamente, após a remoção das duplicações de PCR (Tabela S2 no arquivo S1). No total, 209,055 (3,597-19,063) substituições somáticas foram detectadas (Tabela S4 no arquivo S1). Entre eles, 1.096 missense, 32 absurdo e 35 mutações emenda do local em regiões codificantes de proteínas, foram identificados, onde mutações emenda do local foram definidos como sendo aqueles que afectam os sítios aceitadores de splicing e doadores localizados nos primeiros e últimos dois bases de um intrão sequência (splicing-sites essenciais). Dos 5.725 indels identificados em todo o genoma, 105 estavam localizados em regiões codificantes de proteínas e 6 afetada emenda-sites essenciais. Os genes motorista inferidos em ordem de significância estatística de recorrência foram

TP53

,

ARID2

,

BRD7

,

HNF4A

e

RPS6KA3

(

P

-valor 0,001, Tabela S5 em Arquivo S1). Além disso, 2,254 VV (15-577 por tumor) foram detectados, de 1168, que afectada genes codificadores de proteínas anotado. Além disso, 86 (0-12 por tumor) integrações HBV foram identificados com 2 e 5 integrações recorrentes no

TERT

e

MLL4

loci, respectivamente, o que é consistente com estudos anteriores [4] [6], [7], [8].

aberrações emenda relacionadas com mutações genômicas

total de RNAs extraídos dos congelados 22 HCCs e seus tecidos do fígado não-cancerosas adjacentes foram objecto de RNA-Seq, e a sua síntese é mostrado na Tabela S3 no ficheiro S1.

primeiro, foi investigado o estado de transcritos de cerca de mutações de splice site-essenciais, verificando manualmente os alinhamentos da sequência lê. Após a exclusão de transcrições sem expressão, observamos aberrações splicing simples ou múltiplos de 19 dos restantes 24 mutações splice site-essenciais (3 emenda local desliza, 6 salta de exão e 13 retenções intron, Figura S1 no arquivo S2, Tabela S6 no ficheiro S1), o que indica que as mutações somáticas a splice-site essencial mostrou fortes efeitos sobre a aberrações de splicing como esperado. genes afectados incluídos recorrentemente mutado genes de análise WGS (

TP53, ARID2, HNF4A

e

RPS6KA3

), bem como

AXIN1

.

A fim de obter uma lista abrangente de aberrações splicing específicos do cancro, nós sistematicamente detectados quatro tipos de aberrações splicing (deslizamento emenda local, pule exão, de inclusão pseudo-exão e retenção de intron, Fig. 1B), utilizando algoritmos desenvolvidos internamente (ver Materiais e Métodos ). No geral, 292 aberrações splicing eventos (26 tala local deslizamentos, 41 saltos de exão, 77 inclusões pseudo-exão e 148 retenções intron) foram detectadas (Tabela S7 no arquivo S1). Desde que realizada não direcional RNA-Seq, discriminando entre retenção de intron e transcrição antisense específico para o cancro era difícil, e, portanto, os resultados das retenções intron devem ser interpretados com cautela. Esta lista inclui eventos aberração correspondentes aos 10 splicing-sites essenciais investigados acima. PCR e seqüenciamento Sanger validados 154 eventos de splicing altamente específicos do cancro fora do 239 detectado. Para 72 eventos, que confirmou aberrações splicing alvo para ambos câncer e tecidos do fígado não-cancerosas.

Além de mutações splice site-essenciais, foram identificados vários tipos de mutações e indels curtas que parecem ser as causas diretas das aberrações splicing observados, através da alteração das distâncias de edição de doador de splicing ou motivos aceitador. Três mutações perto de junções exão-intrão ( 10 pb), mas não no local de splice-essencial causou aberrações splicing (Fig 2A, B, e C.). Três mutações em regiões codificantes, o que provavelmente gerados novos motivos de splice dador local, causada splice-site de enxertos (Fig. 2D, E, e F). Uma mutação que afeta o

LAMB2

gene era sinônimo. Dois pseudo-exão evento inclusão afetando

THRAP3

e

TSC1

parecia ser desencadeada por mutações somáticas no fundo de íntrons proximal para o novo ponto de junção splicing (Fig. 2G e H). Além disso, sete salta de exão, cujos genes afectados incluídos vários genes supressores de tumor, tais como

IQGAP2

,

ST7

e

TP53

, tinha longos exclusões entre os pontos de junção (Fig. 2I, J, e K). Além disso, oito retenções intrão tinha rearranjos dentro dos intrões correspondentes, por exemplo,

RB1 ​​

(Fig. 2D). Eles indicam que vários tipos de aberrações splicing são frequentemente accionado por não apenas as mutações de splice site-essencial, mas também mutações em regiões, incluindo mutações silenciosas sinónimas, mutações intrónicas profundas, e VV codificação. Por outro lado, uma grande parte das aberrações splicing (239/292 = 81,8%) não tinham mutações proximais (dentro de 1 kb) ou SVS (dentro de 500 kb). Alguns destes são provavelmente parecia ser causado por alterações epigenéticas [14], ou mudanças Expressional em transcritos anti-sentido como descrito acima.

exônico e sequências intrônicas são designados por letras maiúsculas e minúsculas, respectivamente. sequências vermelhas são mutações somáticas no HCC. números verdes no lado de sequências de azul e são editar distâncias motivo splicing dador (AG | GTRAGT, [38]) e motivo receptor de splicing (YYYYNCAG | G), respectivamente. A maioria das mutações somáticas mudou a distância de edição para motivos splicing doadores para que a alteração correspondente pode ser melhorada.

transcrições de fusão relacionados com SVs genômicas

Para detectar fusões de genes com transcrições não anotadas e /ou sequências virais, tais como HBV, utilizou-se Genomon-fusão (ver Materiais e Métodos). Detectamos 245 candidatos de transcrições de fusão homem-humanos e 192 fusões de genes após a remoção de variantes redundantes splicing (Figura S2 em Arquivo S2 e Tabela S8 em Arquivo S1), 66 dos quais envolvidos transcritos sem anotação gene (genes UCSC conhecidos, RefSeq, Ensemble) e 21 dos quais eram transcrições de fusão un-emendado que compartilham os pontos de interrupção com a sua SVs genômicos (Figura S3 no arquivo S2) correspondente. RT-PCR seguido de seqüenciamento Sanger validados 113 (71,9%) de 157 transcrições de fusão.

Através da comparação com dados WGS, 83 fusões de genes foram encontrados para ser apoiado por SVs somáticas nos locais genómicos correspondentes (Figura S4 em ficheiro S2). Enquanto alguns de fusões de genes sem SVs correspondentes observadas podem ser atribuídas a qualquer falsos positivos para fusões de genes em análise de RNA-Seq ou falsos negativos para SVs em análise WGS, os rácios de valores de transcrições de fusão de expressão implica a existência de pequenas sub-clones com indetectável Associated SVs (Figura S5 em Arquivo S2). Nós também detectou 147 fusões de genes em tecidos não-tumorais do fígado (Tabela S9 em Arquivo S1), muitos dos quais envolvidos genes com valores de expressão extremamente elevados em tecidos do fígado, tais como

ALB

,

HP

e

TF

, sugerindo que as transcrições de fusão detectados também pode ter se originado a partir de SVs abrigaram dentro das células hepáticas sub-clonal menores (Figura S5 em Arquivo S2).

Entre eles,

NBEAP1

(

BCL-8

) transcrições de fusão foram recorrentemente detectado e validado em duas HCC, com sobre-expressão específica para ambas as amostras (Fig. 3 e Figura S6 no arquivo S2). Rearranjos envolvendo o

BCL-8

lócus com expressão sobre-foram relatados para ocorrer em cerca de 4% de linfoma de grandes células difuso [15]. Muitos transcrições de fusão que afetam genes modificação cromatina da via (

CC4

,

CTCF

,

KDM4C

e

HDAC4

) foram detectados, e de fusão transcrições com tumor conhecido genes supressores (

TSC1

e

Sufu

), um componente do fundamental modulador NF-kB (

IKBKB

), e um praticante chave da via WNT sinalização (

TCF7L1

) também foram validados [16]. Embora não específica sobre-expressão resultou destas fusões de genes, especula-se vários deles têm uma natureza por perda de função que a perda dos domínios fisiologicamente importantes (Figura S7 em Ficheiro S2).

Blue e as barras vermelhas mostram as FKPMs para HCC e do fígado não-canceroso correspondente, respectivamente, a qual é calculada por dados de RNA-Seq. Os círculos vermelhos indicam amostras com integrações HBV no loci dos genes sobre-expressos. círculos verdes indicam aqueles com fusões de genes e /ou SVs que podem conduzir gene sobre-expressão.

integração HBV e seus efeitos sobre a transcrição

No geral, as fusões 33 HBV-humanos foram detectados , incluindo aquelas que afetam

TERT

(2 amostras) e locais de

MLL4

(5 amostras) e WGS poderiam identificar associados HBV de integração para 23 destes 33 fusões (Tabela S10 no arquivo S1). integrações HBV com fusões de genes associados tendem a ter pontos de interrupção concentradas em torno do locus de genes HBX (1770 bp-1830 pb) no sentido positivo (Figura S8 no arquivo S2), conforme relatado anteriormente [8].

Curiosamente , 7 discreta VHB

-terc

transcrições de fusão foram detectados numa amostra (RK010), o qual pareceu ser derivado de um local de integração de HBV (Fig. 4A). 4 dos 7 variantes são para ser inferidos em grelha. RK166 teve integração HBV pouco antes de os locais de início da transcrição de

TERT

, o que gerou a plena

TERT

transcrição diretamente ligado à sequência de HBV (Figura S9 em Arquivo S2). Ambas as amostras apresentaram uma expressão mais marcada do

TERT

em comparação com outras amostras (Fig. 3). A HBV

-CDK15

fusão de genes detectados em RK050 também teve várias transcrições de fusão, incluindo uma fusão em grelha que causaram

CDK15

sobre-expressão (Figura S10 no arquivo S2). Os pontos de interrupção de transcrições de fusão HBV-humana emendados foram concentrados no genoma HBV coordenada 458bp. Chamamos a esta posição do HBV emenda de fusão hotspot.

(A) Sete

HBV-terc

transcrições de fusão foram detectados em RK010. Uma transcrição foi um transcrito ligado-un tendo o mesmo ponto de interrupção como o ponto de interrupção integração genômica. Os outros existiram em formas de splicing e splicing motivos GT-AG foram observados nos pontos de interrupção de todos, mas um. Além de HBV hotspot emenda de fusão (458 pb), 3 transcrições de fusão foram emendados na coordenada de 1634 bp coordenadas em sequências de HBV. Um transcrito de fusão inclui uma sequência de 87 pb pseudo-exão recém-gerada, bem como sequências de subsequências exónicos. (B) integrações HBV no

MLL4

loci e suas transcrições de fusão resultantes em cinco amostras. triângulos verdes na sequência do genoma mostram os locais de integração HBV. A maioria dos transcritos de fusão partilhada com os pontos de interrupção de integração genómico de HBV coordenadas de ambos os lados, e, assim, eles parecem existir em formas spliced-un. As transcrições de fusão para RK141 e RK159 foram validados para ser concatenadas (Figura S11). (C)

HBV-FN1

transcrições de fusão para 7 amostras de fígado não-cancerosas adjacentes. Quase todas as transcrições de fusão tinha o ponto de interrupção no hotspot HBV fusion splicing. As outras transcrições de fusão que tinham pontos de interrupção em regiões intrônicas parecem ser transcritos un-emendados em torno dos locais de integração.

Por outro lado, fusões de genes envolvendo

MLL4

mostrou padrões diferentes. Embora a maior parte do gene de fusão observado continha HBV na extremidade 5 ‘, foram detectados dois tipos de HBV

MLL4

fusões de genes: aqueles com HBV no lado 5′ e aqueles com HBV no lado 3 ‘(Fig. 4B). PCR com subsequente sequenciamento Sanger validado que estes eram partes de transcrições de fusão unspliced ​​concatenados de

MLL4-

HBV

-MLL4

para, pelo menos, duas amostras (Figura S11 no arquivo S2). Não há evidência de splicing foi obtido para estas transcrições de fusão com exceção de um em RK141. Embora ligeiramente maior expressão de

MLL4

foi observada em amostras de CHC, estes out-of-frame HBV

-MLL4

transcrições de fusão sugerem que as integrações HBV no

MLL4

loci pode levar à perda de função.

em tecidos do fígado não-cancerosas, 161 transcrições de fusão HBV-humano foram detectados (Figura S12 no arquivo S2 e Tabela S11 no arquivo S1). Notavelmente, VHB

FN1

fusões de genes foram recorrentemente observada em 7 tecidos do fígado não-cancerosas, ea maioria deles tinha múltiplos splicing variantes incluindo transcrições de fusão em-frame com o hotspot HBV fusion splicing como no VHB

TERT

fusão (Fig. 4C).

Over-expressão causada por SVs somática

Há vários exemplos documentados de SVs cromossômicas que conduzem a expressão ectópica de oncogenes jusante com e sem a formação de fusões de genes [11]. Aqui, nós examinamos as relações entre VV somáticas e a sobre-expressão de genes adjacentes aos pontos de interrupção. Através da aplicação iterativa do teste de Grubbs-Smirnov, foi identificado 3.735 a sobre-expressão em eventos 3017 genes em 22 HCC relacionado com HBV. A lista de eventos sobre-expressão incluída

TERT

e

CDK15

sobre-expressão impulsionado pela integração HBV. SVs proximais e integrações HBV (dentro de regiões de genes ou 500 kb a montante dos locais de início da transcrição) pode estar associada com 63 e 5 sobre-expressão eventos, respectivamente (Tabela S12 no arquivo S1). Desses pontos de interrupção, 44 ​​eventos ocorreram dentro das regiões promotoras, sugerindo mecanismos de sobre-expressão diferente de fusões de genes são fenômenos comuns. Embora seja difícil para confirmar cada observada sobre-expressão evento é realmente a consequência da SVS identificados, a significância estatística pelo teste de permutação (

P

-valor 0,0001, Figura S13 no arquivo S2) indica muitos sobre- eventos que expressam poderia ser conduzido por VV somáticas.

Curiosamente, a sobre-expressão eventos de ligantes WNT foram recorrentemente observada em dois HCC. Sobre-expressão de

Wnt1

e

SVs Wnt10b

(Fig. 3) em RK107 tinha associado. Embora envolvendo um gene de fusão

Wnt10b

foi observada, isso não parece ser a causa directa de sobre-expressão, porque

Wnt10b

foi o lado de entrada das transcrições de fusão (Figura S14 no arquivo S2) . Para

Wnt3a

superexpressão em RK010 (Fig. 3), foram detectados transcritos de fusão envolvendo

Wnt3a

e alguns apoiando ler pares para eles em dados WGS, sugerindo rearranjos complexos ao redor do

Wnt3a

local pode conduzir a sua sobre-expressão. Além disso, a sobre-expressão de

C-KIT

com SV associado pode ser detectada em RK092 (Fig. 3). Os resultados acima indicam que SVs pode desempenhar um papel importante na sobre-expressão de oncogenes e genes alvo molecular.

detecção Complementar de mutações somáticas e eventos de edição de RNA específicos do cancro

Nós investigamos o cancro SNVS espec�icos (variante de nucleotídeo único) e indels curtas nos dados de RNA-Seq usando o algoritmo EBCall [17], e detectou 6.024 candidatos nos níveis de ARN, incluindo 1.205 mutações nonsynonymous ou emenda do local. Entre eles, a análise WGS integrado com os dados de ARN-SEQ (ver Materiais e Métodos) indicou evidências de 1.912 mutações somáticas (545 nonsynonymous ou splicing-sites). Existe uma certa correlação de nível entre as freqüências alélicas de mutações somáticas encontrado para ser altamente confiante em WGS e RNA-Seq (eficiência de correlação = 0,466,

P-

value = 2.2 × 10

-16 por Pearson de correlação produto-momento, a Figura S15 no ficheiro S2), mas a quantidade de correlação não é muito forte. Isso pode ser porque as mudanças de processos pós-transcricional, tais como non-sense medicado deterioração ou estabilização mRNA trazida por mutações somáticas. Destes, 417 (112 nonsynonymous ou emenda-sites) não foram chamados como mutações somáticas em análise WGS inicial sem considerar os dados de RNA-Seq, incluindo vários genes driver conhecido como

CTNNB1

e

TSC2

. Muitas das mutações somáticas detectados por esta análise integrativa foram confirmadas por sequenciação de Sanger de ADN de cancro (74/83 = 89,1%), e algumas das mutações não confirmados pode ser inferior ao limite de detecção de Sanger de sequenciação, devido à sua proporção de baixo clonal. Portanto, algumas das mutações somáticas falso-negativos resultantes da baixa cobertura sequenciamento na análise WGS pode ser resgatado por análise de RNA-Seq complementar.

Finalmente, sem nenhuma evidência de apoio variante lê em nenhum tumor nem WGS normais dados, identificamos eventos específicos do RNA 464 cancerosas que são candidatos à RNA de edição [18]. Embora seja difícil para confirmar a autenticidade de cada evento de edição, o perfil mutação era abundante em A: T G: padrões C e ocorreu em regiões 3 ‘UTR, indicando que muitos deles são susceptíveis de ser causada por meio de RNA-edição por Adars (adenosina deaminase) na fase pós-transcrição [18] (Fig. 5A). O número de candidatos eventos de edição de RNA variaram amplamente entre as amostras. Encontramos uma correlação significativa (

P

-valor = 2,38 × 10

-7 por Wilcoxon rank sum) entre o número de A: T G: eventos C e

ADAR

os níveis de expressão (Fig. 5B), o que implica a existência de novos subtipos de câncer de determinados pela quantidade de RNA de edição somática.

(a) o número de eventos de mutação ARN específico de câncer (candidatos edição RNA) ea sua padrões de substituição para cada amostra. (B) Gráfico de dispersão entre o número de A: T G: C eventos de edição de RNA e

ADAR

valor da expressão (FKPM) calculado pela seqüência de dados de transcriptoma inteiras. Há uma correlação significativa (

P

-valor = 2,38 × 10

-7 por Wilcoxon rank sum) entre o número de A: T G: eventos C e

ADAR

os níveis de expressão.

Paisagem de interrupções genômicas e transcriptomic em HCC relacionado com o HBV

Considerando o fato de que muitas aberrações transcriptomic são causadas por alterações genômicas, a detecção de alterações transcriptomic, tais como aberrações splicing e transcrições de fusão, levanta elevada probabilidade de existência de alterações genômicas proximais. Sob este aspecto, pela utilização complementar de ARN-Seq para análise WGS, salvado que mais de 64 combinações de mutações genómicas e aberrações transcricionais associadas (ver Materiais e Métodos). No total, foram detectados 252 mutações genômicas causando aberrações de transcrição (GMTAs).

Através desta análise integrada de WGS e RNA-Seq, poderíamos obter perfis abrangentes de alterações genômicas e transcriptomic tais como mutações pontuais, indels, estrutural variações, aberrações splicing e fusões de genes para cada gene afetado. Aqui, um problema crítico é discriminar os motoristas cancerosas de meros eventos de passageiros usando esses perfis. Na verdade, embora SVs recorrentes ( = 3 HCC) foram observados em 12 genes (

C10orf11

,

CIT

,

CLTC

,

CNTNAP2

,

DSCAML1

,

EYS

,

FHIT

,

GRANDE

,

LRP1B

,

MACROD2

,

MAGI3

,

TTC28

), muitos deles estão localizados sobre ou muito proximal a regiões frágeis comuns [19] e, na verdade, não foram encontrados para ter qualquer influência sobre a transcrição (Figura S16A no arquivo S2) , implicando a maioria deles são SVs passageiros que ocorreram em regiões genômicas instáveis. A fim de remover eventos de passageiros, são apenas considerados SVs evidenciada por aberrações de transcrição associados, que também é útil para a remoção de detecções de falsos positivos na análise WGS. Por outro lado, fusões de genes recorrente ( = 3 HCC) foram identificados em 6 genes (

ALB, CES1, FGA, SEPP1, SERPINA1,

e

TF

). análise WGS não detectou qualquer SV associada a estas fusões (Figura S16B em Arquivo S2), o que implica que estas fusões parecem vir de células sub-clonal menores ou artefatos, e não podem ser forças motrizes para a expansão clonal das células cancerosas. Estas observações também suportam a importância de combinações de aberrações de transcrição e mutações genômicas associadas.

Nesta análise WGS descobrimos que GMTAs concentraram-se em genes mutados significativamente (três em

TP53

, dois em

HNF4A

e

RPS6KA3

, um em

ARID2

), indicando sua implicação na patogénese do cancro (Fig. 6). Entre as oito GMTAs acima, quatro eram VV e não poderia ser detectado por sola investigação das regiões codificantes, o que sugere que a combinação de WGS e análise de RNA-Seq é eficaz para detectar genes candidatos condutor. Assim,

HNF4A

é provável que seja um novo gene driver para o cancro do fígado, bem como

ARID2

[4] e

RPS6KA3

[20].

HNF4A

desempenha um papel crítico na regulação de várias vias metabólicas no fígado, bem como a diferenciação dos hepatócitos, e a sub-regulação de

HNF4A

tem sido mostrado para ser associado com HCC [21] , [22]. Além disso, genes chave na via WNT sinalização (

APC, AXIN1, CTNNB1, TCF7L1, TCF7L2 Comprar e ligantes WNT) foram frequentemente mutado (11 mutações) em nove HCC, seis dos quais afectados suas consequências transcrição como GMTAs.

A lista de genes foram extraídos por (1) os genes mutados de forma significativa em análise WGS, (2) possuindo não menos do que três mutações (mutações pontuais ou indels nas regiões de codificação, ou GMTAs), (3) não tendo menos de 2 GMTAs e registrado no censo gene do câncer [17]. (4) envolvidas na via de sinalização WNT, (5)

TERT

ou

MLL4

.

Discussões

Através da análise comparativa e integradora de WGS e RNA-Seq, obtivemos uma série de provas de que mutações genômicas, incluindo mutações não-codificantes, SVs e integrações de vírus, pode causar diversas aberrações transcriptomic, tais como mudanças de emenda, fusões de genes e sobre-expressões. Apesar de muitas evidências de que mutações sinónimo silenciosas em regiões e mutações intrônicas profundas codificação levar a doenças graves por perturbar a transcrição [23] – [25], eles são muitas vezes ignorados em estudos atuais de sequenciamento do genoma do câncer, eo mesmo vale para SVs. Portanto, a realização de RNA-Seq combinado com WGS é essencial para interpretar as consequências das alterações somáticas, incluindo aqueles em regiões e SVs não-codificante em genomas do câncer. Além disso, usando WGS e RNA-Seq complementar, que resgatou não só uma série de mutações somáticas adicionais, mas também aberrações splicing causadas por mutações genômicas, que foram pouco não os critérios para ser chamado por uma única análise.

no genoma do câncer de fígado, integrações HBV foram frequentemente observada como um dos SVs e neste estudo observou-se que as integrações HBV causou diversas alterações transcrptic tais como fusões humana pelo vírus. Curiosamente, também observamos recorrente VHB

FN1

eventos de fusão em tecidos do fígado não-cancerosas. Embora os estudos anteriores indicaram também que as integrações HBV no

FN1

loci pode ser específico para tecidos do fígado não-cancerosas adjacentes ao nível do genoma transcrições de fusão resultantes [6], [7], eles não detectados. A frequência de VHB

FN1

fusão no presente estudo (31,8% = 7/22) foi muito maior do que os de estudos anteriores (5,6% (= 5/88) [6] e 10,0% (= 4/40) [7]). Este principalmente parece ser porque integrações HBV no

FN1

lócus são muitas vezes abrigavam em populações sub-clonal menores nas células do fígado não-cancerosas, que muitas vezes não atendidas pelo sequenciamento do genoma de baixa profundidade. No entanto, a análise de RNA-Seq permite a previsão mais sensível de eventos de integração HBV sub-clonal quando eles geram uma grande quantidade suficiente de transcritos aberrantes. Paradoxalmente, o fato de que as integrações HBV no

FN1

loci não ocorre em amostras de tumores implica que

FN1

simplesmente não é propenso a integrações HBV aleatórios; VHB

FN1

transcrições de fusão podem desempenhar um papel importante na fibrose do fígado ou cirrose, ou podem melhorar o desenvolvimento do câncer de células próximas para aqueles com VHB

FN1

fusões.

Deixe uma resposta