PLOS ONE: Identificação de variantes em primários e recorrentes Glioblastoma Usando um Painel de Câncer Gene-Specific e Whole exome Sequencing

Abstract

O glioblastoma (GBM) é, um tumor cerebral maligno agressivo normalmente resultando em morte do paciente dentro de um ano após o diagnóstico; e aqueles que sobrevivem além deste ponto apresentam geralmente com recorrência do tumor num prazo de dois anos (sobrevida de 5 anos é de 5%). A heterogeneidade genética de GBM fez a caracterização molecular destes tumores uma área de grande interesse e levou à identificação de subtipos moleculares em GBM. A disponibilidade de plataformas de sequenciamento que são rápida e econômica pode promover a adoção de sequenciamento tumor no ambiente clínico, levando potencialmente a identificação de alvos genéticos clinicamente acionáveis. Neste estudo piloto, composta por tripletos de amostras de sangue normal, tumor primário, e amostras de tumores recorrentes de pacientes três; nós comparamos a capacidade de toda Illumina seqüenciamento exome (ExomeSeq) eo AmpliSeq Painel Comprehensive Cancer Ion (CCP) para identificar variantes somáticas em amostras de tumores primários e recorrentes emparelhado-paciente. Treze genes foram encontrados para abrigar variantes, a maioria dos quais eram exclusivas aos dados ExomeSeq. Surpreendentemente, apenas duas variantes foram identificados por ambas as plataformas e eles foram localizados dentro do

PTCH1 Comprar e

NF1

genes. Embora de caráter preliminar, este trabalho destaca as principais diferenças na identificação variante em dados gerados a partir das duas plataformas. São necessários estudos adicionais com tamanhos de amostras maiores para explorar ainda mais as diferenças entre essas tecnologias e para melhorar a nossa compreensão da utilidade clínica de plataformas baseadas em painel no perfil genômico de tumores cerebrais

Citation:. Virk SM, Gibson RM, Quinones-Mateu ME, Barnholtz-Sloan JS (2015) Identificação de variantes em primários e recorrentes Glioblastoma Usando um Painel de Câncer Gene-Specific e Whole exome Sequencing. PLoS ONE 10 (5): e0124178. doi: 10.1371 /journal.pone.0124178

Editor do Academic: Javier S. Castresana, da Universidade de Navarra, Espanha

Recebido: 07 de fevereiro de 2015; Aceito: 19 de fevereiro de 2015; Publicado em: 07 de maio de 2015

Direitos de autor: © 2015 Virk et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Data Availability: Illumina toda exome dados de sequenciamento está disponível a partir de The Cancer Genome Atlas: https://tcga-data.nci.nih.gov/tcga. IDs TCGA utilizados nesta análise foram: TCGA-0957 (UH1), TCGA-1389 (UH2), TCGA-4065 (UH3). Para garantir a adesão às diretrizes para a proteção de dados derivados dos seres humanos, os dados Ion AmpliSeq está disponível a partir dos autores, a pedido e do chefe da equipa de Doenças Ohio Brain Tumor Neuro-oncologia Dr. Andrew Sloan: [email protected] .

Financiamento:. Este trabalho foi financiado pelo National Institutes of Health (www.nih.gov) 5R25CA094186 SMV, National Institutes of Health HHSN261201000057C e NIH /NCI 2P30 CA043703-23 ​​ICC

Conflito de interesses: os autores declararam que não existem interesses conflitantes

Introdução

o glioblastoma (GBM) é o tumor cerebral primário mais frequente em adultos [1].. Apesar de ser considerado um câncer raro, com uma taxa de incidência de 2 a 3 casos por 100.000 pessoas nos Estados Unidos, este tumor contribui desproporcionalmente para a morbidade e mortalidade por câncer [1, 2]. A terapia padrão para pacientes GBM actual é a ressecção cirúrgica do tumor primário seguido de radioterapia e quimioterapia adjuvante (isto é, “Stupp” Protocolo) [3]; No entanto, apesar do tratamento agressivo, GBM recorrente em muitos pacientes no prazo de dois anos [4]. Devido a esta elevada probabilidade de recorrência, é imperativo que se obtém uma melhor compreensão das alterações genéticas e moleculares que ocorrem após a ressecção do tumor primário e de tratamento. Esta informação pode ser vital para o desenvolvimento de novos tratamentos com potencial para aumentar a sobrevida de pacientes com GBM.

As diferenças genéticas entre tumores primários e recorrentes ainda não foram totalmente caracterizados, que têm limitado o desenvolvimento de eficazes alvo terapias para combater a recorrente GBM [5]. Mutações em genes específicos têm sido mostrados para ser predominante em casos GBM [6, 7]. Devido à conhecida heterogeneidade indivíduo inter e intra no GBM [8, 9], um esforço considerável tem sido feito para não só identificar os genes mutados individualmente, mas para desenvolver esquemas de classificação para caracterizar os tumores pelo subtipo molecular [10, 11]. O objetivo final é usar a classificação tumor como uma ferramenta de diagnóstico molecular ou um indicador prognóstico de sobrevida global, em última análise, levando à descoberta de novas estratégias de tratamento.

Deep (próxima geração) sequenciamento está revolucionando nosso entendimento das alterações somáticas que ocorrem no genoma do cancro. Estudos comparando vários tipos de tumores estão lançando luz sobre tanto a relação entre mutações genéticas e tipo de câncer, bem como as vias desregulados que são comuns em cancros ou específica para o subconjunto de tipos de câncer [12-14]. Embora a Illumina (Illumina, San Diego, CA), plataforma de sequenciamento de profundidade é o atual líder em pesquisa clínica do cancro [15], outras tecnologias, como Ion Torrent (Life Technologies, Carlsbad, CA) [16] são adequadas para métodos de rastreio mais abrangentes baseados no tempo sequenciamento reduzido e custo por exemplo [17]. Neste estudo avaliou-se a capacidade do AmpliSeq Painel Ion Comprehensive Cancer (Life Technologies, Carlsbad, CA) para identificar variantes em amostras em triplicado (sangue combinado, primários e tumores recorrentes) de três pacientes GBM e compararam os resultados com dados de sequenciamento de toda exome obtido utilizando a plataforma Illumina do projeto Cancer Genome Atlas (TCGA) [18].

Materiais e Métodos

Estudo pacientes e processamento da amostra

pacientes GBM foram prospectivamente recrutados como parte do curso tumor cerebral Ohio Study (OBTS), um estudo prospectivo de pacientes com tumor cerebral benigno e maligno primário dos quatro principais centros acadêmicos do estado de Ohio. consentimento por escrito foi recebida de todos os pacientes durante a sua inscrição no OBTS, que ocorreu antes da colheita da amostra. Todos os protocolos e procedimentos sujeitos humanos foram aprovadas pelo Conselho de Revisão Institucional da Universidade Hospitais Processo Medical Center, Cleveland, Ohio. amostras de sangue pré-tratamento, juntamente com tecidos tumorais primárias e recorrentes de snap-congelados (amostras tripleto) foram coletadas de três pacientes adultos. A figura 1 proporciona uma visão geral dos processos utilizados neste estudo. Os tecidos foram congelados dentro de 15 a 30 minutos após a ressecção. Amostras e informações clínicas foram coletados e arquivados de acordo com as diretrizes estabelecidas pelo Cancer Genome Atlas [18] e pureza tumor foi acessado por avaliação histológica pelo conselho neuropatologista certificado. Duas secções foram tomadas de cada amostra de paciente (3 amostras /paciente x 2) e uma recolha de amostras de tripletos de todos os três pacientes foram sequenciados em cada uma das duas plataformas de sequenciação.

A sequenciação para as amostras AmpliSeq CCP foi feito usando o Ion 318 Chip e toda a sequenciação exome foi executada usando o Genome Analyzer II ou HiSeq 2000, ambos da Illumina.

o sangue foi colhido em tubos de DNA PAXgene e DNA extraído utilizando o kit de DNA de sangue PAXgene (Qiagen , Valencia, CA). O ADN total foi isolado a partir das amostras de tumor cerebral congelados instantaneamente utilizando o kit de purificação de ADN Maxwell 16 (Promega, Madison, WI). O ADN foi quantificado utilizando Nanodrop ND-100 (Thermo Scientific, Waltham, MA) e 2,0 Qubit Fluorómetro (Life Technologies, Carlsbad, CA). Amostras de DNA triplete emparelhado no doente, desde três pacientes foram sequenciados utilizando (i) toda a sequenciação exome na Illumina GA-IIX ou HiSeq de 2000 [ExomeSeq] (Fig 1) como parte do projeto Cancer Genome Atlas, conforme detalhado no [18] e ( ii) o AmpliSeq Painel Comprehensive Cancer Ion (Ion AmpliSeq CCP, Life Technologies). Para isso, quatro piscinas amplicon por amostra cobrindo 409 genes implicados no cancro foram quantificados (2100 Bioanalyzer DNA 7500, a Agilent Technologies), preparado e enriquecido para seqüenciamento no Ion Sphere Partículas (ISPs) que usam o 200 Template Ion OneTouch Kit v2 (Life Technologies ) na OneTouch 2 Sistema Ion ™ (Life Technologies). ISP Templated foram quantificados (Qubit 2,0, Life Technologies) e foram carregados para um ião 318 Chip (Life Technologies) a ser sequenciado na Ion PGM usando o Ion PGM Sequencing Kit V2 200 (Life Technologies). A eficiência média de carga na Ion Torrent PGM foi de 88% em todos os nove Ion 318 fichas com uma média de 5,9 milhões de leituras por amostra. As amostras individuais em média, em 5,8 milhões sequência mapeada lê, com um comprimento leia média de 109 pares de bases. A cobertura média alvo na Ion Torrent PGM foi 315x e 377x de amostras de sangue e de tumor, respectivamente. No caso de o TCGA Ilumina toda exome sequenciação, a cobertura do alvo média foi de 121x e 138x para amostras de sangue e de tumor, respectivamente. processamento e base do sinal de chamada de dados de sequências geradas a partir da Ion Torrent PGM foi realizada com Torrent Análise Suite versão 3.4.2. De alta qualidade lê (uma pontuação de qualidade 20) a partir dos arquivos FASTQ gerados a partir da Ion Torrent PGM Servidor foram aparadas de adaptador, código de barras, e as sequências de iniciadores de alinhamento antes da montagem do genoma humano 19 sequência (Hg19)

Processamento de dados e Variant Identificação

Antes da variante análise, arquivos FASTQ gerados de ambas as plataformas foram submetidas a várias etapas de pré-processamento. arquivos FASTQ foram alinhadas com o consórcio Referência Genoma Humano construir 37 (Hg19) utilizando o algoritmo de alinhamento Burroughs-Wheeler como implementado no pacote de software v.0.7.2 BWA, resultando na produção de arquivos BAM do alinhados lê. Seguindo o alinhamento genoma, o v.3.2.2 Genome Analysis Toolkit foi usada para realinhar lê em torno de inserção /eliminações e recalibrar índices de qualidade de base tanto para dados AmpliSeq ExomeSeq e. O ExomeSeq leituras foram submetidos a duplicar marcação e remoção antes dos passos de realinhamento da recalibração e de base. arquivos BAM foram classificadas em coordenar ordem e arquivos de índice BAM foram gerados usando Picard v.1.119. chamada variante foi realizada em Alinhados lê pareados por amostras do paciente, ou seja, sangue (normal) versus tecido do tumor primário ou recorrente, utilizando MuTect v.1.1.4 [19] juntamente com dbSNP 138. As variantes foram anotados com v.111214 ANNOVAR (http : //www.openbioinformatics.org/annovar/) e ler alinhamentos foram visualizadas utilizando IGV v2.3.2 (https://www.broadinstitute.org/igv/). análise variante foi restrito a variantes que ocorrem em regiões exome.

Resultados

A demografia dos doentes e tratamento

Entre os três pacientes incluídos neste estudo, a idade média foi de 45 anos ea sobrevida global média foi de 441 dias (Tabela 1). Todos, exceto um paciente era do sexo masculino e todos eram brancos (um paciente também auto-identificados como latino-americano). Cada paciente recebeu o mesmo tratamento, que consistiu de ressecção total seguida de temozolomida e adjuvante de radiação com feixe externo. Além disso, todos os pacientes foram submetidos a uma segunda cirurgia na recorrência. Pureza de amostras de tumores primários foi maior do que em amostras de tumores recorrentes, variando de 80-90% para 65-75%, respectivamente (Tabela 1).

variantes identificadas por ambos ExomeSeq e AmpliSeq PCC

Desde tecnologias de sequenciação de toda exome têm a capacidade de cobrir todos os genes que codificam dentro do genoma, ao passo que qualquer abordagem baseada painel vai ser limitada a um subconjunto do genoma de codificação, para tornar a comparação mais adequada entre as duas tecnologias que restringiu a nossa análise às 409 genes incluídos no painel AmpliSeq. Além disso, uma vez que estávamos mais interessados ​​em variantes dentro das regiões de codificação, que também se concentrou na análise de variantes dentro apenas exons. As variantes foram identificadas em 13 (3%) dos 409 genes analisados ​​neste estudo. A maior parte dos variantes foram encontrados nos dados ExomeSeq e apenas duas variantes de genes foram partilhados entre as duas plataformas (Fig 2).

Genes contendo variantes e as plataformas de sequenciação são mostrados associados. A maioria das variantes foram associados com os dados ExomeSeq e houve um total de 409 genes na AmpliSeq CCP.

As variantes encontrados por ambas as plataformas estavam nos genes

PTCH1

(remendado 1) e

NF1

(neurofibrina 1). A análise detalhada do

PTCH1

variante revelou cobertura semelhante da base mutante (Fig 3A) em ambos os dados AmpliSeq e ExomeSeq a 26 e 24 lê, respectivamente; eo painel de AmpliSeq tinha uma percentagem mais baixa (23% contra 38%) de leituras contendo a base alternativa. A outra variante compartilhada foi encontrado no

NF1

gene (Fig 3B) e neste caso as duas plataformas diferem muito em termos de cobertura de leitura da base de mutante. Nos dados ExomeSeq, existiam 38 lê cobrindo a base variante e 18 (47%) continha a variante; Considerando 360 lê os dados em AmpliSeq cobriu a base e 20% (71 leituras) continha a variante.

NF1

também foi uma das quatro variantes identificadas numa amostra de tumor recorrente

(A) Ver exibido vãos CHR9:. 98,209,620-98,209,640 de

PTCH1

; base de variante é G a uma mutação localizada na base de 98.209.634 no tumor primário de UH1 paciente. (B) Ver exibido vãos chr17: 29,585,500-29,585,530 de

NF1

; variante é G a uma mutação localizada na base de 29.585.518 no tumor recorrente de UH3 paciente. A base variante está localizado entre as duas linhas verticais que atravessam a lê.

variantes identificadas pelo ExomeSeq mas não por AmpliSeq CCP

Houve um total de 10 variantes em oito genes supostamente incluído no AmpliSeq PCC que apenas foram identificados pela abordagem ExomeSeq. Dois destes genes foram

PTEN (fosfatase e homólogo tensina) e

TP53

(de tumor p53 proteína), ambos os quais foram encontrados nos tumores primários e recorrentes de UH3 paciente. Ambos os genes são frequentemente mutado no GBM e muitos outros cancros. No tumor primário, o exão contendo a base mutado em

PTEN

foi amplamente coberto pela ExomeSeq lê e a base mutada foi coberto por 26 lê, 65% das quais continha a variante; No entanto, o mesmo exão só foi parcialmente coberta por lê a partir da nenhum AmpliSeq PCC (Fig 4A) de que cobria a base mutada. Da mesma forma, uma mutação no

gene TP53

foi coberta por 98 ExomeSeq lê, 53% continham a base variante, enquanto nenhum AmpliSeq CCP lê coberta nesta região do exão (Fig 4B). Análise de cobertura de leitura de

PTEN

e

TP53

no tumor recorrente do paciente UH3 encontrado um aumento do número de leituras cobrindo a base variante em comparação com o tumor primário para ambos os genes no 68 e 121, respectivamente. Em termos da proporção das leituras que cobre a base, que também foram mutados, houve uma redução para

PTEN

para 40% e para o

TP53

, a proporção era praticamente o mesmo que no tumor primário em 54%. Além disso, os dados AmpliSeq para o tumor recorrente produziu uma leitura único que abrange a base mutado em

TP53

, este lido também continham a variante.

Os dados AmpliSeq não produzem qualquer lê cobrindo o base de variante na

PTEN

; no entanto, um único não lê mostrado no gráfico fez cobrir a base variante em

TP53

no tumor recorrente. Dados a partir de tumores primários são mostrados. (A) Ver exibido vãos chr10: 89,653,700-89,653,900 de

PTEN

; variante é T a mutação G localizado na base de 89.653.783. (B) Vista do

TP53

exibe a região de chr17: 7,578,400-7,578,600; variante é G a uma mutação localizada na base de 7.578.475. A localização da base variante é indicado pela linha vertical cruzando o lê.

O

PIK3CG

(, catalítico subunidade gama fosfatidilinositol 4,5-bifosfato 3-quinase) gene foi o único gene encontrado para ser mutado em mais de um paciente, especificamente este gene continha duas variantes diferentes e cada um de estava presente nos tumores primários de ambos os indivíduos UH1 e UH3 (Tabela 2). Curiosamente, duas variantes foram identificados no

gene

LLP (domínio de translocação LIM contendo parceiro preferido no lipoma), tanto no tumor primário do paciente UH2 (Tabela 2). Estas duas variantes foram localizados em bases adjacentes. Exame de todos os genes AmpliSeq PCC que continham variantes apenas em dados ExomeSeq revelou o gene

LLP

ter a maior cobertura com 1.388 e 1.403 lê cobrindo a primeira e segunda variante, respectivamente. Em ambos os casos, 80% das leituras foram mutados.

variantes identificadas exclusivamente por AmpliSeq PCC

Em contraste com as variantes originais com os dados ExomeSeq, três variantes em três genes diferentes foram identificados pelo AmpliSeq CCP, mas não por toda a sequenciação exome (Figura 2 e Tabela 2). Todas as três variantes foram detectadas em tumores primários de dois pacientes (UH1 UH2), especificamente no

DPYD

(desidrogenase diidropirimidina),

MCL1

(v-myc mielocitomatose homólogo oncogene viral 1, carcinoma do pulmão) derivada de genes [aviário], e

TNK2

(tirosina quinase, não receptora, 2). Nenhum dos três variantes únicas para AmpliSeq CCP foram designados como “coberta” pelo software MuTect, indicando potência inferior a 80% para detectar estas variantes em 0.3 fração alélicas.

Discussão

sequenciamento profundo metodologias têm revolucionou muitas áreas biológicas e biomédicas com câncer, particularmente o diagnóstico e estratégias de tratamento, sendo um dos mais afetados [20, 21]. Grande esforço tem sido colocado em sequenciar genomas inteiros ou exomes inteiros para identificar mutações associadas ao câncer críticos que poderia dirigir personalizados e direcionados terapias [22]. Infelizmente, embora o acesso a tecnologias de sequenciação profundas tem aumentado consideravelmente nos últimos anos, a continuação custo relativamente elevado de sequenciação e a complexidade da análise levou ao desenvolvimento de instrumentos mais acessíveis e metodologias, em conjunto com a simplificação do número de genes aos ser analisados. O Ion AmpliSeq CCP foi desenvolvido para sequenciar todo-exão cobertura de 409 genes implicados no cancro, ou seja, mais de 50% do Gene do cancro do Censo Wellcome Trust Sanger Institute (https://cancer.sanger.ac.uk/cosmic/census ). Neste estudo piloto utilizou-se o AmpliSeq CCP a sequência de sangue combinado, primário e tumores recorrentes de três pacientes GBM e compararam os resultados com os dados de sequenciamento exome integrais obtidos utilizando a plataforma Illumina a partir do projeto Cancer Genome Atlas (TCGA).

no geral, foram encontrados alguns genes para conter variantes neste estudo (13 genes) e entre aqueles, apenas duas variantes foram identificadas conjuntamente pelas duas abordagens de sequenciamento (ExomeSeq e AmpliSeq PCC). Uma variante no

gene PTCH1

foi identificado no tumor primário de UH1 paciente. Este supressores de tumor funções dos genes na via de sinalização Hedgehog e tem sido mostrar a ser mutado em meduloblastoma pediátrico [23]. A segunda variante estava dentro do gene de

NF1

(também um supressor de tumor), que codifica a proteína neurofibrina 1 e é um gene frequentemente mutado no GBM [18]. Estas duas variantes foram os dois únicos abrangidos pelo software MuTect, o que efetivamente torna

PTCH1

e

NF1

as variantes mais confiável identificados nos dados AmpliSeq PCC.

Houve também pouca sobreposição de variantes entre paciente individual e tipos de tumores. O único gene identificado como variante em mais do que um paciente foi

PIK3CG

, que foi mutado em tumores primários a partir de doentes UH1 UH3. Este gene contido diferentes variantes nos dois tumores e só estava presente nos dados ExomeSeq. Os genes

PTEN

e

TP53

continha as únicas variantes genéticas identificadas em ambos os tumores primários e recorrentes do mesmo paciente, UH3. Apesar de ambos os genes estão entre aqueles frequentemente mutado no GBM, estas variantes foram também exclusiva para os dados ExomeSeq. A inspecção dos alinhamentos nas bases variantes revelou apenas uma cobertura parcial da variante que contém os exões pela AmpliSeq lê, que é um contribuinte provável que a variante não ser detectado por este painel.

Prevê-se que não seria haver diferenças nas variantes identificadas a partir dos dados ExomeSeq e AmpliSeq PCC. Em um esforço para limitar essas diferenças, restringimos a análise para incluir apenas os genes que estavam na lista gene da AmpliSeq CCP. As abordagens tecnológicas diferentes de seqüenciamento de um exome inteira contra sequenciar um subconjunto focalizado de genes relacionados ao câncer, provavelmente poderia resultar em encontrar menos genes mutados utilizando a abordagem mais focalizada, como observado neste estudo. Outro ponto a ter em consideração é que a heterogeneidade intra-tumoral é uma característica de muitos cânceres, incluindo GBM. A análise aqui relatada foi feita usando dois cortes diferentes de cada tumor do paciente e as nossas discrepâncias observadas na identificação variante pode resultar de a heterogeneidade intra-tumoral inerente GBM.

Esta análise fornece evidências de que os genes

PTCH1 Comprar e

NF1

pode ser detectado de forma confiável em amostras de pacientes e que a falta de cobertura exão larga pode ter impacto na detecção de variante nessas regiões. Os genes incluídos no AmpliSeq CCP foram selecionados para ser representativa de uma vasta selecção de tipos de câncer e painéis de genes mais específicas para o cérebro e tumores cerebrais podem melhorar a detecção de variante na GBM. Embora poucos estudos avaliaram os painéis derivados de sequenciamento de profundidade de uso para genotipagem rápida câncer [23, 24], o nosso estudo piloto demonstra o potencial para o Ion AmpliSeq CCP contribuir para a detecção de mutações em investigação básica e clínica do cancro. Novos estudos, com maior número de amostras nos ajudará a entender as diferenças observadas entre as duas metodologias e adicionar à nossa compreensão atual de mutações que conduzem a progressão e recorrência em GBM.

Reconhecimentos

A autores gostariam de reconhecer os pacientes que participaram do projeto Cancer Genome Atlas (TCGA) e Andrew E. Sloan, MD, por seu apoio do biobanco tumor cerebral Hospitais Universitários. Os resultados publicados aqui estão total ou parcialmente com base no projeto Cancer Genome Atlas estabelecido pela NCI e NHGRI. Outras informações sobre TCGA pode ser encontrada aqui: https://cancergenome.nih.gov/

.

Deixe uma resposta