PLOS ONE: Comprehensive Genomic Analysis de um BRCA2 Deficiência Humana pâncreas Cancer

Abstract

Capan-1 é um bem caracterizada

BRCA2

linha celular humana -deficient isolado a partir de uma metástase do fígado de um adenocarcinoma do pâncreas. Aqui nós relatamos uma avaliação de todo o genoma de variações estruturais e de alta profundidade caracterização exome de variantes de nucleotídeo único e pequenas inserção /eliminações na Capan-1. Para identificar potenciais somática e variações associados a tumores, na ausência de uma linha de células de correspondência normal, foi concebido um novo método baseado na análise de amostras de HapMap. Nós demonstramos que Capan-1 tem um dos genomas sequenciados mais rearranjado até à data. Além disso, pequenas inserções e deleções são detectados mais frequentemente no contexto da sequência repete curto do que em outros genomas. Nós também identificar uma série de novas mutações que podem representar mudanças genéticas que têm contribuído para a progressão do tumor. Estes dados fornecem uma visão sobre os efeitos genômicos da perda da função BRCA2

Citation:. Barber LJ, Rosa Rosa JM, Kozarewa I, Fenwick K, Assiotis I, Mitsopoulos C, et al. (2011) Comprehensive Genomic Analysis de um

BRCA2

cancro do pâncreas Deficiência Humana. PLoS ONE 6 (7): e21639. doi: 10.1371 /journal.pone.0021639

editor: Robert Oshima, Sanford-Burnham Medical Research Institute, Estados Unidos da América

Recebido: 17 Março, 2011; Aceito: 03 de junho de 2011; Publicação: 05 de julho de 2011

Direitos de autor: © 2011 Barber et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Os autores obrigado Cancer Breakthrough Breast Câncer Research UK, e da Associação americana para Pesquisa do Câncer /stand Up to Cancer pelo financiamento deste trabalho. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

os indivíduos heterozigotos para mutações de perda de função no gene supressor tumoral

BRCA2

são altamente predispostos a uma gama de diferentes tipos de câncer. As mulheres que herdam um mutante

BRCA2

alelo têm um risco de vida significativamente altamente elevado de desenvolver câncer de mama e de ovário [1]. Além disso, os cânceres de mama e próstata masculina estão fortemente associados com

mutações no gene BRCA2

[2]. Em ambos os sexos,

deficiência BRCA2

aumenta o risco de desenvolvimento de cancros do pâncreas, estômago, vesícula biliar, e do ducto biliar, bem como o melanoma [3]. O tratamento do câncer de pâncreas apresenta desafios significativos como a maioria dos pacientes apresentam localmente avançado ou doença metastática e terapias anticancro convencionais mostram eficácia limitada; apenas 5% dos pacientes com câncer pancreático sobreviver além de cinco anos a partir do diagnóstico inicial [4], [5].

BRCA2 desempenha um papel fundamental na manutenção da integridade genômica, em particular através da regulação de reparo de DNA por homóloga reparação de recombinação (RH) [6] um processo que também é controlada por uma outra proteína supressora de tumor, BRCA1 [7]. RH é um processo em grande parte livre de erros que restaura a sequência original no sítio de um ADN de quebras de cadeias duplas (DSB) [8]. LAP surgem relativamente frequentemente e pode ser causada pela replicação celular normal, assim como o stress exógeno, tais como exposição a radiação [9] ionizante. Na ausência de HR, por exemplo, devido à perda da função BRCA2, LAP parecem ser reparados por processos mais propensas a erro que conduzem finalmente à acumulação de rearranjos cromossómicos brutos [10]. Pensa-se que a utilização dos processos de reparação de ADN propensa a erro na ausência de função BRCA2 mais provável promove tumorigénese [10]. Como parte do seu papel no HR, BRCA2 controla a carga e remoção do RAD51 DNA recombinase no LAP. O filamento RAD51-ssDNA resultante medeia a busca de uma sequência de DNA homóloga ao modelo a reparação do DSB [11].

Apesar do grande interesse na função BRCA2 e seu papel na tumorigénese e reparo do DNA, há poucos modelos de células de tumor de deficiência BRCA2 que podem ser utilizados de forma produtiva em laboratório. Destes Capan-1 é o mais bem caracterizado. Capan-1 foi derivada de uma metástase de fígado em um homem caucasiano de 40 anos de idade com um adenocarcinoma pancreático primário [12], [13]. Estas células não têm um funcional

BRCA2

alelo e, em vez levar um

c.6174delT

alelo. A supressão única base a

c.6174

provoca um desvio de enquadramento, (p.S1982fs * 22) resultando na perda dos aminoácidos do terminal C da proteína de 1416 [14], [15]. A proteína truncada resultante não tem dois motivos BRC envolvidas na interacção entre BRCA2 com RAD51 e ADNcs [16], bem como as sequências C-terminais que se pensa ser necessária para a localização nuclear de BRCA2 e RAD51 desmontagem /ADN [17], [18] . Esta isoforma truncada BRCA2 foi mostrado ser tanto citoplasmática e disfuncional em RH [19], [20]. De acordo com o conceito de que a disfunção BRCA2 leva à instabilidade genômica, análise de cariótipo SKY demonstrou que Capan-1 possui um genoma hypotriploid, com 36 rearranjos estruturais definidas distribuídos por todo o genoma [21]. A maioria destes rearranjos são provavelmente muito complexa e parece envolver mais do que três segmentos de cromossomas, embora dois translocações recíprocas (t (6; 15) e t (7; 10)) têm sido descritos (www.path.cam.ac. uk /~ pawefish).

Dada a considerável utilização da linha celular Capan-1 como um modelo não só da disfunção BRCA2, mas também de cancro pancreático, foi utilizada tecnologia próxima geração de sequenciação para estudar a sequência genómica do presente linha de células.

resultados

estratégia de sequenciamento de DNA

Para identificar rearranjos estruturais candidatos que primeiro gerados toda uma sequência do genoma de profundidade média de Capan-1. Nós isolado ADN a partir de células de Capan-1, e gerada uma biblioteca de fragmento de ADN de 500 pb utilizando uma abordagem isenta de PCR que melhora a complexidade do banco [22]. Esta biblioteca de DNA foi sequenciado usando uma estratégia-end emparelhado em um Illumina Genome GAIIx Analyser, produzindo 365.811.868 matéria-76 bp companheiro-emparelhado lê (27,8 Gb). Após o alinhamento de um genoma humano de referência (hg19 /build37) e o subsequente processo de filtração para remover duplicados de PCR e de má qualidade lê, estes dados deu cobertura genoma suficiente (90,09%) para o estudo de rearranjos estruturais, a uma profundidade média de 8,55 fold (Tabela 1; Tabela S1).

Para investigar a sequência de codificação de Capan-1 em maior profundidade, usamos uma estratégia de enriquecimento alvo baseado em Agilent SureSelect captura em solução. Utilizamos o kit SureSelect humanos Todos os Exão, concebido para capturar maior do que 38 Mb de DNA genómico humano correspondente ao banco de dados do NCBI Consenso CDS. Dois captura hibridações independentes foram realizados em fragmentos de aproximadamente 200 pb do Capan-1 ADN genómico. As bibliotecas resultantes foram sequenciados exome numa Ilumina GAIIx emparelhado utilizando-fim 2 × 76 pb de sequenciação é executado. Isto produziu 130.310.847 cru lê (9,9 Gb). Da mesma forma para toda a análise do genoma, sequência lê a partir do processo de captura foram alinhadas com um genoma de referência humano (hg19 /build37) usando Burrows-Wheeler alinhador (BWA, [23]) e, em seguida, filtrada para remover duplicados de PCR e de má qualidade lê. A percentagem de leituras no alvo foi de 65%, alcançando uma cobertura final 98,51% para as regiões com isca de uma profundidade média de 89 vezes (Tabela 1; Tabela S2), muito superior à profundidade de 30 vezes necessário para identificar variantes genéticas em amostras de tumor [24].

Para que as estratégias tanto todo o genoma e sequenciamento exome, mais de 80% das leituras foram alinhados em conjunto com o respectivo parceiro de pares (Tabela 1). No caso de todo o genoma re-sequenciação, 5,63% de leituras mapeadas num cromossoma diferente em comparação com seu companheiro de par, e mais 10,31% de leituras ficaram órfãs, ou seja, onde o companheiro de par não conseguiu alinhar devido à excessiva N ou incompatibilidades /indels (Tabela 1). Isto suporta baixa resolução anteriores análises do cariótipo espectral (SKY) de Capan-1 que sugerem um genoma altamente reorganizados [21]. Para a seqüência exome, um pouco menos leituras foram alinhados independentemente do seu companheiro de par do que para a sequenciação de todo o exome, talvez sugerindo que rearranjos dentro da região de codificação ocorreram com menor freqüência em Capan-1 do que em regiões não-gênicas (Tabela 1).

profundidade Sequence em todo o genoma foi comparado a dados gerados pelo conjunto hibridização genômica comparativa (aCGH) (Fig. S1, Tabela S1). Em geral, a profundidade média para cada cromossoma identificados por sequenciação de correspondeu ao perfil de número de cópia gerado por aCGH (Fig. S1). Por exemplo, os cromossomas, tais como 4 e 6, que por aCGH parecia estar presente em duas cópias, mostrou predominantemente mesmo profundidade ao longo de todo o seu comprimento. Além disso, a única cópia do cromossoma X devolvido aproximadamente metade do número de leituras de cromossomas 4 e 6. A relatado anteriormente [21], [25] deleção homozigótica do 9p21 envolvendo

CDKN2A

, e a perda da maioria do cromossomo Y, também foram confirmadas por sequenciação. (Figura 1A; A Fig. S1, Tabela S1)

A. Circos lote de todo o genoma dos rearranjos identificados no Capan-1 por análise BREAKDANCER. Um ideograma de um cariótipo normal é mostrado no anel externo, e do número de cópias é representado pela linha azul nos anéis meio. A posição relativa de cada classe e rearranjo é representada no interior do círculo interior, tal como descrito na legenda. B. Comparação entre o número total de rearranjos inter e intra-cromossômicas detectadas pela análise BREAKDANCER em um painel de

BRCA2

,

BRCA1

, e não

BRCA

mutado linhas celulares e tumores primários. C. As amostras foram classificadas como

BRCA

-mutated (Mut) ou do tipo selvagem BRCA (em peso), e os números de inter, intra-cromossômica, e rearranjos totais foram comparadas. valores de p referem-se a análise de Mann Whitney com aproximação de Gauss. D. Comparação da percentagem de cada classe de rearranjo em cada amostra. As amostras são classificadas como

BRCA2

,

BRCA1

, e não

BRCA

mutado, como em B.

variação estrutural

Para identificar rearranjos estruturais candidatos, foi analisada a sequência do genoma inteiro de Capan-1 utilizando BREAKDANCER [26]. Foi utilizado um método de filtragem rigorosa que rearranjos identificadas apenas apoiada por pelo menos dez lê (a profundidade média em todo o genoma era 8.55x). Esta abordagem identificou 354 grandes variações estruturais no Capan-1, que foram sub-classificados como deleções intrachromosomal, inserções, inversões, translocações ou directas ou invertidas inter-cromossómicas (Fig. 1A). Não inserções foram detectados nesta análise, como todos eles caíram dentro dos limites de distribuição de tamanho de fragmento normal (1-1000 pb).

Dado que Capan-1 é um modelo deficiente BRCA2, foi investigada a possibilidade de que forma profundidade, a sequenciação do genoma inteiro poderia ser usado para distinguir BRCA1 e BRCA2 tumores deficientes a partir de formas não-familiares. Até à data, dois tumores deficientes em BRCA2, dois tumores deficientes em BRCA1, e linhas de células deficientes em BRCA1 também dois foram submetidos a sequenciação de profundidade média genoma inteiro, como parte de um estudo mais vasto de tumores da mama primários e linhas de células [27]. Obtivemos os dados brutos a partir deste estudo [27], e processados ​​através da nossa própria conduta, o que incluiu a análise com BREAKDANCER. Desta forma, fomos capazes de comparar diretamente a frequência e tipo de rearranjos estruturais identificadas no Capan-1 com ambos os tumores deficiente e proficiente primário de mama BRCA e linhas celulares (Fig. 1B-D). De todos os genomas estudados, Capan-1 exibiram os rearranjos estruturais mais, tanto inter e intracromossómica (Fig. 1B). Embora o número da amostra em estudo foi relativamente baixa (n = 7

BRCA

tumores mutantes vs. n = 15 não

BRCA

tumores mutantes) comparação dos dados Capan-1 com os dados do

BRCA2

mutantes tumores de mama primário e

BRCA1

tumores de mama primário mutantes e linhas celulares fez sugerem uma tendência para as amostras deficientes em BRCA a exibir um maior número de rearranjos estruturais, (número médio de

BRCA

mutantes tumores = 72 rearranjos, o número médio de não-

BRCA

tumores mutantes = 41, Fig. 1C), de acordo com os papéis de BRCA1 e BRCA2 na manutenção da estabilidade genômica. Embora esta observação não era estatisticamente significativa (p = 0,1368, Mann Whitney), isto poderia ser atribuído ao tamanho reduzido da amostra. Além disso, como mutações em outros genes que

BRCA1

e

BRCA2

afetar HR, é perfeitamente possível que algumas das amostras classificadas como “não-

BRCA

” também poderia tem uma deficiência HR semelhante ao

BRCA1 /2

tumores mutantes. A porcentagem do total de rearranjos em cada classe também foi comparada através do

BRCA

grupos -mutant e não mutantes (Fig. 1D). Em Capan-1, como na maioria dos outros genomas, deleções intrachromosomal era a classe mais frequente de rearranjo. No entanto, não houve nenhum tipo claro ou padrão de rearranjos que era específico para

BRCA

células -mutant, com base neste pequeno conjunto de amostras.

Um número de rearranjos estruturais brutas foram anteriormente identificadas em Capan-1 utilizando o cariótipo espectral (SKY) análise [21]. No entanto, a resolução da análise SKY é relativamente baixa e, em muitos casos, a posição de muitos dos rearranjos putativas identificadas com esta forma de análise não pode ser prevista com qualquer grande confiança de coordenadas. Diante disso, temos apenas tentou uma análise comparativa dos dados NGS com os dados SKY onde as posições das coordenadas da SKY previu rearranjos poderia ser feita dentro de ~ 10 Mb. Esta análise comparativa sugeriu que seis dos rearranjos anteriormente identificados podem também ser identificadas utilizando a sequenciação do genoma completo, mas em maior resolução (Tabela 2). Um outro rearranjo complexo entre cromossomos 6, 8 e 17 tinham sido previamente sugerido pela análise SKY, embora não em detalhe suficiente para elucidar as regiões exatas de cada cromossomo envolvido. Nossa análise também sugeriu translocações complexas entre cromossomos 6 e 8, e entre 8 e 17 (Tabela 2).

Curiosamente, onze dos rearranjos intercromossômicas identificados identificados no Capan-1 apareceu para coincidir com as regiões gênicas em ambos os pontos de ruptura, potencialmente sugerindo eventos de fusão de genes (Tabela 3). Nenhuma dessas fusões tenham sido previamente relatado na Cancer Genome Census [28]. Mais 42 rearranjos foram encontrados dentro de um gene ou de regiões reguladoras a montante, em um ponto de interrupção, que também poderia ter efeitos deletérios (Tabela S3). Um destes rearranjos tinha um ponto de interrupção de um gene,

ZNF521

, que foi recentemente identificado como o objecto de translocações cromossómicas em leucemia linfoblástica aguda [29]. A mais de 118 genes apareceu a ser afectada por rearranjos intrachromosomal (Tabela S4).

variante exome único nucleotídeo (SNV) e Indel descoberta

Para identificar SNVS e pequena inserção /deleção ( InDel) eventos na sequência de codificação de Capan-1, foi utilizado SAMtools [30] para a análise pile-up da sequência exome de alta profundidade e posterior chamado SNV. Pequenas indels (1-6 pb) foram identificados utilizando um pipeline personalizado (ver Métodos). Maior descoberta indel foi conseguida utilizando Pindel [31]. No primeiro exemplo, as variantes foram filtrados para excluir os detectados a uma profundidade de menos de dez leituras por cópia. SNVS e indels referenciados como polimorfismos população em geral em dbSNP também foram desconsiderados, como estávamos em grande parte interessada na identificação de alterações específicas do câncer prováveis.

Como a maioria das linhas de células derivadas de tumores, Capan-1 não têm uma linha celular normal combinado a partir do mesmo paciente que poderia ser utilizado para ajudar a identificar as alterações específicas do cancro e remover artefactos decorrentes da produção tanto de amostra e o alinhamento. À luz disto, foi desenvolvido um processo de filtração para resequencing exome, com base na comparação cruzada com os dados obtidos a partir da preparação da amostra análoga e análise de quatro amostras genoma HapMap normais (NA11881 (masculino); NA12761, NA12813 e NA12892 (feminino )) (Tabela S5). Utilizando estas amostras HapMap, fomos capazes de remover artefatos decorrentes tanto a produção da amostra (eg variação na eficiência de hibridação) e alinhamento (por exemplo, regiões homólogas).

A análise dos dados obtidos a partir resequencing exome das amostras HapMap habilitado -nos a definir limites para homozigose (variante lê 88% ou 10% total) e heterozigosidade (variante lê 33-67% total) de variantes. Esses limites foram usadas para filtrar os SNVS e indels identificados no Capan-1 genoma. Além disso, como estávamos interessados ​​em identificar mutações específicas do tumor candidatos, que ignorou todas as mutações que também foram detectados nas amostras de HapMap, como uma normalização aproximado para a variação da linha germinativa provável.

Como mais um nível de rigor nós também número de cópias consideradas alterações em todo o genoma Capan-1, como definido pela análise aCGH. Isto é particularmente relevante para genomas altamente reorganizados e aneuploidia, como Capan-1. Com base em nossa experiência, a utilização de filtros específicos da região para a profundidade sequenciamento facilita a identificação variante mais confiável. Claramente, as variantes heterozigotos chamados em regiões de cópia única são susceptíveis de ser falsa (provavelmente devido ao desalinhamento), e em outros lugares, o número de leituras que carrega o alelo variante pode flutuar de forma diferente, dependendo do estado do número de cópias. Daí limiares de confiança foram aplicados tanto SNV e descoberta indel, que exige um mínimo de 10 leituras por cópia genómica. Além disso, pelo menos três leituras foram variante necessária para ligar para um SNV e, pelo menos, sete variante lê para indels, por cópia genómica. O catálogo de SNVS e indels identificado em Capan-1 resultantes são detalhados nas Tabelas S6 e S8, respectivamente.

Caracterização de codificação SNVS

taxa de transferência de genes candidatos estudos baixos de sequenciamento em Capan-1 têm anteriormente identificou três SNVS homozigotos em

KRAS

,

SMAD4

e

MAP2K4

. Usando sequenciamento exome, fomos capazes de detectar todas as três alterações: a

KRAS

c.35G mutação T que faz com que a substituição p.G12V aminoácido clinicamente relevante [32], [33], o c .1028C G SNV em

SMAD4

que resulta em um códon de parada prematura [34] e

MAP2K4

c.661G mutação T em Capan-1, o que leva a um cancro associado truncamento da proteína [35]. A aparência de todos os três destas mutações na lista final filtrada de variantes exome, deu confiança para nossos dutos de análise (Tabela S6).

Usando de alta profundidade exome sequenciamento, foram identificados um total de 608 SNVS em Capan -1 que afetam 1270 transcrições diferentes (Tabela 4). A maioria das mutações (61%) foram encontrados em regiões não codificantes (genes ou íntrons não codificante) ou eram variantes sinônimos. Vinte e quatro por cento dos transcritos afectados foram modificadas por alterações de codificação não sinónimas. No total, SNVS não sinónimas foram detectados em 206 genes diferentes, das quais 56 eram homozigotos (Tabela S6). Doze genes ganhou códons de parada prematura, quatro dos quais eram homozigotos (

GRIA3

,

GRM1

,

MAP2K4

,

SMAD4

). De forma significativa, o número de mutações que codificam somáticas prováveis ​​detectados para Capan-1 neste estudo comparado muito favoravelmente com os demonstrado em estudos anteriores que examinam as linhas de células tumorais COLO-829 (172, não sinónima SNV) [36] e NCI-H209 (94 não sinónima SNV) [24]. Ambos os estudos anteriores identificaram mutações somáticas por comparação com um controlo de ADN de sangue normal combinado a partir do mesmo paciente, o que sugere que a utilização de exomes HapMap é uma alternativa eficiente para a identificação de mutações somáticas no Capan-1, e outras células “órfão” linhas

Três da novela potencial truncando mutações foram escolhidos para validação por seqüenciamento Sanger:.

GRM1

(

c.C1458A

, p.Y486 *),

SMAP2

(

c.C764G

, p.S255 *), e

GLT6D1

(

c.G593A

, p.W198 *). Todos os três se mostraram verdadeiros SNVS, eo zygosity detectado pelo sequenciamento exome também foi confirmada por seqüenciamento Sanger: homozigoto para

GRM1

, heterozigotos para

SMAP2

e

GLT6D1

(Fig. 2A-C).

GRM1

codifica um receptor de glutamato metabotrópico, expressão aberrante do que tem sido sugerido para desempenhar um papel no desenvolvimento de melanoma [37]. SMAP2 é uma proteína de activação de GTPase específicos de ARF1 envolvidos no tráfico de membrana dependente de clatrina [38]. O

gene GLT6D1

codifica uma glicosiltransferase-6-contendo domínio de proteína como-ainda não caracterizada.

A. Cromatograma que descreve a parada de ganho SNV em

GRM1

detectado para Capan-1. As sequências de proteína e de referência genómico são mostrados acima no cromatograma. A SNV é destacada em azul na sequência de referência, e o resíduo afetada é sublinhado. B. Como A, para a

SMAP2

. C. Como A, para a

GLT6D1

. D. Comparação das frequências única substituição de base em Capan-1, tumor de mama basal-like, NCI-H209, Colo-829, e U87 MG genomas. E. Comparação de todo o genoma e frequências substituição de bases específicas de exome observada em Capan-1.

Todos os novos SNVS aqui identificados foram cruzadas com uma série de bases de dados online (SIFT [39 ], [40], Mutation Taster [41], [42], DAVID [43], [44], CGC [28], [45]) para prever a sua capacidade de modificar a função da proteína. Um dos candidatos mais interessantes foi um homozigoto c.

C162A

mutação no

FZD10

, um membro da família de genes frisado que codificam receptores de ligação ao ligando Wnt [46]. A homozigótico

c.C162A

variante detectado neste estudo conduz a uma substituição de um aminoácido não-sinónimo (p.N54K) a um resíduo altamente conservada dentro do local de ligação ao ligando putativo de Wnt (FZ domínio) [47] , [48]. FZD10 é um regulador positivo da via de sinalização Wnt-βCatenin-TCF, tem sido mostrado para ser regulados positivamente em tumores colorectais primários [49], e Wnt-beta sinalização Catenina é conhecido por ser aberrante em alguns adenocarcinomas pancreáticos [50].

Três variantes homozigotos estavam presentes no supressor de tumor

DCC

(

Deleted em carcinoma colorectal)

, que codifica um receptor netrin necessário para a diferenciação celular [51], e também a indução de apoptose na ausência de ligando [52]. Mutações e perda de

DCC

tenham sido previamente implicado no cancro do pâncreas, bem como uma variedade de outros tipos de tumores [52], [53]. Uma das três novas variantes detectadas em Capan-1 estava situada no local dador de splicing do intrão 20-21, quatro bases a jusante do motivo GT crítica. As outras duas variantes deu origem a mutações da proteína não sinónimas (p.L1042 M e p.K1411T). Embora nenhuma destas últimas mutações não-sinônimas foram previamente relatado, ambos estão localizados perto de resíduos de interesse: p.F1039S, mutado em adenocarcinoma [54]; e p.Y1418, um resíduo crítico fosforilada por Fyn, e necessário para a função DCC [55].

Cross-referenciação dos SNVS detectados em Capan-1 com o Gene Consenso Câncer (CGC) [28], [45] identificados doze genes que foram mostrados anteriormente a ser mutado em outros resíduos em linhas celulares de cancro ou tumores primários. Nenhuma das variantes identificadas em Capan-1 neste estudo foram anteriormente descritos. No entanto, a maioria destas alterações eram não codificante ou alterações sinónimos (Tabela S7). A mutação não sinónimo heterozigotos foi observada no fator de estabilidade do genoma checkpoint

Ataxia Telangiectasia Mutated

(

ATM

). No entanto, o resíduo variante (p.R1585S) se encontra fora de quaisquer domínios funcionais conhecidos e que é, portanto, difícil de predizer as consequências funcionais desta alteração. Uma segunda nova mutação não sinónima heterozigótica foi identificado em

TPR

(

translocado Promotor Região

), que codifica uma proteína que interage com o complexo do poro nuclear. Esta mutação (p.V779I) engloba um resíduo conservado dentro de um motivo conhecido comum às proteínas de segregação cromossômica, embora a valina para isoleucina substituição identificado aqui é provável que seja neutro.

Padrões de substituição de base

queríamos avaliar se o padrão de substituições de bases únicas na Capan-1 refletida de outros genomas do câncer. Os genomas linha celular humana publicados anteriormente, COLO-829 [36], e NCI-H209 [24] cada exibem um padrão característico de substituições de bases, representativa da exposição à radiação UV e agente cancerígeno de tabaco, respectivamente. Foram obtidos os dados a partir destes estudos, além de que a linha celular de glioblastoma U87 MG [56], e um tumor de mama basal como [57], para comparação com Capan-1. A análise comparativa destas sequências sugeriu que Capan-1 não exibem um padrão óbvio de substituições de bases ou um representante única assinatura de um mutagénio em particular. A maioria das substituições de codificação (-45%) em Capan-1, foram C T /G A, embora estes não eram tão predominante como observado em células COLO-829, em que C transições de T em locais dipyrimidine, indicativa de exposição aos raios UV , predominam [36] (Fig. 2D). Com base no número limitado de genomas cancerosas que foram sequenciados até à data, o padrão de substituições de bases observadas para Capan-1 mais se assemelha ao de U87 MG e o cancro da mama basal semelhante, diferindo apenas de forma significativa na percentagem de A G /T . mutações C (Fig. 2D)

também comparamos o padrão de substituições de bases em Capan-1 em todo o genoma versus o exome. Observou-se que o padrão era em grande parte o mesmo em regiões codificantes e não codificantes, exceto que C T /G A mutações foram representados com uma frequência maior no exome, com números mais baixos simultâneos de A C /T substituições G (Fig. 2E).

Caracterização de codificação indels

Quanto ao SNVS, novos indels identificados na linha celular Capan-1 foram filtrados de acordo com o seu número de cópias. Observou-se que 93 genes foram afectados por pequenas indels, variando de um a seis pares de bases (Tabela S8). Mais deleções foram identificados em comparação com as inserções (Tabela 5), ​​como seria de esperar a partir da utilização de métodos de alinhamento de gapped. 18 dos indels (nove inserções, exclusões nove) foram variantes homozigotos, enquanto 62 foram heterozigotos (27 inserções, 35 exclusão). De forma semelhante ao SNVS, efeitos de variação foram classificados de acordo com a transcrição (163 entre os 93 genes), ea maioria dos indels (72%) foram detectados nas regiões não-codificantes. Apenas 13% dos indels causada quadro de leitura e 15% de emenda-sites afetados. A marca

BRCA2 c.6174delT

mutação no Capan-1 [14], [15] foi um dos 15 genes marcados como sendo afetado por supressões de codificação do quadro de leitura.

Um subconjunto dos quadro de leitura de codificação de alta confiança foi validada por PCR e sequenciação de Sanger convencional, utilizando uma amostra de ADN genómico de replicação biológica. Oito novos quadro de leitura (homozigoto:

PAPLN

; Heterozigótica:

EPHB2

,

LRRC7

,

DDIT4L

,

ADD3

,

SF1

,

C17orf57

, e

ZNF599

) presente em Capan-1, mas não foi detectado nos genomas HapMap foram confirmados por sequenciação de Sanger, em adição a um quadro de leitura mais 17 e 10 três indels de pares de base comuns a ambos Capan-1 e HapMap. Todos os novos quadro de leitura, bem como os indels em-quadro, foram autenticado por Sanger de sequenciação (Fig. 3A-D e dados não apresentados). Cinco dos quadro de leitura de baixa taxa que não conseguiram passar pelos filtros rigorosos não pôde ser confirmada, apoiando a validade de nossa análise. Alguns dos genes afectados pelo quadro de leitura, tal como o

EPHB2

, tenham sido previamente associadas com tumorigénese em outros órgãos [58], levantando a possibilidade de que um certo número destes podem representar novas mutações do controlador.

A. Cromatograma que descreve a supressão do C (destacado em azul) no

PAPLN

detectado para Capan-1. A sequência de referência é mostrado acima genómico do cromatograma. A seta indica a posição da delecção. B. Como A, para eliminação de C em

EPHB2

. C. Como A, T C SNV e supressão de T em

DDIT4L

. D. Como A, exclusão de AG em

ZNF599

. E. Comparação do percentual de indels de 1, 2, 3, ou 4 comprimento bp que são acompanhadas por homologia em Capan-1, COLO-829, COLO-829BL, PD3689a e PD3690a. A homologia é definido como tendo a mesma sequência que as bases inseridas ou deletadas ou imediatamente a 5 ‘ou 3’ para o indel, como representado pelos exemplos.

Sequência contexto de indels

Postula-se que os defeitos na recombinação homóloga, tal como os que resultam da perda de função BRCA2, pode levar a um aumento em pequenas deleções [10], [59]. Estes podem ser flanqueado por sequências repetitivas, se os processos alternativos de reparo de DNA de fita dupla ruptura, como o fim não homóloga aderir ou recozimento de cadeia simples estão envolvidos na restauração [10], [15], [59]. Nesta base, nós examinamos o contexto de sequência imediata das pequenas indels detectados no genoma Capan-1, e comparando-os com os dois

BRCA2

tumores -deficient sequenciados no conjunto de dados Stephens [27], para além do

BRCA

-proficient COLO-829 e COLO-829BL combinado par [36]. Indels foram categorizados pelo comprimento (1, 2, 3, ou 4 + pb), e teve de se a sequência de flanqueamento, quer 5 ‘ou 3’ para o indel era idêntica à sequência inserida /suprimido (Fig. 3E). Na comparação /HapMap Capan-1, mais de 60% dos indels detectados em Capan-1 eram idênticas à sequência flanqueadora. Isto é significativamente mais do que seria esperado por acaso (50, 12,5, 3, e 0,8%, respectivamente, para uma 1, 2, 3, e 4 indel pb) e foi consideravelmente maior do que a observada no em COLO-829 /Colo- comparação 829Bl, onde presumivelmente HR está ativo. Capan-1 exibe uma maior frequência de indels associados com homologia de COLO829 apesar do muito maior profundidade de seqüência genômica gerada para COLO829. Daí as observações feitas por Capan-1 são susceptíveis de ser um artefacto resultante de diferenças na profundidade de sequenciamento. Além disso, a associação entre indels e flanqueando homologia permanece alta para todos os comprimentos de indels em Capan-1, o que contrasta com as outras linhas de células (Fig. 3E).

BRCA2

amostras de tumores -deficient PD3689a e PD3690a têm frequências mais baixas de indels ladeado por homologia, embora seja possível que estas taxas são sub-representadas devido à profundidade sequência baixa utilizada em sua análise (Fig. 3E) . No seu conjunto, esta observação sugere que

BRCA2

células tumorais -deficient podem estar predispostos a uma incidência mais frequente de indels em sequências repetitivas curtas.

Discussão

Aqui geramos a primeira análise da sequência do genoma completo de um

BRCA2

linha de células -deficient. Também representa o primeiro tal sequência de uma linha celular amplamente utilizada derivada de um tumor pancreático.

Deixe uma resposta