PLOS ONE: identidade por descendência mapeamento de mutações Fundador em Câncer Utilizando alta resolução Tumor SNP Data

Abstract

Os dados de genótipos densas pode ser usado para detectar fragmentos do cromossoma herdadas de um ancestral comum em indivíduos aparentemente não relacionados. Uma mutação causadora da doença herdada de um dos fundadores comum pode assim ser detectado através da procura de uma assinatura haplótipo comum em uma amostra da população de pacientes. Apresentamos aqui FounderTracker, um método computacional para a detecção do genoma de mutações fundador do câncer utilizando tumorais densa perfis SNP. O nosso método baseia-se em duas hipóteses. Em primeiro lugar, o alelo de tipo selvagem frequentemente submetido a perda de heterozigotia (LOH) em tumores de portadores de mutações da linha germinativa. Em segundo lugar, a sobreposição entre os fragmentos do cromossoma ancestrais herdados de um dos fundadores comum vai definir um haplótipo mínima conservada em cada paciente portador da mutação fundadora. A nossa abordagem baseia-se, portanto, sobre a detecção de haplótipos com identidade significativa por descendência partilha (IBD) no interior das regiões recorrentes de LOH para destacar loci genômica prováveis ​​abrigar uma mutação fundadora. Nós validado esta abordagem através da análise de dois conjuntos de dados verdadeiro câncer que identificamos com sucesso mutações fundadores genes supressores tumorais bem caracterizadas. Em seguida, utilizou dados simulados para avaliar a capacidade do nosso método para detectar intervalos IBD como uma função do seu tamanho e frequência. Mostramos que FounderTracker podem detectar os haplótipos de baixa prevalência, com alta potência e especificidade, superando significativamente os métodos existentes. FounderTracker é, portanto, uma ferramenta poderosa para a descoberta de mutações fundadores desconhecidos que podem explicar parte da hereditariedade “em falta” no câncer. Este método está disponível gratuitamente e pode ser usado on-line no site da FounderTracker

Citation:. Letouzé E, Sow A, Petel F, Rosati R, Figueiredo BC, Burnichon N, et al. (2012) identidade por descendência mapeamento de mutações Fundador em Câncer Usando de alta resolução Tumor SNP dados. PLoS ONE 7 (5): e35897. doi: 10.1371 /journal.pone.0035897

editor: Thomas Mailund, Universidade de Aarhus, Dinamarca |

Recebido: 22 de fevereiro de 2012; Aceito: 23 de março de 2012; Publicado em: 02 de maio de 2012

Direitos de autor: © 2012 Letouzé et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este trabalho é parte do programa CIT da Liga Francesa Nationale Cancer Contre le (https://cit.ligue-cancer.net/index.php/en). Este trabalho foi financiado por doações do Instituto Nacional do Câncer du e CNRS (LIA NEOGENEX) para Enzo Lalli; CNPq e CAPES doações para Bonald C. Figueiredo. Este trabalho foi apoiado pela COMETE concessão Programa Hospitalier de Recherche Clinique 3 (AOM 06 179). Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

com o advento das matrizes SNP e sequenciamento de última geração, é agora possível ao genótipo milhões de SNPs em um único experimento, a baixo custo. Isso tornou viável para detectar regiões de DNA herdadas de um ancestral comum em dois indivíduos aparentemente não relacionados. Dois trechos de DNA são disse idênticos por descendência se eles são idênticos devido à ancestralidade comum. A detecção de identidade por descendência (IBD) em populações é considerada uma abordagem muito promissora para o mapeamento de genes de doenças de ligação. Com efeito, as análises de ligação são geralmente efectuadas em pequenas pedigrees contendo indivíduos aparentados. Consequentemente, os segmentos de IBD identificados tendem a ser demasiado longo para delinear zonas focais de interesse com um número restrito de genes candidatos. Por outro lado, extensões de IBD em indivíduos não aparentados raramente abrangem mais do que alguns centimorgans (CM). estudos de ligação de base populacional são, portanto, muito útil para a multa delimitação de loci candidatos [1]. Vários métodos poderosos foram descritos para a detecção de extensões de IBD entre pares de indivíduos, com base em densa [2], [3] ou unphased [4], [5] Dados de genotipagem faseada. Estes métodos são úteis para a detecção de IBD emparelhados, mas mapeamento de ligação de base populacional requer a detecção de regiões genómicas com um excesso significativo de IBD nos casos de doença em relação aos controlos. Dois métodos foram recentemente propostos para a detecção de IBD entre vários indivíduos: a Cadeias de Markov abordagem Monte Carlo (MCMC) [6], e DASH (DASH Associates compartilhados haplótipos) [7], um algoritmo baseado em gráfico que se baseia em segmentos IBD pares inferir grupos de indivíduos do IBD. Uma das principais limitações da MCMC é que ele envolve o cálculo intensa e, por conseguinte, não é adequado para a análise de grandes conjuntos de dados constituídos por perfis SNP de alta densidade. DASH é muito mais rápido, mas só retorna uma lista de haplótipos que são idênticos por descendência em várias amostras. enriquecimento significativo em casos de doença podem, então, ser avaliada através de um teste de associação estatística. No entanto, esta abordagem tem apenas em conta a frequência de haplótipos conservadas, e não o seu comprimento. No entanto, um longo haplótipo, mesmo encontrado em alguns casos, é provável que indicam a presença de uma mutação fundador.

O método é especialmente dedicada para o mapeamento de genes do cancro. Uma característica chave dos cancros é que as células tumorais se acumulam aberrações cromossómicas proporcionar uma vantagem de crescimento durante a progressão do cancro, de tal modo que o genoma do tumor torna-se eventualmente uma versão altamente rearranjado constitutiva do genoma do paciente. Além disso, a localização das alterações somáticas é em parte determinada pela presença de alelos de risco no genoma da linha germinal [8]. Em particular, os pacientes herdar uma mutação da linha germinativa em um gene supressor de tumor frequentemente perdem a sua contrapartida normal em células cancerosas, revelando o fenótipo mutante, como no modelo de dois de Knudson [9]. Assim, mutações germinativas são muitas vezes localizados em regiões de perda de heterozigosidade (LOH). Este recurso é particularmente útil para o mapeamento ligação de genes do cancro. Em primeiro lugar, as regiões de LOH pode ser usado para priorizar a busca de IBD recorrente. Em segundo lugar, quando uma região genómica sofre LOH, apenas um dos dois cromossomas parentais permanece no ADN do tumor, de modo que o haplótipo deste cromossoma é administrada directamente por o perfil de SNP do tumor, sem a necessidade de um passo a eliminação gradual de haplótipos. regiões mínimas de LOH são, portanto, um ponto de partida ideal para a detecção de IBD recorrente em uma amostra da população de tumores.

O nosso método é projetado para detectar mutações associadas ao câncer herdadas de um fundador comum, usando recorrente IBD no mínimo regiões de LOH (Figura 1). Com base no algoritmo de linha germinal [3] para a detecção IBD pares em haplótipos faseados, descrevemos uma abordagem de pontuação que leva em conta tanto a frequência e duração dos segmentos IBD para a caracterização de haplótipos significativamente conservados em um conjunto de amostras de tumores. Nós validar esta abordagem em dois conjuntos de dados de câncer real. No primeiro conjunto de dados, compreendendo tumores adrenocorticais 13 infância do sul do Brasil, nós delinear um haplótipo conservada abrangendo 520 kb ao redor do p.R337H relatado anteriormente

TP53

mutação fundadora. No segundo conjunto de dados, que compreende 30 feocromocitomas e paragangliomas, detectamos uma nova mutação fundadora da

SDHD

gene, presente em apenas duas amostras. Finalmente, mostra com dados simulados que FounderTracker detecta haplótipos conservadas de baixa prevalência com alta potência e especificidade, superando significativamente os métodos existentes.

Resultados

Detecção de haplótipos conservadas em regiões recorrentes de LOH

a nossa estratégia para o mapeamento de ligação de base populacional de mutações fundadores no cancro é ilustrada na Figura 1. uma mutação se espalhando através de uma população é transmitida dentro de um fragmento de cromossomo a partir do ancestral comum, o que torna-se menor de geração em geração, devido à genética recombinação na meiose. Todos os portadores da mutação são, portanto, idênticos por descendência a seu ancestral comum para a região do cromossoma portador da mutação germinal. Além disso, a contraparte do tipo selvagem do gene mutante é frequentemente perdido por LOH em tumores que ocorrem em portadores de mutações da linha germinativa. A nossa abordagem para o mapeamento de mutações fundadores usando dados de matriz assim SNP envolve (i) a identificação de regiões de LOH recorrentes, (ii) reconstruindo haplótipos de tumor nestas regiões, e (iii) à procura de DII recorrente em haplótipos tumorais.

Este diagrama ilustra os princípios subjacentes nosso método. Uma mutação fundadora (estrela vermelha no diagrama esquemático de cromossomos) se espalha por uma população dentro de um fragmento de cromossomo (em vermelho) herdada do fundador ancestral (A). Devido à passagem de overs (linhas tracejadas) entre cromossomos homólogos em meiose, este fragmento de cromossomo é reduzido ao longo de gerações, de tal forma que portadores da mutação (indicado em vermelho), eventualmente abrigar apenas uma haplótipo curta idênticos por descendência (IBD) em torno do gene mutante (B ). Além disso, a contraparte do tipo selvagem de mutações da linha germinativa é frequentemente perdido por LOH em tumores, de tal modo que a mutação fundador tipicamente situa-se dentro de uma região mínima de LOH (C). Como resultado, a mutação fundadora está localizado dentro de um haplótipo conservada em cada portadora de mutação (pico de pontuação IBD), na região mínima de LOH (D).

Com uma sonda alvo cada um dos dois alelos de cada SNP, matrizes SNP são uma excelente ferramenta para a detecção do genoma de LOH, e vários algoritmos foram descritos para esta finalidade [10], [11]. Neste estudo, utilizamos o método de impressão Genome Alteração [12] para detectar LOH, definindo um conjunto de regiões recorrentes de LOH em função da sua frequência no conjunto de dados tumor.

Em seguida, reconstruir o haplótipo de o alelo retida em cada tumor (Figura 2). Como apenas um dos dois cromossomas permanece no tumor, devido à LOH, os genótipos obtido para o ADN do tumor fornecer directamente o haplotipo do cromossoma retido em células tumorais. Aliás, se o DNA constitutiva também está disponível, uma comparação dos genótipos unphased de ADN constitutiva com o haplotipo do tumor pode ser efectuada para inferir o haplotipo do cromossoma perdido. Para estimar a taxa de erro associado com esta abordagem, foram comparados os haplótipos reconstituídas para dois tumores do mesmo paciente em que o mesmo cromossoma foi perdido por Loh [13], e obteve-se uma taxa de erro muito baixo ( 5 × 10

-5)

os genótipos pode ser inferida a partir de dados da matriz SNP, com a frequência B alelo (BAF), o que caracteriza a relação de fluorescência entre os alelos a e B em cada locus:.

BAF = B /Tablet (

A + B

). No DNA constituinte, cada SNP está presente como dois alelos. O genótipo de cada SNP (AA, AB ou BB) pode, assim, ser determinada a partir da BAF (0, 0,5 ou 1, respectivamente), mas não o haplótipo de cada cromossoma. Em contrapartida, se uma das duas cópias foi perdida por Loh no tumor, o perfil de SNP do tumor reflecte directamente o haplotipo do cromossoma que está retido no tumor. Se amostras de DNA constitutivos e tumorais emparelhados estão disponíveis, o haplótipo do cromossomo perdido pode ser reconstruído, comparando os dois perfis.

Por fim, procurar IBD significativamente recorrente no conjunto de haplótipos tumorais reconstruídos. O oleoduto analítico para esta etapa é representada na Figura 3. Os segmentos de DII emparelhados são primeiro identificadas com o algoritmo de linha germinal [3]. Em seguida, atribuir uma pontuação para cada segmento IBD pares, tendo em conta tanto o número e as freqüências alélicas de SNPs dentro de cada segmento (ver Materiais e Métodos). Uma pontuação IBD é então calculada para cada marcador SNP, pela soma das pontuações de todos os segmentos IBD pares contendo este SNP. desequilíbrio de ligação (LD) também devem ser levados em conta, porque as regiões genômicas de forte LD sistematicamente têm pontuações IBD elevadas (Figura S1). Nós, portanto, comparar, para cada SNP, o IBD pontuação obtida para os tumores com uma distribuição nula de pontuação IBD estabelecida utilizando um conjunto de referência de haplótipos de controles saudáveis ​​(por exemplo haplótipos faseada dos projectos 1.000 Genomas).

O FounderTracker oleoduto para a detecção de IBD recorrente está dividido em duas etapas. Uma pontuação IBD é inicialmente calculado para cada marcador SNP no tumor conjunto de haplótipos. A pontuação de IBD é derivado dos segmentos de IBD em pares identificadas com o algoritmo de linha germinal. Ele leva em conta a sua duração e as freqüências alélicas de SNPs dentro de cada segmento. A pontuação IBD para tumores é então comparada com uma distribuição nula estabelecida a partir de um conjunto de dados de referência, para identificar os SNPs com pontuações IBD significativamente mais elevados do que o esperado por acaso.

Aplicação ao caso dos tumores adrenocorticais infância no sul do Brasil

Como uma prova-de-conceito, aplicado pela primeira vez a nossa metodologia para o exemplo de tumores adrenocorticais infância (ACT). Estes cancros raros (0,3-0,4 casos por ano por milhão de crianças com idade inferior a 15 anos) são excepcionalmente prevalente no sul do Brasil (3,4-4,2 casos por milhão) [14], onde são quase sempre ligado a uma mutação germinativa específico de

TP53

(c.1010G a, p.R337H) [15], [16], identificado como uma mutação fundadora [17]. Foram analisados ​​13 casos brasileiros de ACT e seis amostras de sangue combinados em arrays SNP Illumina 370K. Todos os tumores foram encontrados para transportar o p.R337H

TP53

mutação. Utilizou-se o método de impressão Genome alteração para detectar LOH. Este método identificou duas regiões que apresentam LOH em todas as amostras: uma região de 4,4 Mb em 11p15, e de todo o cromossomo 17. Em seguida, usamos FounderTracker para detectar significativamente recorrente IBD nessas duas regiões. Nenhuma região significativo de IBD foi detectada na região 11p15 (Figura S1), mas pontuações altamente significativas IBD foram obtidos para o 17p13 região (q-valor 2,2 × 10

-16). Em particular, a pontuação de pico IBD definida uma região de 520 kb ao redor do

TP53

gene (Figura 4a). análise de haplótipos detalhada revelou que as cópias mutadas retidos nos 13 Tumores exibido um haplótipo idêntico para esta região, ao passo que as do tipo selvagem cópias reconstituídas para os seis doentes com amostras de sangue correspondentes exibidas diferentes haplótipos (Figura 4b). Este segmento IBD recorrente corresponde, assim, ao fragmento cromossomo levando o TP53 p.R337H

mutação herdada por todos os pacientes do fundador comum, que não tenha sido interrompido por cruzamento na linhagem.

a pontuação IBD calculada ao longo cromossomo 17 para o conjunto de 13 infância tumores adrenocorticais (ACT) mostra um pico significativo em 17p13.1 (a). Os aumentos acentuados na curva de pontuação IBD correspondem às fronteiras dos segmentos IBD em cada par de tumores. A região de picos é representado em pormenor no painel B, com os haplótipos dos 13 cópias cromossómicas retidos nos tumores (albergando o mutante

TP53

alelo) e os haplótipos de cópias do cromossoma perdidos por LOH (abrigando um do tipo selvagem

TP53

alelo) reconstruída para os seis pacientes com amostras de sangue normais correspondentes. Os haplótipos de alelos de tipo selvagem são todos diferentes, demonstrando a existência de diferentes haplótipos para esta região do genoma na população analisada. Por outro lado, um haplótipo comum a todos os alelos mutantes se estende por 470 kb a montante e 32 kb a jusante do

TP53

(representada por uma linha vermelha grossa). Este haplótipo conservada corresponde ao fragmento cromossoma portador do TP53 R337H

mutação herdada do fundador ancestral.

O tempo médio de folhetos IBD pares em torno de

TP53

foi 5,4 cm (variando de 0,88 cM a 19 cm, Figura S2). Como segmentos IBD pares são estimados para ter um comprimento de

1 /Tablet (

2n

) Morgans depois

n

gerações (daí

2n

meiose) [ ,,,0],2], isto sugere que o p.R337H

TP53

mutação ocorreu cerca de nove gerações atrás.

Aplicação ao caso dos feocromocitomas e paragangliomas

Pheochromocytomas e paragangliomas são tumores neuroendócrinos decorrente da medula adrenal e dos tecidos paraganglionares simpáticos ou parassimpático, respectivamente. Estes tumores ocorrem no contexto das síndromes herdadas de cancro em ~ 30% dos casos [18]. mutações germinativas associados com feocromocitoma familiar incluem mutações do

RET

,

NF1

,

BVS

,

TMEM127

,

MAX

e genes que codificam proteínas do complexo succinato desidrogenase (

SdhA

,

SDHB

,

SDHC

,

SDHD

e

SDHAF2

). Aqui, aplicamos nossa metodologia para a descoberta de mutação fundadora de um conjunto de 30 pheochromocytomas /paragangliomas de pacientes não relacionados. As amostras foram totalmente caracterizados em termos de mutações da linha germinativa, e analisadas em matrizes SNP Ilumina 610k. análise de LOH revelou dez regiões com frequência LOH acima de 20%, em 1p, 3p, 3T, 6q, 11p, 11q, 17p, 17q, 21q e 22q (Figura 5A, em cima). Por estas regiões, haplótipos de tumor foram reconstituídas a partir dos perfis de frequência B alélica, e analisados ​​com FounderTracker para detectar segmentos de cromossomas conservadas. Esta análise revelou uma região 2,34 cm, com IBD significativa em 11q23.1 (Figura 5A, em baixo). Curiosamente, este segmento de cromossomo contém 32 genes, incluindo

SDHD

, e é idêntico por descendência em duas amostras (HS_048 e HS_158, Figura 5B), que são precisamente as duas amostras em nossa coorte para o qual um c.64C T (p.Arg22X) germinal

SDHD

mutação foi identificada (Tabela S1). Esta constatação demonstra que a p.Arg22X

SDHD

mutações nestes dois pacientes aparentemente não relacionados originam de um único fundador, e ainda validar a relevância do nosso método para detectar mutações fundadores no câncer.

( a) análise LOH revelou 10 braços cromossômicos com frequência LOH 20% em nosso conjunto de 30 feocromocitomas e paragangliomas (superior). Estas regiões foram analisados ​​utilizando FounderTracker para detectar haplótipos conservadas, revelando uma única região significativa em 11q braço cromossoma (parte inferior). (B) Visualização da região significativa identificada no cromossomo 11 com o Integrative Genomics Visualizador [44]. A pontuação de IBD é representado como uma linha azul acima haplótipos tumorais. Os haplótipos são representadas como uma série de linhas verticais de azul e amarelo, correspondendo a SNPs com respectivamente “A” e genótipo “B”, de acordo com a nomenclatura Ilumina. A região significativa detectada por FounderTracker corresponde ao longo haplótipo que é idêntica em tumores HS_048 e HS_158, e resulta em uma pontuação elevada IBD para este segmento. Esta região contém 32 genes, incluindo

SDHD

(indicado em vermelho).

Avaliação do poder do método com dados simulados

Infância ACT é um ideal estudo de caso para o mapeamento de ligação de base populacional. Como esta doença é extremamente rara na ausência do p.R337H

TP53

mutação fundadora, todas as amostras selecionadas através de uma amostragem aleatória de tumores suportar essa mutação. Na maior parte dos contextos, tumores atribuíveis a uma determinada conta mutação fundador para apenas um subconjunto de cancros numa população. Mostrámos com os dados de feocromocitoma /paraganglioma definidos FounderTracker que foi capaz de detectar uma mutação fundador presente em apenas 2 das 30 amostras (7%). Para melhor avaliar o desempenho do nosso método, geramos dados simulados em que introduzidas artificialmente haplótipos conservadas de diferentes comprimentos e frequências. Nós aferido FounderTracker analisando os mesmos dados simulados com o algoritmo DASH, recentemente desenvolvido para detectar grupos de indivíduos que compartilham um haplótipo idêntico [7], que nós adaptado para nossos propósitos (ver Materiais e Métodos). Esta abordagem deu bons resultados com os dados ACT infância set (Figura S3), validando a sua relevância como um método de referência.

Todos os haplótipos conservados em ≥ 50% das amostras foram detectados com sucesso por ambos os métodos (Tabela 1). Ambos FounderTracker e DASH foram capazes de detectar os haplótipos conservados em ≥15% das amostras com boa potência ( 0,9), mas FounderTracker superou significativamente DASH na faixa de freqüência baixa (≤10%) (Tabela 1, Figura 6). As curvas ROC indicam que detecta FounderTracker segmentos IBD recorrentes, com elevada sensibilidade e especificidade para baixo a uma frequência mínima que depende do comprimento de segmentos de IBD. tratos IBD de 5 cm são detectados com boa potência ( 0,9) a partir de uma frequência de 5%, ao passo que segmentos curtos de 1 cm são detectados com o mesmo poder-se apenas com frequências ≥15%. A taxa de detecção falsa, calculada em todas as simulações, foi insignificante para ambos os métodos (respectivamente 8,6 × 10

-3 e 5,4 × 10

-4 de FounderTracker e DASH).

o desempenho do FounderTracker foi avaliada sob diferentes condições, por comparação com o método DASH. A capacidade de cada um método para detectar haplótipos conservadas foi estabelecido como uma função do comprimento de haplótipos (1 a 5 cm) e prevalência (2 a 10% das amostras). Para cada condição, a curva média ROC foi estabelecido através da aplicação de cada método de 100 conjuntos de dados simulados.

Os dados simulados aqui apresentados correspondem ao conteúdo do SNP do beadchip Illumina 1M-Duov3 (1,199,187 marcadores). Para avaliar o impacto do SNP densidade no desempenho do método, foram analisados ​​os mesmos dados simulados, restritas à sola 373,397 SNPs do chip Illumina HumanCNV370-Quad. Embora tenha havido uma ligeira degradação na detecção de haplótipos curtas (0,5 cm), com matriz Illumina CNV370, obtivemos um nível comparável de desempenho com as duas densidades de marcadores (Figura S4). Estima-se que 85% do genoma humano é atravessado por blocos de haplótipos de 10 Kb ou maior em amostras Europeias [19], de modo que a maioria dos SNPs comuns são bem capturado por matrizes de genotipagem todo o genoma contendo 100.000 marcadores ou mais, seja directamente ou através de desequilíbrio de ligação [20]. Os nossos resultados são consistentes com esta figura e fornecem informações importantes sobre a gama de aplicabilidade do nosso método, sugerindo que o poder possível com a atual geração de matrizes está perto da potência máxima do mapeamento IBD.

O tempo de execução de FounderTracker está linearmente relacionado com o número de amostras analisadas e marcadores SNP. Por exemplo, o processamento do conjunto de dados ACT infância (13 amostras, 9.762 SNPs) levou 4 mínimo de 07 segundos, e a corrida mais longa em nossas simulações, para um conjunto de dados de 100 cromossomo 1 haplótipos (80,158 SNPs), levou 2 horas e 48 minutos em um único núcleo de um processador Intel Xeon X5470 Quad-core rodando a 3,33 GHz. No entanto, como notado acima, o pequeno aumento da potência seria de esperar a partir da análise dos dados de SNP mais densos, de modo que a quantidade de dados analisados ​​pode ser constrangido em termos de marcadores, para o conteúdo corrente de SNP de matrizes de alta definição.

Discussão

a maioria dos efeitos fundadores detectados até agora foram revelados por estudos específicos de marcadores polimórficos em torno de bem conhecidas mutações relacionadas ao câncer. Nós introduzimos aqui a primeira abordagem sistemática para a detecção de mutações fundadores em uma base de todo o genoma, a partir de perfis de SNP densas de amostras de tumores

matrizes SNP são amplamente utilizados na investigação sobre o cancro para duas finalidades principais:. A descoberta de risco da linha germinativa variantes de ligação ou associação estudos, e a identificação de rearranjos cromossômicos recorrentes. Os investigadores tipicamente estudar exclusivamente no genoma da linha germinal para os estudos de associação, ou o genoma do tumor para a análise de rearranjos de cromossomas, mas uma análise combinada de alelos de risco e aberrações cromossómicas foi mostrado para ser proveitosa [21]. Neste estudo, foram utilizados LOH para priorizar regiões de interesse para o mapeamento IBD. Uma das limitações dessa abordagem é que outros mecanismos, tais como a mutação ou hipermetilação do promotor, pode inactivar o de tipo selvagem correspondente de um gene mutante na ausência de LOH. No entanto, estudos anteriores mostraram LOH ser um comum “segundo hit” em portadores de mutação germinativa [22], [23]. A nossa abordagem é, portanto, provável que seja relevante em uma grande proporção de casos. Além disso, os haplótipos de alta confiança pode ser inferida a partir de perfis de SNP tumoral em regiões de LOH. detecção IBD pode, portanto, ser levada a cabo com parâmetros rigorosos, tornando o método altamente específico. Finalmente, LOH em um locus do gene de câncer é susceptível de ser mais freqüente em portadores da mutação do que nos não-portadores, como já foi mostrado para o

BRCA

genes [24]. Ao considerar apenas as amostras com um LOH para cada região candidata, que pode, assim, ser capaz de detectar os haplótipos de baixa frequência conservados que não teriam sido detectados como significativa, considerando todo o tumor definido.

No actual abordagem era exatamente concebido para a detecção de mutações sistemática fundador, em cancro, mas o método para a detecção de DASH aglomerados de haplótipos que partilham identidade por descendência poderia ser facilmente adaptado para os nossos objectivos. A diferença entre FounderTracker e DASH encontra-se na caracterização de IBD significativamente recorrente de pares corresponde IBD. DASH identifica grupos de haplótipos conservadas em diversas amostras. Pode-se então testar se um destes haplótipos é significativamente sobre-representados em tumores, em comparação com controlos normais. Uma limitação deste método é que, uma vez aglomerados são identificados, o teste de associação de não ter em conta o comprimento dos haplótipos conservadas. Por outro lado, a abordagem FounderTracker avalia uma pontuação IBD que leva em conta tanto a frequência ea duração dos haplótipos conservados. Como resultado, FounderTracker superou significativamente DASH para a detecção de haplótipos conservados em ≤ 10% das amostras. Isto faz uma diferença importante em termos de aplicações, uma vez que as mutações fundadores são susceptíveis de ser relativamente raro na maioria dos casos. Por exemplo, uma mutação fundadora presente em apenas 5% dos tumores, encontrando-se dentro de um haplótipo conservado de comprimento médio de 5 cm, (como o TP53 p.R337H

mutação no ACT Brasil) será detectado com uma potência de 0,92 versus 0 com FounderTracker com DASH (Tabela 1). Além disso, o haplótipo em torno de

SDHD

, conservada em dois paragangliomas, não é detectado pelo DASH (Figura S5). Outro método existente para a detecção de IBD em vários indivíduos é a abordagem Markov Chain Monte Carlo (MCMC) [6]. No entanto, este método é altamente computação intensiva e os autores descreveram sua aplicação a dados pequenos conjuntos única (máximo de 15 amostras e 1278 SNPs). Quando tentamos aplicar esta abordagem ao nosso conjunto de dados para tumores adrenocorticais infância, o método falhou ao convergir após vários dias. Em contraste, FounderTracker foi capaz de processar o mesmo conjunto de dados em poucos minutos. Concluímos que MCMC não é muito adequado para a análise de dados de matriz SNP de alta definição.

mostram, com dados simulados, o nosso método que pode detectar haplótipos conservadas de pelo menos 0,5 cm de comprimento (Figura S4) . Chapman

et al.

Mostrou que, após 100 gerações de acasalamento ao acaso em uma população crescente, folhetos IBD teria um comprimento médio de 0,6 cm [25]. O nosso método é, portanto, adequado para a detecção de mutações relacionadas com o cancro que apareceram a menos de 100 gerações atrás. Desde FounderTracker depende da distribuição nula de pontuação IBD para identificar haplótipos significativamente conservadas, nós encorajamos fortemente os usuários FounderTracker de usar amostras de referência da mesma ascendência que as amostras de tumor para calcular distribuições nulos. Na ausência de um conjunto de dados de referência do Brasil, foram utilizados os dados CEU do projeto 1.000 Genomas como uma referência para a análise de tumores adrenocorticais, porque a população do estado do Paraná é predominantemente de origem europeia [26].

em termos de frequência, FounderTracker pode detectar, com alta potência, haplótipos conservada em mais de 5% das amostras, dependendo do comprimento dos segmentos de IBD. A proporção de tumores que abrigam uma mutação fundadora em uma amostra populacional aleatória depende principalmente da diversidade genética da população ea prevalência da doença. cancros raros, tais como ACT infância, com uma maior prevalência em uma área geográfica específica são ideais para mapeamento IBD, porque quase todos os casos são devido à mutação fundadora. Em doenças comuns, tais como câncer de mama, mutações fundador de alta frequência foram inicialmente descritas em populações geograficamente ou culturalmente isoladas. Por exemplo, o

BRCA1

e

BRCA2

mutações fundadores foram inicialmente descoberto na população judaica Ashkenazi [27], [28] e na Finlândia [29], respectivamente. No entanto, a análise extensiva destes dois genes em numerosas áreas geográficas, desde então, revelou a existência de mais do que 20 mutações diferentes em regiões diferentes fundadores [30]. Estes resultados sugerem que as mutações fundadores pode ser mais comum do que o actualmente pensava. FounderTracker pode ser usado on-line através de uma aplicação web, eo código-fonte pode ser baixado da nossa página web (https://cit2.ligue-cancer.net/FounderTracker).

Materiais e Métodos

pacientes e ética declaração

Treze pacientes ACT de uma coorte brasileira [31] foram incluídos neste estudo. A aprovação ética para o estudo foi obtido a partir Comitê de Ética do Hospital Pequeno Príncipe (Curitiba, Brasil) e (Comitê de Ética Federal em Brasília, Brasil) CONEP em 2009. Em todos os casos, um dos pais ou representantes legais assinaram um termo de consentimento informado aprovado pelo comitê de ética local. O DNA foi extraído a partir do sangue periférico do tumor e, como previamente descrito [31].

TP53

análise de mutação foi realizada como descrito anteriormente [32].

amostras tumorais de trinta pacientes com feocromocitoma ou paraganglioma da rede COMETE francês, recolhidos pelo Hospital Europeu Georges Pompidou, foram incluídos no este estudo. A aprovação ética para o estudo foi obtido a partir da revisão institucional (CPP Paris-Cochin, janeiro de 2007). Todos os pacientes fornecidos consentimento informado por escrito para a recolha de amostras e análises subsequentes. O DNA foi extraído do tumor tal como previamente descrito [33]. Clínica

NF1

diagnóstico e genética teste para

RET

,

SdhA

,

SDHB

,

SDHC

,

SDHD

e

BVS

foi realizada como descrito anteriormente [33].

SNP hibridação array e pré-processamento

As 13 amostras de tumor adrenocortical foram analisados ​​com Illumina HumanCNV370-Duo v1. 0 chips, que contêm 370,404 sondas, e as seis amostras normais pareados foram analisados ​​com chips v3.0 Illumina HumanCNV370-Quad, contendo 373,397 sondas. Os 30 feocromocitomas /paragangliomas foram analisados ​​com chips v1.0 Illumina Human610-Quad, contendo 620,901 sondas. A hibridação foi realizada por IntegraGen (Evry, France), de acordo com as instruções fornecidas pelo fabricante da matriz. sinais fluorescentes em bruto foram importados para o software BeadStudio Ilumina e normalizados, tal como descrito anteriormente [34], para se obter a razão de log P (LRR) e B frequência alélica (FAB) para cada SNP. page:

https://mathgen.stats.ox.ac.uk/impute/impute_v2.html#download_reference_data.

Assessing

Deixe uma resposta