PLOS ONE: Pooled Sample-Based GWAS: uma alternativa de custo eficaz para identificar colo-rectal e cancro da próstata de risco variantes na população polonesa

Abstract

Fundo

O câncer de próstata (PCA) e câncer colorretal (CRC) são os cânceres mais comumente diagnosticados e causas relacionadas ao câncer de morte na Polónia. Até à data, vários polimorfismos de nucleotídeo único (SNPs) associadas à susceptibilidade a ambos os tipos de câncer foram identificados, mas o seu efeito sobre o risco de doença podem ser diferentes entre as populações.

Métodos

Para identificar novos SNPs associados com PCA e CRC na população polonesa, um estudo de associação do genoma (GWAS) foi realizada utilizando conjuntos de amostras de ADN em Affymetrix Genome-Wide Humanos SNP 6,0 matrizes. Um total de 135 pacientes APC e 270 homens saudáveis ​​(PCA sub-estudo) e 525 pacientes com adenoma (AD), 630 pacientes com CCR e 690 controles (AD /CRC sub-estudo) foram incluídos na análise. distribuições de frequências de alelos foram comparados com t-testes e ×

2-testes. Apenas os SNPs significativamente associados com um SNP proxy (

p Art 0,001; distância de 100 kb; r

2 0,7) foram selecionados. marcador de selecção GWAS foi conduzida utilizando Plink. O estudo foi replicado usando coortes períodos de pacientes e controles. A associação com PCA relatado anteriormente e as variantes de susceptibilidade CRC foi também examinada. pacientes individuais foram genotipados utilizando TaqMan SNP Genotyping Assays.

Resultados

O GWAS selecionou seis e 24 novos SNPs candidatos associados com PCA e CRC susceptibilidade, respectivamente. No estudo de replicação, 17 dessas associações foram confirmadas como significativo no aditivo modelo de herança. Sete deles permaneceu significativa após correção para o teste de hipóteses múltiplas. Além disso, 17 variantes de risco previamente relatados foram identificados, cinco dos quais permaneceu significativa após correção.

Conclusão

agrupada-DNA GWAS possibilitou a identificação de novos loci susceptibilidade para CRC na população polonesa. Relatado anteriormente CRC e PCA variantes predisposição também foram identificados, validando a natureza global das suas associações. Outros estudos de replicação independentes são necessários para confirmar significado do loci susceptibilidade candidato recém-descoberto

Citation:. Gaj P, Maryan N, Hennig EE, Ledwon JK, Paziewska A, Majewska A, et al. GWAS (2012) Pooled Sample-base: uma alternativa de custo eficaz para identificar colo-rectal e cancro da próstata de risco variantes na população polonesa. PLoS ONE 7 (4): e35307. doi: 10.1371 /journal.pone.0035307

editor: Kin Mang Lau, da Universidade Chinesa de Hong Kong, Hong Kong

Recebido: 19 de dezembro de 2011; Aceito: 13 de março de 2012; Publicação: 19 de abril de 2012

Direitos de autor: © 2012 Gaj et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este trabalho foi apoiado por uma PBZ-MNiSW-05 /I /2007/01 subvenção do Ministério polonês da Ciência e do Ensino Superior (https://www.nauka.gov.pl/home/). Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

os cancros são altamente heterogéneos distúrbios, poligênicos que surgem em um processo de várias etapas que envolve a seleção de clones celulares sucessivas e resultam da genética, bem como fatores ambientais específicos. No primeiro caso, as duas mutações de elevada penetrância e polimorfismos de baixa penetrância pode determinar os mecanismos de defesa e adaptativos de um paciente contra a exposição a factores carcinogénicos, a determinação da susceptibilidade a esta doença. No entanto, o efeito de determinantes comuns de risco de baixa penetrância é pequeno quando em isolamento, aumentando a susceptibilidade apenas através do efeito cumulativo associado com a ocorrência de múltiplas variantes de risco [1].

A associação entre a freqüência do alelo e suscetibilidade a doença pode ser estudado, concentrando-se em variantes seleccionadas individualmente ou, em vez disso, na posição de mais de um milhão variantes de ADN, utilizando o polimorfismo de um único nucleótido tecnologia de microarray (SNP). plataformas de microarrays utilizados por estudos de associação do genoma (GWAS) representam uma tecnologia relativamente madura, que permite a digitalização de todo o genoma para detectar possíveis associações com doença sem conhecimento prévio da sua posição ou função biológica. Em teoria, como uma consequência do desequilíbrio de ligação (LD) entre os SNPs em determinado locus, uma elevada proporção de toda a diversidade pode ser capturado por genotipagem de um subconjunto relativamente pequeno de marcadores (SNPs assim chamada codificação) [2] – [5 ].

até o momento, mais de 1.000 susceptibilidade loci, geralmente de pequeno efeito ou modesta e precisão de baixa a moderadamente alta, foram identificados por GWAS [6]. No entanto, cada um destes estudos, incluindo mais de 50 GWAS realizado com pacientes com câncer, identificado apenas algumas variantes de risco quando analisados ​​separadamente. Além disso, muitos estudos não foram replicados [7], [8]. As dificuldades na identificação dos factores de risco associados às doenças genéticas heterogéneas e poligênicos, tais como os cancros esporádicos, pode ser explicado pelas limitações da metodologia. Comercialmente disponíveis plataformas de matriz de SNP foram optimizados para estudar doenças ou traços com base no pressuposto de que as doenças comuns estaria associada com variantes comuns [9]. Uma vez que os loci com um tamanho de alto efeito, foram eficientemente removidos da população humana por selecção natural, a identificação de um locus de susceptibilidade polimórfica comum fortemente associada com uma doença, com a razão de probabilidade (OR) ao longo de 2 [10], é improvável. Mesmo que a identificação de SNPs de alelo de baixa frequência (MA) menor têm melhorado com a utilização de aparas de última geração, e densidades de sonda mais elevados permitiu o estudo de variantes com um baixo grau de heterozigosidade, a detecção de variantes raros permanece altamente exigente em termos de poder estatístico [7], [8], [11] – [14].

o câncer de próstata (PCA) e câncer colorretal (CRC) são os tipos mais comuns de câncer na população polonesa, eo principal causa de morbidade e mortalidade [15] relacionada ao câncer. A maioria dos CRCs são esporádicas, e apenas uma pequena proporção ocorre no decurso de altamente penetrantes síndromes hereditárias, tais como a síndrome de Lynch, polipose adenomatosa familiar e outras síndromes polipose mediadas por mutações da linha germinativa raras no gene de DNA mismatch reparação e na polipose adenomatosa coli (

APC

) gene [16]. CaP predisposição mediada através de mutações raras em alguns genes candidatos, tal como o

BRCA2

, também explicar a menos de 10% do risco familiar relativamente [17]. Portanto, é possível que uma proporção substancial do risco de câncer hereditário é explicado por uma combinação de variantes de baixa penetrância comuns de efeitos modestos. Por exemplo, a variação genética em 14 e 21 loci susceptibilidade independente, validados em populações independentes, pode explicar cerca de 8% e 13,5% do risco de desenvolver herdabilidade CRC e PCA, respectivamente [16], [18]. Estes resultados mostram, no entanto, que a variação hereditária mais associada com o risco de desenvolver qualquer tipo de cancro continua a ser determinado.

Uma análise exaustiva de variantes que conferem susceptibilidade genética a CRC e PCA com base na GWAS não tenha sido realizado em a população polaca ainda. Uma das principais causas para esta falta de estudos é o elevado custo da tecnologia de microarranjo de SNP, especialmente considerando que as novas loci identificados por GWAS têm sido associadas com efeito tamanhos progressivamente mais pequenos, exigindo um aumento do poder estatístico (ou seja, o tamanho da amostra) de GWAS. Uma abordagem alternativa utilizando amostras de DNA reunidas foi desenvolvido [19]. Embora o uso não-padrão de matrizes SNP torna necessário tomar precauções adicionais em conta [19], [20], esta abordagem reduz substancialmente os custos de investigação. É importante ter em conta, no entanto, que uma variação superior técnico associado com a abordagem de pool de ADN podem mascarar as associações mais fracos. Assim, os investigadores têm de trocas comerciais entre a precisão da previsão de risco genético e custo da sua pesquisa.

Neste estudo, descrevemos um GWAS baseada em amostra de DNA em pool como uma alternativa de baixo custo para identificar variantes genéticas de efeito moderado associado com CRC e PCA na população polonesa. As amostras de DNA reunidas foram processados ​​usando a tecnologia de microarray, e GWAS foi empregado como uma abordagem de filtragem variância genética. A validação técnica dos resultados GWAS e os estudos de replicação em amostras de DNA individuais foi realizado utilizando muito mais barato tecnologia de genotipagem baseada em PCR.

Materiais e Métodos

Ética Declaração

Todos pacientes inscritos e os controles eram caucasianos polacos recrutados a partir de duas populações urbanas, Varsóvia e Szczecin. O estudo foi aprovado pelo comitê de ética local (Centro Médico de Pós-graduação Educação e Cancer Center, Varsóvia, Polónia), e todos os participantes forneceram consentimento informado por escrito. O protocolo do estudo está em conformidade com as diretrizes éticas de 1975 Declaração de Helsinki

indivíduos estudados

coortes GWAS compreenderam:. (1. AD /CRC sub-estudo) 525 pacientes (270 mulheres e 255 do sexo masculino) com diagnóstico de adenomas colorretais (AD), 630 pacientes (240 do sexo feminino e 390 do sexo masculino) com diagnóstico de CRC e 705 indivíduos saudáveis ​​(420 fêmeas e 285 machos), e (2. CaP sub-estudo) 285 pacientes do sexo masculino diagnosticados com CaP e 285 homens saudáveis ​​

coortes maiores de casos e controles foram incluídos em um estudo de replicação, incluindo: (1 AD /CRC sub-estudo) 945 (509 fêmeas e 436 machos) pacientes com dA, 889 (352. fêmeas e 537 machos) pacientes com CRC e 2188 (1542 mulheres e 646 homens) indivíduos saudáveis, e (2. CaP sub-estudo) 447 pacientes com PCA e 800 controles homens saudáveis. A média de idade no momento do diagnóstico para a DA, CRC e PCA foi de 60 anos (intervalo: 36-85), 64 anos (variação: 29-89) e 67 anos (variação: 42-83 anos), respectivamente. Os tamanhos de amostra e a distribuição etária de cada grupo são apresentados na Tabela 1.

Allelotyping GWAS

DNA genômico foi extraído de sangue total tratado com EDTA utilizando o Kit QIAamp DNA Mini (Qiagen , Alemanha), seguindo o protocolo do fabricante. Antes de pooling, concentrações das amostras de DNA foram medidos com base em sua intensidade de fluorescência usando Quant-iT ™ PicoGreen dsDNA Kit (Invitrogen, Reino Unido). Para determinar a qualidade de ADN com precisão, a taxa de absorvência /280 nm, 260 nm de cada amostra foi também medida utilizando um espectrofotómetro NanoDrop 1000 (Thermo Fisher Scientific Inc., EUA), e as amostras foram corridas num gel de agarose a 1% para determinar a integridade do DNA visualmente.

amostras de ADN que passaram os testes de controlo de qualidade foram combinados misturando concentrações equimolares de acordo com o doente a diagnosticar obter pools 15-ADN. As amostras de DNA reunidas foram, em seguida, levada a uma concentração final de 50 ng /ul em tampão Tris-EDTA (pH = 8), com concentrações de tampão Tris e EDTA não seja superior a 10 mM e 0,1 mM, respectivamente. No AD /CRC sub-estudo, um total de 35, 42 e 47 pools de DNA foram preparados para AD, CRC e controles, respectivamente, enquanto que no APC sub-estudo, um total de 19 e 19 pools de DNA tanto para APC e controlos, respectivamente. Para reduzir a influência da variação experimental, piscinas de ADN foram subdivididos em técnicas repetições triplas e ensaiaram-se de forma independente, utilizando microarrays separadas, na matriz Affymetrix Genome-Wide SNP humano 6.0. experimentos de microarray de genotipagem e a extração de intensidades de sinal conjunto de sonda foram realizadas utilizando ATLAS Biolabs GmbH (Berlim, Alemanha).

genotipagem individual

Para a validação técnica dos resultados GWAS e para o estudo de replicação, pacientes individuais foram genotipados utilizando TaqMan SNP Genotyping Assays (Life Technologies, EUA), SensiMix ™ II Probe Kit (Bioline Ltd, Reino Unido), e um sistema de 7900HT real-Time PCR (Life Technologies, EUA).

análise estatística – allelotyping GWAS

a intensidade de cada SNP foi calculado como o sinal alelo relativa (RAS) para cada micromatriz, de tal modo que: RAS = a /(a ​​+ B), em que a e B são a sonda definir os valores de intensidade dos alelos a e B, respectivamente, de acordo com a Affymetrix codificação [21], [22]. A intensidade de A e B foi obtido a partir do algoritmo de Affymetrix Birdseed V2. Os valores médios de RAS foram próxima calculada para cada pool de DNA para dar conta das três repetições técnicas. Antes da realização dos testes de associação, a análise de componentes principais (PCA) para todas as matrizes foi realizada com base nos valores de RAS. Piscinas identificados como valores atípicos traçando os dois primeiros componentes principais foram excluídos análises posteriores.

Para detectar diferenças significativas na frequência de alelos entre APC e o grupo controle foi utilizada uma combinação de duas abordagens estatísticas. Em primeiro lugar, as diferenças entre os grupos em RAS foram testados utilizando testes t de Student para ter em variação RAS conta entre piscinas que representam cada grupo [23]. Em segundo lugar, os valores médios da RAS de todas as matrizes no grupo de pacientes e controle foram calculados e diferenças significativas na freqüência do alelo foram testadas usando um χ

2-teste com um grau de liberdade [24]. Uma vez que este teste compara freqüências alélicas médias entre grupos sem levar em conta a elevada complexidade técnica da abordagem allelotyping, que poderia levar a um maior número de resultados falsos positivos e falsos negativos. Por outro lado, os testes t poderia ser demasiado sensível para detectar diferenças entre os grupos se a variação técnica entre piscinas é baixa. Assim, as diferenças na freqüência do alelo pode ser muito pequeno para ser validado por genotipagem individual. portanto, uma abordagem estatística combinada fornece um meio mais precisos para testar diferenças significativas em comparação com cada teste sozinho.

SNPs candidatos para genotipagem individual foram seleccionados através da combinação dos resultados, tanto do t-teste e χ

2-ensaio, utilizando o algoritmo de aglomeração no software v1.06 Plink (https://pngu.mgh.harvard.edu/purcell/plink) [25]. Os loci para os quais não havia um SNP (

P

0,001) e pelo menos um SNP de proxy correlacionados (r

2 0,7) dentro de uma região de 100 kb (

P

0,001, χ

2-teste) foram considerados como resultados positivos. Proxy SNPs foram determinados com base em dados obtidos a partir de LD 4100 indivíduos caucasianos genotipados individualmente a partir de West-Pomerânia na coorte SHIP, usando a matriz SNP Affymetrix Human 6.0 [26], [27]

Análise estatística -. Genotipagem indivíduo

validação técnica desses SNPs candidatos selecionados pelo GWAS-ADN reunido foi realizada por genotipagem individual dos mesmos grupos experimentais. dados TaqMan genotipagem foi submetido primeiro a procedimentos de controle de qualidade, incluindo os limiares para falta completa máxima individual para cada um dos SNPs 0,05, falta completa máximo genótipo para cada um dos indivíduos 0,05 e o desequilíbrio 0,001 para o grupo de controlo . associações candidatos GWAS foram validados usando o alélicas χ

2-teste (software v1.07 Plink). SNPs com

p

-Valores 0,01 foram elegíveis para análises posteriores. Altos níveis de concordância em diferenças de frequência de alelos entre os grupos caso e controle validado a precisão do processo de triagem GWAS, incluindo a construção de piscinas equimolar e a abordagem estatística para seleção de associações SNP candidato.

SNPs Validated GWAS derivados e SNPs seleccionada-literatura (Tabela S1) foram adicionalmente analisados ​​por genotipagem individual na prolongado dC, coortes de CRC e PCA (Tabela 1). O modelo de regressão logística binomial foi usado, utilizando o software R, para investigar associações no contexto do aditivo modelo de ação gênica para todos os indivíduos incluídos no estudo. Uma análise de regressão logística foi também realizado para os pacientes com CaP, para determinar se qualquer um dos SNPs ensaiadas foi associada com início ( 65 anos de idade) CaP início. correção Benjamini-Hochberg foi utilizado para as comparações múltiplas.

A heterogeneidade entre as populações do estudo foi avaliada com o

I

2 e

p

-valor de Q do Cochran estatística. Para meta-análises, em pool-ou valores com intervalos de confiança de 95% (IC) foram calculados usando

meta função

de STATA versão 11. Seu significado foi avaliada pelo teste Z e

p Art 0,05 foi considerado significativo.

resultados

allelotyping-ADN reunido GWAS e validação DNA individual dos resultados GWAS

o GWAS foi realizada utilizando a reunião de amostras de DNA de 15 eo Affymetrix Genome-Wide SNP Humana matriz 6.0. Os seguintes valores atípicos, identificados pelos resultados dessa análise, foram excluídos das análises posteriores: 1) uma associação que representa 15 controles do sexo masculino na AD /CRC sub-estudo e 2) 10 piscinas representando 150 pacientes APC e uma piscina representando 15 controles, no APC sub-estudo. A razão pela qual tantos de CaP piscinas paciente teve de ser rejeitada a partir de uma análise mais aprofundada não é clara. Ela só pode ser especulado que alguma variação pré-analítica, tais como mudanças discretas na qualidade do DNA e /ou hibridação microarray de DNA poderiam afetar os resultados finais das experiências allelotyping.

O pool-DNA GWAS revelou 44 candidato SNPs associado com o AD, CRC ou PCA, dos quais dois foram repetidos em duas comparações não relacionados. Considerando SNP frequências populacionais de 0,2-0,5, o nosso AD /CRC GWAS atingiu uma potência que varia de 98,6% a 99,8% e de 43% para 64% para detectar o tamanho do efeito de OR = 2,0 e 1,5, respectivamente, a α = 1E-03 , estimado de acordo com a Dupont et al. [28] (Figura S1).

Em seguida, os SNPs GWAS-selecionados foram validados por genotipagem de amostras de DNA individuais utilizando TaqMan SNP Genotyping Assays. Cinco candidato SNPs (rs2557030, rs2557227, rs2574608, rs2755895, rs7583683) foram excluídos de análise estatística devido a desvios significativos (

p Art 0,001) a partir do equilíbrio de Hardy-Weinberg detectado no grupo de controle saudável. Embora frequências MA derivados de genotipagem TaqMan desviou ligeiramente a partir dos valores de RAS para MA obtidos no experimento de microarray, houve um acordo no sentido de diferenças (OR) nas frequências de alelos de cada caso e controla grupos como mostrado pela alélicas χ

2-teste (com

P

0,01) para 30 dos 39 SNPs candidatos: 24 associada com dA ou CRC (um SNP, rs6702619, foi identificado em duas comparações separadas) e seis SNPs associado com PCA (Tabela 2).

estudo de replicação para SNPs GWAS-selecionados

a Tabela 1 mostra detalhes demográficos de indivíduos incluídos no estudo de replicação. Quando uma regressão logística foi utilizada para determinar a significância da associação entre os 30 SNPs GWAS-selecionados, usando caso ou controle de como a variável dependente e adequadamente codificadas genótipos TaqMan como variáveis ​​independentes, 17 SNPs foram significativamente (

p

0,05) associada com dA ou em CRC aditivo modelo de hereditariedade (Tabela 3). Sete desses SNPs permaneceu significativamente associado após o ajuste testes múltiplos. O MA de três variantes foi associada com o aumento da susceptibilidade de CRC, que, por quatro variantes MA foi associada com um risco diminuído. Quando as freqüências alélicas entre os casos e controles foram avaliados com o χ

2-teste corrigido

p

-valor, foram observadas diferenças significativas para 13 SNPs (Tabela 3).

a evidência estatística para heterogeneidade entre as frequências de alelos entre os grupos de validação e estudo de replicação foi avaliada pela Q-test

p

-valor. De 30 SNPs GWAS-selecionados, 14 revelaram baixa heterogeneidade geral (

p Art 0,1). Entre eles, associações significativas nos grupos de estudo de replicação eram aparentemente mais frequentes, independentemente da estatística usado para determinar o significado de associação (Tabela 3). A falta de heterogeneidade pode ser considerada como um critério de replicação credível [29]

Seis dos SNPs foram significativamente associados localizados dentro das regiões do gene intrónicas:.

BTBD9

(proteína contendo o domínio BTB /POZ 9),

FAM108C1

(abhydrolase proteínas contendo domínio),

PRKCA

(proteína quinase C α; PKCα),

ADAMTS19

(proteína Adam com motivo de trombospondina, membro 19),

BMP6

(proteína morfogenética óssea 6) e

ARHGAP6

(Rho de proteínas 6 GTPase-activating) (Tabela 3)

estudo. Replication da literatura-selecionados SNPs

Trinta e quatro e nove SNPs adicionais, anteriormente demonstrado estar associado com CRC [16], [30] – [45] e PCA [46] – [62] risco em populações diferentes (Tabela S1), respectivamente, também foram selecionados para os estudos de replicação realizadas com os mesmos grupos alargados de casos e controles (Tabela 1). Um SNP (rs6983267 em 8q24.21) era comum para ambas as localizações de tumores. Um SNP (rs10411210) foi excluído análises posteriores com base no resultado do teste de equilíbrio de Hardy-Weinberg (

P

0,001). Quatro outros SNPs (rs36053993, rs2243250, rs2032582 e rs1057911) também foram excluídos da análise de regressão logística como eles demonstraram, pelo menos, um LD parcial com outros SNPs na mesma região. Por conseguinte, foram atribuídos com SNPs marcação, com base no rácio mais baixo falta completa individual de um SNP eo resultado do teste menos significativo Hardy-Weinberg para os grupos de controlo

.

A associação de 14 variantes selecionados-literatura com AD ou CRC e quatro variantes selecionados-literatura com PCA foi confirmada (

p Art 0,05) no aditivo modelo de herança (Tabela 4). A associação dos rs6983267 comuns SNP foi confirmada tanto para o AD e grupos PCA do pacientes. Surpreendentemente, rs1800894 SNP (

IL10

) foi associado na direção oposta com AD e CRC susceptibilidade (Tabela 4). O MA dos restantes 10 variantes foi associada com um risco aumentado e seis variantes com um risco diminuído de CaP, CRC e /ou AD. Destes 17 variantes, cinco (rs1800894, rs16892766, rs6983267, rs1859962 e rs4939827) permaneceu significativa após correção para comparações múltiplas. Quando as freqüências alélicas entre os casos e controles foram avaliados com o χ

2-teste corrigido

p

-valor, foram observadas diferenças significativas em 11 comparações por sete SNPs independentes (Tabela 4).

Para validar a natureza global dessas associações, entre-dataset heterogeneidade foi testada. Na meta-análise que incluiu três SNPs associados com CRC e quatro SNPs associados com PCA susceptibilidade em nosso estudo de replicação para o qual foram encontradas associações com o mesmo fenótipo em pelo menos quatro outros estudos. Um modelo de efeitos aleatórios foi utilizado para calcular os OR-agrupados valores. Como mostrado na Tabela 5, a falta de heterogeneidade demonstrável (Q

p -valor

de menos de 0,1) foi observada entre os conjuntos de dados que representam três das sete SNPs, e todas reunidas-ORS foram significativas (

p

. 0.001)

para verificar se qualquer uma das variantes estudadas foi associado com uma idade precoce do CaP início, foi realizada uma análise de regressão logística, incluindo apenas os casos, com um indicador de binário para a idade (abaixo ou acima de 65 anos de idade, codificados como 1 e 0, respectivamente) no momento do diagnóstico APC e os SNPs estudados como variáveis ​​independentes. Havia 171 pacientes diagnosticados aos 65 anos ou antes e 247 pacientes com mais de 65. Dois SNPs foram significativamente associados com a idade no momento do diagnóstico PCA (Tabela S2): rs1934636 e rs6983267. O primeiro, um SNP GWAS-selecionado, foi mais frequente no grupo de pacientes mais velhos (OR = 0,6, IC 95% 0,39-0,93,

p

= 2.18E-02), considerando-se o modelo de ação gene dominante . Por outro lado, a variante rs6983267 foi associada com uma idade mais jovem paciente na análise estratificados por idade; OR = 1,40, 95% CI 1,01-1,95,

p

= 4.44E-02).

Discussão

utilitário GWAS à base de DNA reunidas

é geralmente aceite que bem concebido GWAS deve ser realizado com grupos de pelo menos 1.000 pacientes e 1.000 controles, mesmo que os níveis adequados de poder estatístico para testar associações genéticas (em

p Art 5E-08) muitas vezes se relacionam com tamanhos de efeito mais elevadas [14]. Estes limiares de significância GWAS resultar da obrigação de corrigir para comparações múltiplas e visam minimizar o número de resultados falso-positivos [8]. No entanto, os critérios estatísticos extremamente restritivas podem, por sua vez, produzem resultados falsos negativos [11] – [13]. Na verdade, essas associações significativas de estudos de replicação independentes não estavam no top 1.000 SNPs no GWAS inicial [46]. Assim, a utilização de critérios rigorosos podem impedir a detecção de associações subtis e são responsáveis ​​por hereditariedade ausente [14]. É também reconhecido que há certo nível de heterogeneidade nos resultados GWAS, que podem surgir devido aos diferentes antecedentes genéticos (estratificação da população) de populações geograficamente distintas [41], [63], [64], ou por causa da tendência introduzido por efeitos de mistura população [65], [66]. Embora poucos loci susceptibilidade CRC (como 8q24.21, 8q23.3 ou 18q21.1) foram replicados em um número de estudos [41], é sintomático que algumas das associações identificadas reflectem diferenças entre-populações de tumor sub-site , idade de AD início /, sexo ou fumar estatuto CRC dentro dos grupos estudados [41]. Assim, grandes estudos de coorte pode ignorar algumas variantes de risco sub-população-específico, de modo a genotipagem do genoma também deve ser realizado em grupos menores. Por outro lado, estudos com amostras mais baixos normalmente revelam uma fração menor da hereditariedade de uma doença complexa ao não detectar associações que não atingem significância estatística [7].

Uma vez que os resultados finais GWAS dependerá de muitos fatores, cada um associado a um estágio diferente do procedimento experimental, a sua análise e interpretação são muitas vezes um desafio. É essencial para perceber que os resultados reflectem GWAS, na melhor das hipóteses, as diferenças no material genético de casos e controlos utilizadas para análise. Embora isso possa parecer óbvio, enfatiza uma das condições mais fundamentais necessários para uma GWAS bem sucedido. Portanto, os critérios diagnósticos precisos devem ser empregadas para obter grupos homogéneos, como uma distribuição não aleatória de indivíduos com caracteres governados por fortes determinantes genéticos, como as mutações de um único gene, fortemente irá influenciar o resultado final GWAS.

Embora o nosso agrupada GWAS à base de DNA representam estudos com pequeno tamanho da amostra, eles identificaram 30 SNPs significativamente sobre-representadas nos grupos estudados (Tabela 2), os quais foram posteriormente validados por genotipagem TaqMan das amostras de ADN individuais. Os estudos de replicação selecionados 17 variantes de risco candidato associados com CRC, considerando aditivo modelo de herança (Tabela 3). Estas associações não tinha sido previamente relatado. Sete deles permaneceu significativa após correção para o teste de hipóteses múltiplas.

Embora nem todos GWAS-selecionados SNPs susceptibilidade terá uma associação funcional direto com um fenótipo de câncer, uma análise cuidadosa dos resultados GWAS mostrou que esses SNPs localizados em regiões intrônicas ou nos blocos de LD com genes próximos têm um potencial para influenciar o desenvolvimento de câncer (Tabela 3). , vários genes de susceptibilidade notáveis ​​candidato (

PRKCA

,

BMP6

,

ADAMTS19

,

ARHGAP6

,

FUT9 /8

,

FAM108C1

,

CHL1

,

BTBD9

e

WDR52

) estão envolvidos no arranjo do citoesqueleto de actina, adesão celular e motilidade celular processos, que são importantes para invasão de câncer e metástase.

o rs3803820 localizado no

PRKCA

gene (17q24.2) foi selecionado no CRC sub-estudo, mostrando OR = 1,27 (

p

= 2.24E-02). Outro candidato SNP rs13192135, que mostrou um tamanho forte efeito da OR = 0,47 (

p

= 1.07E-02) no grupo masculino CRC, está localizado na 6p24.3 na região intrônica do

BMP6

gene. Da mesma forma, forte associação com tanto AD e risco de CRC, da variante rs4939827 conhecida de

gene SMAD7

foi indicado no presente estudo (Tabela 4). Isto está de acordo com vários estudos anteriores que mostram associação da variação genética nos genes relacionados com a via BMP /Smad com CRC risco [32], [33], [67].

O SNP rs9848984 em 3p26.3 , a jusante até ao fim homólogo de L1 (

CHL1

) do gene, situa-se no bloco de LD envolvendo a extremidade 3 ‘do gene. CHL1 está envolvido no crescimento do cancro e na metástase de vários cancros humanos, incluindo cancros do cólon e da mama [68]. A observação de que ambos os níveis de mRNA e proteína de ARHGAP6 estavam elevados nos tecidos e linhas celulares de CRC sugere que pode servir como um biomarcador para o desenvolvimento e progressão de CRC [69]. Da mesma forma, um elevado nível de metaloprotease

ADAMTS19

expressão foi observada em vários tecidos de tumor e linhas de células [70]. Por sua vez, a actividade FAM108C1 foi mostrado para prever o desenvolvimento de metástases distantes [71].

O SNP rs2799652 foi encontrado na região promotora da alfa- (1,3) -fucosyltransferase (

FUT9

) gene, responsável pela biossíntese do antigénio de Lewis X, um antigénio associado ao cancro expressos preferencialmente em pólipos do cólon pré-malignas [72]. FUT8, por sua vez, é responsável pela modulação da função de E-caderina [73]. Estudos anteriores mostraram que

FUT8

e E-caderina níveis de expressão foram significativamente mais elevadas em amostras de CRC primárias e que E-caderina núcleo fucosilação melhorada a adesão célula-célula do carcinoma do cólon [74]. Ambos

FUT9

ea jusante para

FUT8

variações genéticas foram mostrados para ser associado com o risco de CRC neste estudo (Tabela 3). Curiosamente, o nosso estudo revelou também a replicação associação entre a variação intrônica sequência (rs9929218) no gene da caderina-E (

CDH1

) eo risco de AD, especialmente no sexo masculino (Tabela 4).

replicado associações previamente relatadas entre quatro APC e das variantes de risco 14 AD /CRC em nossas coortes de base polaco-. Quatro SNPs (rs1859962, rs7931342, rs1447295 e rs6983267) foram amplamente divulgados como variantes de risco APC no Europeu, Africano ou populações asiáticas [46], [48] – [51], [55] – [58], e pode ser considerado mundial marcadores de CaP susceptibilidade. No caso de CRC, 11 loci de susceptibilidade foram relatadas muitas vezes em estudos anteriores [41]. Sete destes loci foram replicadas no presente estudo: 8q23.3, 8q24.21, 11q23.1, 15q13.3, 16q22.1, 18q21.1, 20p12.3. Em um estudo de coorte de base sueca, cinco do mesmo 11 loci mostraram uma significativa OR [42]. A falta de confirmação de loci 11q23.1, 16q22.1 e 20p12.3 no estudo sueco pode ter resultado de sua associação com o risco de câncer principalmente em homens, ao contrário da mulher, e /ou porque eles estão associados com AD em vez de CRC risco, como indicado por nossos achados (Tabela 4).

Curiosamente, as análises estratificadas revelou que a associação da variante rs4939827 (18q21.1) limitou-se apenas as mulheres (OR = 0,6; IC95% 0,42-0,88

Deixe uma resposta