PLOS ONE: Genome-Wide Procurar por Gene-Gene Interações no câncer colorretal

Abstract

estudos de associação

Genome-larga (GWAS) identificaram com sucesso uma série de polimorfismos de nucleotídeo único (SNPs) associados com o cancro colorectal risco (CRC). No entanto, estes loci de susceptibilidade conhecidos hoje explicam apenas uma pequena fração do risco genético. interação gene-gene (GxG) é considerado uma fonte da herdabilidade em falta. Para resolver isso, foi realizada uma busca em todo o genoma para GxG de pares associados com o risco CRC utilizando 8.380 casos e 10.558 controles na fase de descoberta e 2.527 casos e 2.658 controles na fase de replicação. Nós desenvolvemos um método simples, mas poderosa para a interação testes, que chamamos o risco médio devido à interação (ARDI). Com este método, foi realizada uma busca em todo o genoma para identificar SNPs que mostram evidência para GxG com previamente identificados susceptibilidade loci CRC de 14 regiões independentes. Também realizamos uma pesquisa de todo o genoma para GxG usando o rastreio associação marginal e interação examinando entre SNPs que passam o limite de triagem (p 10

-4). Para a rs10795668 local conhecido (10p14), encontramos uma interação rs367615 SNP (5q21) com replicação p = 0,01 e combinado p = 4,19 × 10

-8. Entre as principais SNPs marginais após a poda LD (n = 163), identificou-se uma interação entre rs1571218 (20p12.3) e rs10879357 (12q21.1) (nominal combinada p = 2,51 × 10

-6; Bonferroni ajustado p = 0,03). Nosso estudo representa a primeira pesquisa abrangente para GxG no CRC, e os nossos resultados podem fornecer uma nova visão sobre a etiologia genética do CRC

Citation:. Jiao S, Hsu L, Berndt S, Bézieau S, Brenner H, Buchanan D, et al. (2012) Genome-Wide Procurar por Gene-Gene Interações no câncer colorretal. PLoS ONE 7 (12): e52535. doi: 10.1371 /journal.pone.0052535

editor: Zhaoxia Yu, da Universidade da Califórnia, em Irvine, Estados Unidos da América

Recebido: 25 Setembro, 2012; Aceito: 15 de novembro de 2012; Publicação: 26 de dezembro de 2012

Direitos de autor: © 2012 Jiao et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. ASTERISK foi financiado pelo Programa de Pesquisa Clínica Hospital (CIF) e apoiado pelo Conselho Regional de Pays de la Loire, o Groupement des Entreprises Françaises dans la Lutte contre le Cancer (GEFLUC), a Associação Anne de Bretagne Genética e da Ligue Régionale contre Cancer le (LRCC). ARCTIC é parcialmente suportado pelo National Cancer Institute, National Institutes of Health através do financiamento atribuído à Secretaria Ontário de Estudos de Familial Câncer Colorretal (U01 CA074783); ver secção CCFR abaixo. ARCTIC também é apoiado por uma bolsa GL2 do Fundo Ontario Research, os Institutos Canadenses de Pesquisa em Saúde, bem como a concessão de Avaliação de Risco de Câncer (CARE) Programa do Instituto canadense Research Cancer Society. TJH e BWZ são destinatários de prémios pesquisador sênior do Instituto Ontário de Câncer Research, através do apoio generoso do Ministério do Desenvolvimento Económico e Inovação Ontario. COLO2 3 é apoiado pelo Instituto Nacional do Câncer (R01 CA60987). CCFR é apoiado pelo National Cancer Institute, National Institutes of Health sob RFA # CA-95-011 e através de acordos de cooperação com os membros do Colon Registro Familiar Câncer e P.I.s. Este genoma wide scan foi apoiado pelo National Cancer Institute, National Institutes of Health por U01 CA122839. O conteúdo deste manuscrito não refletem necessariamente a posição nem as políticas do National Cancer Institute ou qualquer um dos centros colaboradores nas CFRs, nem a menção de nomes comerciais, produtos comerciais ou organizações implica o endosso pelo governo dos EUA ou do CFR. Os seguintes centros CFR Colon contribuíram com dados a este manuscrito e foram apoiados pelas seguintes fontes: Registro Australasian Câncer Colorretal Família (U01 CA097735), Seattle Colorectal Registro Familiar Câncer (U01 CA074794) e Ontário Registro de Estudos de Familial Câncer Colorretal (U01 CA074783) . DACHS foi suportado por concessões do Conselho de Pesquisa Alemã (Deutsche Forschungsgemeinschaft, BR 1704 /6-1, BR 1704 /6-3, BR 1704 /6-4 e CH 117 /1-1), e do Ministério Federal Alemão de Educação e Pesquisa (01KH0404 e 01ER0814). DALS foi apoiado pelo National Cancer Institute, National Institutes of Health, Departamento de Saúde e Serviços Humanos dos EUA (R01 CA48998 para MLS). GECCO é suportado pelo National Cancer Institute, National Institutes of Health, Departamento de Saúde e Serviços Humanos (U01 CA137088) EUA. O financiamento para a digitalização de todo o genoma de DALS, PLCO e WHI foi fornecido pelo National Cancer Institute, National Institutes of Health, Departamento de Saúde e Serviços Humanos (R01 CA059045) EUA. HPFS, NHS, PHS: Os Institutos Nacionais de Saúde apoiou HPFS (P01 CA 055.075, R01 137.178, P50 CA 127003), NHS (R01 137.178, P50 CA 127003, P01 CA 087.969) e PHS (CA42182). MEC é suportado por R37 CA54281, CA033619 P01, e R01 CA63464. PLCO foi apoiado pelo Programa de Pesquisa Intramural da Divisão de Cancer Epidemiology and Genetics e suportados por contratos da Divisão de Prevenção do Cancro, Instituto Nacional do Câncer, NIH, DHHS. As amostras de controlo foram genotipados como parte dos marcadores de câncer genéticos de varredura câncer de Susceptibilidade (MEGC) da próstata, apoiados pelo Programa de Pesquisa Intramural do National Cancer Institute. Os conjuntos de dados utilizados nesta análise foram acessados ​​com a aprovação apropriada através do recurso on-line dbGaP (https://www.cgems.cancer.gov/data_acess.html) através dbGaP número de acesso 000207v.1p1.c1. (Instituto Nacional do Câncer (2009) marcadores de câncer de susceptibilidade genética (MEGC) website dados, https://cgems.cancer.gov/data_access.html; Yeager et al 2007).. As amostras de controlo também foram genotipados como parte do GWAS de câncer de pulmão e tabagismo (Landi et al. 2009). O financiamento para este trabalho foi fornecida através dos Institutos Nacionais de Saúde, Genes, Ambiente e Iniciativa de Saúde [NIH GEI] (Z01 CP 010.200). Os seres humanos que participam no GWAS são derivadas da próstata, pulmão, cólon e Screening Trial ovário eo estudo é apoiado por recursos intramural do National Cancer Institute. Assistência com a limpeza genótipo, bem como com a coordenação geral do estudo, foram fornecidos pelo gene Ambiente Associação de Estudos, Genebra Centro Coordenador (U01 HG004446). Assistência com a limpeza de dados foi fornecido pelo National Center for Biotechnology Information. Financiamento suporte para genotipagem, que foi realizado no Centro Universitário Johns Hopkins para Herdado Disease Research, foi fornecido pelo NIH GEI (U01 HG 004.438). Os conjuntos de dados utilizados para as análises descritas neste manuscrito foram obtidos a partir dbGaP em https://www.ncbi.nlm.nih.gov/gap através dbGaP número de acesso phs000093. PMH foi apoiado pelo National Institutes of Health (R01 CA076366 a PAN). VITAL foi apoiado, em parte, pela National Institutes of Health (K05 CA154337) do Instituto Nacional do Câncer e Instituto de suplementos dietéticos. WHI: O programa WHI é financiado pelo National Heart, Lung, and Blood Institute, National Institutes of Health, Departamento de Saúde e Serviços Humanos dos Estados Unidos por meio de contratos N01WH22110, 24152, 32100-2, 32105-6, 32108-9, 32111- 13, 32115, 32118-32119, 32122, 42107-26, 42129-32, 44221, e 268200764316C. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução polimorfismos

estudos de associação

Genome-larga (GWAS) identificaram com sucesso de nucleotídeo único (SNPs) associados com o cancro colorectal (CRC) [1] – [10]. Como candidatos biológicos, essas conclusões têm melhorado nossa compreensão da etiologia genética da CRC. No entanto, o loci encontrados até agora explicar apenas uma pequena fração do risco genético: o problema “faltando herdabilidade” [7]. Entre outras explicações, a falta de um exame abrangente de interação gene-gene (GxG) é muitas vezes considerado como uma possível fonte para a herdabilidade inexplicável [11] – [14]. Um estudo recente sugere também que o problema herdabilidade faltando poderia ser devido à superestimação de aditivo herdabilidade se a suposição de que não há GxG ou interação GxE está incorreta [15]. O teste padrão para GWAS associação é a utilização de uma abordagem de local único, testando um SNP de cada vez ao longo de todo o genoma; No entanto, o mecanismo genético subjacente de uma doença complexa, como a CRC, provavelmente envolve interplays entre múltiplos loci. Testando cada locus individualmente, sem considerar outros locais com os quais podem interagir pode perder verdadeiros efeitos genéticos. Em comparação com a abordagem de loco único, tem havido muito poucos exames do genoma de GxG, provavelmente, pelo menos parcialmente, devido à disponibilidade limitada de nível individual em larga escala de dados GWAS e dificuldades analíticas e limitações no cálculo dado o grande número de possíveis interações. Um estudo do genoma da psoríase relatou evidências convincentes para uma interação entre variantes no

HLA-C

e

ERAP1

loci [16]. Outro estudo identificou uma GxG entre um local previamente identificado

C1orf106 e jogue um novo lócus

TEC

para a doença de Crohn, com a interação replicado com sucesso em um conjunto de dados independente [17]. Até agora, nenhum GxG foi identificado para CRC.

Neste artigo, vamos nos concentrar na GxG testes de pares de CRC usando dados GWAS em Genética e Epidemiologia do Câncer Colorretal Consortium (GECCO) e do cancro do cólon Registro familiar (CCFR) com um tamanho de amostra total de 10.907 casos e 13,216 controles. Nós apresentamos um método simples, mas poderosa para a interação de testes: o risco médio devido à interação (ARDI). Foi realizada uma busca em todo o genoma para identificar SNPs interagindo com previamente identificados susceptibilidade loci CRC em 14 regiões independentes (rs6687758 /1q41, rs10936599 /3q16.2, rs16892766 /8q23.3, rs6983267 /8q24, rs10795668 /10p14, rs3802842 /11q23, rs7136702 /12q13.13, rs4444235 /14q22.2, rs4779584 /15q13, rs9929218 /16q22.1, rs4939827 /18q21, rs10411210 /19q13, rs961253 /20p12.3, rs4925386 /20q13.33) [1] – [10]. Demos prioridade a estes loci de susceptibilidade conhecidos por terem sido confirmada a ser associada com o risco de CRC em estudos anteriores. Também realizamos uma pesquisa de todo o genoma para o par-wise GxG. A fim de aliviar a carga computacional e reduzir o número de comparações múltiplas, foi utilizado triagem associação marginal e examinou somente interações de pares entre os SNPs passagem que tela.

Resultados

GXG para 14 conhecido CRC susceptibilidade Loci

Depois de aplicar os critérios de CQ e de selecção, houve um total de 2,011,668 SNPs em comum entre os estudos em estudos de Fase I (Materiais e Métodos; Tabela 1).

Foram selecionados interações que têm de efeito fixo meta-análise de valores de p 10

-6 na Fase I para a replicação na Fase II. Estas interacções estão resumidos na Tabela 2. Para SNPs que estão em LD (r

2 0,8), relatamos apenas o mais significativo interagindo SNP. No geral, identificou 12 interações com p 10

-6 na Fase 1, incluindo três SNPs que interagem selecionados para cada um dos rs6687758 loci conhecidos, rs4925386; dois SNPs interagindo selecionados para rs7136702 do locus conhecidos, e uma interação SNP para cada um dos rs4779584 conhecidos de locos, rs10795668, rs9929218, e rs961253, respectivamente.

Dentro de Fase II, a interação entre rs10795668 loci conhecidos e rs367615 mostrou evidência de replicação (OR = 0,76, IC de 95% 0,61-0,95, p = 0,01) com uma fase combinada I e II ou de 0,74 (IC de 95% 0,67-0,83, p = 4,19 × 10-8). rs367615 está localizado em 5q21 e tem um MAF de 0,22 na população CEU. inclusão adicional de dois estudos de adenoma colorretal avançado no estudo de replicação reforçou ainda mais o nível de significância estatística da replicação (OR = 0,78 e 8,97 × 10

-3); OR e p-valor para a Fase I, II e estudos adenoma avançados combinados são 0,75 e 2,88 × 10

-8. rs10795668 foi genotipados em 10 estudos e imputados em 11 estudos com média de imputação R

2 de 0,97 (intervalo 0,92-1,00); rs367615 foi genotipados em 4 estudos e imputados em 17 estudos com média R

2 de 0,98 (intervalo de 0,91-1,00). O enredo da floresta que mostra resultados de estudo individual é apresentado na Figura 1. Não foi observada evidência de heterogeneidade e efeitos aleatórios resultados são semelhantes aos resultados de efeitos fixos para essa interação. A Figura 2 mostra o gráfico associação regional. Vários parceiros LD de rs367615 também mostram evidências de interação com rs10795668.

tamanhos de caixa são proporcional ao inverso da variância para cada estudo e as linhas representam os intervalos de confiança. Os losangos representam os resultados de efeitos fixos de meta-análise, com a largura de o diamante representa o intervalo de confiança. Os resultados de dois estudos adenoma avançados (HPFS Adv ADNM e NHS Adv ADNM) são mostrados na parte inferior, mas não incluídas na meta-análise.

O eixo y esquerda mostra o -log10 do meta-análise de valor interacção p. O eixo dos Y à direita mostra a taxa de recombinação. Cada ponto no gráfico representa o resultado de um SNP. O ponto diamante representa rs367615 SNP e os pontos redondos representar outros SNPs. cores da diferença de SNPs indicam diferente força LD entre o SNP e rs367615 correspondente, medido pelo r

2. A parte inferior da figura mostra os genes na região traçada.

Nós também examinou o padrão de interação de dois locus para o par SNP descrito acima usando um modelo irrestrito. Tabela 3 (a) sintetiza o tamanho ou a amostra e para cada combinação genótipo em relação aos genótipos de referência para a Fase I e II estudos combinados. Tabela 3 (b) e Tabela 3 (c) sintetizar o OU para cada SNP estratificada por os genótipos da outra. Na Tabela 3, podemos ver que os indivíduos que carregam AG genótipo para rs10795668 e CT genótipos para rs367615 ter um estatisticamente significativo aumento do risco da doença em comparação com aqueles que carregam genótipos de referência em ambos os loci (rs10795668: GG /rs367615: TT). No entanto, para os indivíduos que carregam AG ou genótipo AA para rs10795668, transportando genótipos CT diminui significativamente o risco de doença. A interação ou também pode ser calculado a partir da tabela. Por exemplo, se não houvesse o efeito de interação, as amostras que carregam GG para rs10795668 e CT para rs367615 teria um risco aumentado em comparação com o grupo de referência (OR seria 1,03 * 1,11 = 1,14). No entanto, eles realmente têm um risco diminuído de forma estatisticamente significativa (OR = 0,87; p = 2,99 x 10

-3) por causa da interacção (OR = 0,76). A interação OR de rs10795668: AG /rs367615: CT, rs10795668: AG /rs367615: CC, rs10795668: AA /rs367615: CT e rs10795668: AA /rs367615: CC na Tabela 3 (a) pode ser facilmente calculado ser 0,76, 1,01 , 0,60 e 0,89, respectivamente. Isto parece um padrão de interação incomum. No entanto, é interessante notar que o tamanho da amostra é relativamente pequena quando o genótipo de rs367615 é CC e, como resultado, todos ou estimativas na terceira coluna tem grandes valores de p e amplos intervalos de confiança. Para ter em conta o pequeno tamanho da amostra, e para ajudar na interpretação, nós re-construída a tabela de interação através da combinação do CT e CC genótipo do rs367615 ea AG e os genótipos AA de rs10795668. Tabela 3 (d) mostra que os genótipos CT /cc de rs367615 têm um risco aumentado quando o genótipo GG é de rs10795668. Por outro lado, a combinação de AG genótipo /AA de rs10795668 e CT genótipo /CC de rs367615 tem um efeito protetor.

Como temos modelo ARDI e irrestrita apto para o topo interação entre rs10795668 e rs367615, seria interessante ver também os resultados do modelo multiplicativo. A interação multiplicativa OR é estimado em 0,83 com p combinada = 3,14 × 10

-6, que é menos significativo em relação ao modelo ARDI.

GxG entre os SNPs marginais Top of

Com base em os resultados da meta-análise do estudo de associação marginal para todos, exceto dois estudos adenoma avançados, foram selecionados 606 SNPs para testar GxG com MAF 0,05, média R

2 0,3 e fixos e efeitos aleatórios meta-análise de p 0,0001. Ambos os valores de p de efeitos fixos e aleatórios foram utilizados porque queríamos evitar selecionar SNPs com sinal dominado por alguns estudos. Com este critério de selecção, todos os SNPs escolhidos tinha heterogeneidade valor de p 0,1. Depois de aplicar um-a poda LD rotina (Materiais e Métodos), 163 SNPs permaneceu

Na Fase I, observou-se cinco pares de SNPs com efeito fixo interação meta-análise de valor de p . 5 × 10

-5 (Tabela 4). Estes cinco interacções apontar para 3 descobertas independentes, como indicado por meio da correlação dos dois primeiros SNP (rs2170568 e rs7006896, R

2 = 0,78) e os próximos dois SNPs (rs2200579 e rs10879357, R

2 = 0,75). Na replicação, o GxG entre rs1571218 /20p12.3 e os dois rs2200579 SNPs correlacionados e rs10879357 que estão em 12q21.1 são significativos ao nível de 0,1 (p-valores são 0,04 e 0,06, respectivamente), com RUP interação na mesma direção . A Fase I combinada e análise II OR e valores-p são 0,81 e 4,61 × 10

-6 e 0,80 e 2,51 × 10

-6, respectivamente. A interação entre rs1571218 e rs10879357 passou a correção de Bonferroni com o limiar de 3,79 × 10

-6 = 0,05 /(163 * 162/2). Depois de incluir os dois estudos avançados colorectal adenoma, a replicação ou e valor-p são 0,89 e 0,17 para rs1571218 e rs10879357; análise combinada OR e valor de p são 0,82 e 1,15 × 10

-5. rs1571218 foi bem imputada em todos os estudos com média de imputação R

2 de 0,95 (intervalo ,91-0,98); rs10879357 foi genotipados em 11 estudos e imputados em 10 estudos com média R

2 de 0,78 (intervalo de 0,76-0,80). O enredo da floresta mostra resultados consistentes ao longo dos estudos individuais (Figura 3). Mais uma vez, não observamos heterogeneidade e efeitos aleatórios resultados são semelhantes aos resultados de efeitos fixos.

Tamanhos

Box são proporcionais ao inverso da variância para cada estudo e as linhas representam os intervalos de confiança. Os losangos representam os resultados de efeitos fixos de meta-análise, com a largura de o diamante representa o intervalo de confiança. Os resultados de dois estudos adenoma avançados (HPFS Adv ADNM e NHS Adv ADNM) são mostrados na parte inferior, mas não incluídas na meta-análise.

O padrão de interação de dois locus para rs1571218 e rs10879357 está resumida na Tabela 5 (a). O OR para cada SNP estratificada por os genótipos da outra são resumidos na Tabela 5 (b) e Tabela 5 (c). Na Tabela 5, podemos ver que todas as combinações de referência não estão associados a um aumento do risco de doença em comparação com o grupo de referência. No entanto, devido às interações com associações inversas, os riscos não são tão grandes como eles teriam sido sem interação. Por exemplo, se não houvesse o efeito de interação, as pessoas que carregam AG para rs10879357 e GT para rs1571218 teria um risco mais elevado em comparação com o grupo de referência (OR = 1,12 × 1,18 = 1,32). No entanto, o risco é menor (OR = 1,08) por causa da interacção (OR = 0,82). Calculado como acima, a interação OR de rs1571218: GT /rs10879357: AG, rs1571218: GT /rs10879357: AA, rs1571218: TT /rs10879357: AG e rs1571218: TT /rs10879357: AA na Tabela 5 (a) são 0,82, 0,84, 0,83 e 0,89, respectivamente, o que parece seguir um modelo genético dominante. Tabela 5 (b) mostra a associação nociva com o alelo A do rs10879357 parece ser compensado pelo alelo T do rs1571218. Um padrão semelhante também pode ser observado para rs1571218 na Tabela 5 (c). Isto indica que pode haver uma interação exclusiva entre rs10879357 e rs1571218.

Nós também calculou a interação multiplicativa OR (= 0,94) e p combinada (= 0,08) entre rs1571218 e rs10879357.

Discussão

neste grande estudo, foi realizada uma busca em todo o genoma para GxG pares para cada um dos conhecida susceptibilidade loci CRC e entre os principais SNPs com pequenos valores p para efeitos marginais. Para nosso conhecimento, este representa o primeiro GxG abrangente varredura para o cancro colorectal. A interação mais significativo encontrado em nosso exame de loci conhecidos e outros SNPs em todo o genoma foi entre o rs10795668 conhecido loco (10p14) e rs367615 (5q21) com a replicação p = 0,01 e combinado p = 4,19 × 10

-8. Os tamanhos dos efeitos são muito semelhantes na Fase I e Fase II estudos, e não há nenhuma evidência de heterogeneidade (P

Het = 0,39). Entre os melhores SNPs marginais, a interacção entre a mais promissora foi rs1571218 (20p12.3) e rs10879357 (12q21.1) (p = 2,51 nominal × 10

-6; ajustado p = 0,03). Novamente, os tamanhos de efeito são muito semelhantes na Fase I e estudos de Fase II e há pouca evidência para a heterogeneidade (P

het = 0,74).

O rs10795668 lócus conhecido na nossa interação identificado está localizado em uma região intergénica dentro 10p14. Até ao momento, a função deste SNP não foi claramente definido e não tem sido relacionado com gene (s) específico. Os genes previstos mais próximos dessa região são

BC031880

e

HV455515

e

DD431424

, os dois últimos são recém genes reguladores identificados para

hTERT

, um região genética que contém loci susceptibilidade de vários tipos de câncer diferentes, incluindo o cancro colorectal [9], [18] – [27]. Outros genes por perto são

TAF3

e

GATA3

(~0.6 M pb).

GATA3

pertence à família de factores de transcrição GATA, de que são importantes para o desenvolvimento de células-T.

TAF3

é um

TBP

-associated fator (TAF); estes contribuem para reconhecimento promotor e selectividade e actuam como factores anti-apoptóticos [28]. rs10795668 também foi encontrada para ser correlacionada com a expressão de

ATP5C1

[29], que está envolvida no metabolismo celular. rs367615 está localizado numa região intergénica dentro 5q21, onde existe um membro da via de sinalização Wnt (

APC) que se sabe ser importante tanto na cancro colorectal familiar e não familiar, bem como

MCC

, talvez também importante no CRC [30], [31]. Os genes mais próximos de rs367615 são

PJA2

,

MAN2A1

e

FER

.

PJA2

é responsável pela ubiquitinação do tipo proteína quinase dependente de cAMP I e tipo II-alpha /beta subunidades reguladoras e para a segmentação-los para a degradação proteossómica [32].

PJA2

foi encontrado para se ligar a enzima de conjugação de ubiquitina

UbcH5B

[33], que funciona na ubiquitinação da proteína p53 tumor-supressor.

FER

regula a adesão célula-célula e medeia a sinalização a partir da superfície da célula para o citoesqueleto através de receptores de factores de crescimento.

MAN2A1

é uma enzima de Golgi importante no processamento de N-glicanos [34]. Após a análise bioinformática adicional, identificamos dois candidatos funcionais potenciais, rs2201016 e rs2201015, que estão em forte LD com rs367615 (r

2 valores de 1 e 0,916, respectivamente). Como mostrado na tela Browser UCSC Genome (Figura S2, Tabela S2), rs2201016 e rs2201015 cair dentro de uma região de forte hipersensibilidade DNAse e conservação evolutiva. Como mostrado na Tabela 3 (a), a interacção parece ser dirigida pelo grupo de CT rs367615, o que é um fenómeno incomum e pode estar relacionada com vantagem heterozigoto. No entanto, o genótipo heterozigótico alelo menor (CC) é relativamente rara, tornando difícil estimar o tamanho do efeito conclusivamente em que genotipados. Embora ambos os SNPs apontam para genes potencialmente relevantes envolvidos no desenvolvimento do câncer, avanço da investigação fundamental e traduzir esses achados GWAS para benefício clínico exigirá caracterização funcional adicional através de

in vitro

e

in vivo

análise.

Foi observada uma interação estatisticamente significativa entre rs1571218 /20p12.3 e rs10879357 /12q21.1 (e uma interação marginalmente significativa com por uma estreita e correlacionados SNP, rs2200579). Os rs1571218 SNP está na mesma região (20p12.3) e modestamente correlacionados (r

2 = 0,56), com as conhecidas rs961253 locus de CRC. O gene mais próximo é o osso proteína morfogenética 2 (

BMP2

), que faz parte do transformador de crescimento da via do factor-beta (TGF-β). A via de TGF-β desempenha um papel importante na proliferação de células, a diferenciação e a apoptose [35] e está estabelecido como sendo importante em CRC [36]. Dois interagindo rs2200579 e rs10879357 SNPs estão juntos ( 4 k bp de intervalo) em 12q21.1 e estão correlacionados (r

2 = 0,76). Estes SNPs cair na região intrónica de

TPH2

, que é um enzima limitante da velocidade na síntese da serotonina [37]. A serotonina é conhecida por estar envolvida em numerosas actividades do sistema nervoso central. Há também evidências de que a serotonina é mitogénico em diferentes linhas celulares de cancro [38] – [40]. Um estudo demonstrou que a falta de serotonina, provoca uma redução do crescimento do tumor num modelo de ratinho de aloenxertos do cancro do cólon [41]. Outras análises de bioinformática revelou que rs10879357 está em LD (r2 = 0,697) com um sinónimo de codificação SNP (rs4290270) na região exônico no final da cauda de TPH2. Além disso

in vivo

ou

in vitro

análise é necessária para determinar se esta variante tem um impacto funcional tal como a estabilidade do mRNA. Porque rs2200579 e rs10879357 estão em um gene região rica, é também possível que os genes de impacto SNPs que não sejam

TPH2

.

Neste trabalho, estudos foram divididos em Fase I e II de acordo com a o tempo seus dados de genótipos se tornou disponível. Fase II foi o esperado para servir de validação /replicação da Fase I. Para a pesquisa GxG loci conhecido, o valor p de Fase II e entre rs10795668 rs367615 é de 0,01, que é nominalmente significativo ao nível de 0,05, mas não passa o limiar de Bonferroni ( 0,05 /12). Entre as principais SNPs marginais, o valor-p Fase II entre rs1571218 e rs10879357 também não passa o limiar de Bonferroni (0,05 /5), mesmo quando o p-valor combinado passa o limiar de Bonferroni (3,79 × 10

-6 = 0,05 /(163 * 162/2)). De facto, o teste combinado foi recomendada em duas fases GWAS porque o teste de replicação foi mostrado ser menos eficaz comparado ao teste combinado [42]. Portanto, o tamanho de amostra maior é necessária para chegar ao poder suficiente para replicar nossos resultados.

Os adenomas são lesões precursoras bem conhecidos de câncer colorretal. Assim, nós investigamos se as interações observadas para câncer colorretal, também são vistos em adenomas colorretais avançadas. Os nossos resultados sugerem que a interacção entre rs10795668 e rs367615 está presente nos adenomas avançada, o que sugere que as variantes genéticas podem actuar mais cedo no desenvolvimento do cancro colo-rectal. Em contraste, não foi observada a interação entre rs1571218 e rs10879357 em adenoma avançado, o que pode sugerir que as variantes genéticas agir numa fase posterior de desenvolvimento de câncer. No entanto, os resultados devem ser interpretados com cautela, como o número de adenomas é relativamente pequeno ( 1000 casos).

Na análise de associação marginal, o modelo mais comumente utilizado é o modelo log-aditivo, onde o genótipo é codificada como 0, 1 ou 2 (com base no número de alelos de contagem). Por conseguinte, é natural para utilizar o mesmo código genético num modelo de interacção de dois lócus para testar GxG. No modelo de interacção, o efeito da interação é modelado pelo produto dos genótipos de dois SNPs. Como se pode ver na Tabela 6 (a), este modelo de interacção assume que a interacção quando ambos os SNPs tem o genótipo homozigoto (= 2) é de quatro vezes tão grande como quando ambos os SNPs tem o genótipo heterozigótico (= 1). Em outras palavras, este modelo assume na Tabela 6 (b), o qual é uma suposição forte. Na verdade, podemos ver que o padrão de interação na Tabela 3 (a) não é consistente com essa hipótese. Alguns cálculos simples demonstrar que = log (0,89), que na verdade representa um tamanho de efeito menor em comparação com = log (0,76). Na verdade, nós encontramos na simulação que a violação desta suposição pode resultar em perda substancial de energia (Figura S1). Uma forma prudente, para evitar que levanta uma tal forte suposição é a utilização de um modelo de restrição, que também é um método amplamente adoptada [17], [43]. Usando um modelo sem restrições pode evitar a violação de suposições, mas pode resultar em perda substancial do poder por causa do aumento graus de liberdade (de 1 a 4). Nosso método ADRI usa o mesmo código genético como o modelo log-aditivo para permitir efeitos alélicas para efeitos principais, que também faz o independente teste de interação da análise marginal. Para a interação, o nosso método estima o efeito médio de interacção,,, e. Porque é um efeito médio, é menos propenso a heterogeneidade entre os estudos. Como resultado, o nosso método é mais estável e reprodutível em relação ao modelo irrestrita e log-aditivo. É importante ressaltar que quando o modelo genético subjacente é realmente log-aditivo, ARDI é menos potente em comparação com o modelo de interação regular com codificação genética log-aditivo. Para aplicações futuras, uma técnica de selecção do modelo deve ser desenvolvido para determinar o modelo mais adequado com a menor perda de energia. Outro ponto observando vale é que o modelo de caso-only, que assume independência entre SNPs nos controles, é conhecido por ser mais poderoso do que o modelo combinado de caso-controle durante o teste para a interação gene-gene [44], [45]. No nosso caso, ARDI é um caso-controle abordagem combinada de modo a poder também pode ser impulsionado usando o seu homólogo caso somente. Nós não implementar o único caso-ARDI por duas razões: é relativamente difícil de evitar completamente a violação da suposição de independência (assim manter o tipo I taxa de erro) no modelo de casos somente devido à complexidade da estrutura LD do ser humano genoma, ou seja, de longo alcance LD [46]; Além disso, o pacote disponível atual [47] para a montagem de um modelo de caso apenas com co-variáveis, só se aplica SNPs genotipados enquanto nossos dados incluem dosagens imputados. Como um trabalho em curso, estamos a desenvolver um pacote que pode caber modelo de caso somente por dois SNPs imputadas durante o ajuste para co-variáveis.

GxG é geralmente definida como a partida de efeitos principais [13] . Portanto, se os efeitos principais subjacentes não são especificadas correctamente, os principais efeitos residuais pode ser incorporado como parte do efeito de interacção no modelo estatístico [48]. Como resultado, a interação testar avalia implicitamente o principal efeito e interação efeito residual conjuntamente. Nós mantemos os principais efeitos como log-aditivo na ARDI, principalmente porque nós queremos ser consistente com o modelo log-aditivo habitualmente utilizado na análise de associação marginal de modo que o teste ARDI é independente da análise marginal. Estudo de Saúde das Enfermeiras (NHS); https://cleo.whi.org/researchers/Documents%20%20Write%20a%20Paper/WHI%20Investigator%20Short%20List.pdf.

Deixe uma resposta