PLOS ONE: Identificação de uma variante Regulatory Potencial para Colorectal Mapeamento de Risco de Câncer no cromossoma 5q31.1: Um Estudo de Pós-GWAS

Abstract

em larga escala estudos de associação do genoma (GWAS) estabeleceram cromossomo 5q31.1 como um locus de susceptibilidade para o cancro colorectal (CRC), que ainda foi a falta de variantes genéticas causais. Foram pesquisados ​​polimorfismos potencialmente reguladoras de nucleotídeo único (SNPs) na região de sobreposição entre desequilíbrio de ligação (LD) bloco de 5q31.1 e elementos reguladores previstos por modificações de histonas, em seguida, testaram sua associação com a CRC através de um estudo caso-controle. Entre três candidatos variantes comuns, encontramos rs17716310 conferido significativamente (modelo heterozigoto: OR = 1,273, intervalo de confiança de 95% (IC 95%) = 1,016-1,595,

P

= 0,036) e marginalmente (modelo dominante: OR = 1,238, IC 95% = 1,000-1,532,

P

= 0,050) aumento de risco para CRC em uma população chinesa, incluindo 695 casos e 709 controles. Esta variação foi sugerido para ser reguladora alterando a atividade de potenciador que controlam

PITX1

expressão. Usando a informação epigenética, como cromatina imunoprecipitação-seqüenciamento (ChIP-seq) de dados pode ajudar os pesquisadores a interpretar os resultados de GWAS e localize variantes causais de doenças em pós GWAS-era

Citation:. Ke J, Lou J, Chen X, Li J, Liu C, Y Gong, et al. (2015) Identificação de uma Variant Regulatory Potencial para Colorectal Mapeamento de Risco de Câncer no cromossoma 5q31.1: Um Estudo de Pós-GWAS. PLoS ONE 10 (9): e0138478. doi: 10.1371 /journal.pone.0138478

editor: Yifeng Zhou, Faculdade de Medicina da Universidade de Soochow, CHINA

Recebido: 24 de junho de 2015; Aceito: 29 de agosto de 2015; Publicação: 18 de setembro de 2015

Direitos de autor: © 2015 Ke et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Disponibilidade de dados: Todos os dados relevantes estão dentro do papel e seus arquivos de suporte de informação

Financiamento:. National Natural Science Foundation da China (NSFC-81402744) para JG. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

na China, o cancro colorectal (CRC) é o quinto câncer mais comumente diagnosticado em homens ea terceira em mulheres, com uma estimativa de 310,244 novos casos e 149,722 óbitos ocorridos em 2011 [1]. Fatores de risco para CRC incluem dieta, sedentarismo, obesidade, fumar e beber [2, 3], e está bem estabelecido que fatores genéticos também desempenham um papel importante na etiologia da CRC [4, 5]. Até agora, estudos genômicos de associação (GWAS) e pesquisas de mapeamento finas identificaram mapeamento variantes de risco para mais de 30 loci susceptibilidade independente da CRC em europeus e asiáticos [6-20]. No entanto, a vasta maioria destas variantes residem nas regiões intergénicas e intrónicas, e o mecanismo biológico mais provável que os liga a doença é reguladora [21].

Acumulando evidência mostrou que não codificadora de variantes genéticas associadas a risco loci poderia exercer um efeito sobre a expressão do gene através da modulação da actividade de elementos reguladores [22], incluindo promotores, intensificadores e silenciadores, isoladores. E várias histonas dos nucleossomas flanqueadoras de tais regiões genómicas foram descobertos para transportar característicos modificações pós-traducionais [23, 24]. Por exemplo, os promotores são normalmente marcados por H3K4me3 (histona H3 trimetilada em lisina 4) e potenciadores por H3K4me1 (histona H3 monomethylated na lisina 4), e, ou, adicionalmente, é marcada por H3K27ac (histona H3 acetilada na lisina 27) por activação de [25- 28]. Hoje, o mapeamento do genoma de histonas modificações realizadas pela cromatina imunoprecipitação-seqüenciamento (ChIP-seq) é amplamente utilizado para prever promotores e potenciadores de [29-32].

5q31.1 foi mapeado pela primeira vez como uma susceptibilidade CRC lócus por Jia et al [17] tanto no Leste asiático e populações europeias, ainda apoiada por um outro estudo genético em larga escala por Zhang et al [20], em asiáticos. O gene provavelmente envolvido

PITX1

(emparelhado como homeodom�io-1) tem sido considerado como sendo um gene supressor de tumor relativa a carcinogénese da CRC [33, 34] e outros cancros [33, 35-38]. No entanto, o mais forte rs647161 polimorfismo risco relatado é da função pouco clara e não em quaisquer sequências conhecido transcritas ou regulamentares. Então, nós argumentou que rs647161 não é o polimorfismo causal único nucleotídeo (SNP) e os SNPs funcionais reais continuam a ser extraído nesta região. Ao mesmo tempo, a identificação de SNPs funcionais que se sobrepõem elementos reguladores específicos de tecido previstos pelo estatuto da cromatina, tais como modificações das histonas, ter representado uma abordagem poderosa para o progresso da associação estatística à funcionalidade e causalidade em pesquisas genéticas-GWAS pós [39-42].

neste estudo, foram analisados ​​dados do chip-seq de modificações de histonas de projecto Encode [29], exploradas variantes potencialmente reguladoras dentro da susceptibilidade locus de 5q31.1, e investigou associação candidatos “SNPs comuns com o risco de CRC através de um estudo caso-controle na população chinesa.

material e Métodos

Os participantes do estudo

Um total de 695 casos de CRC e 709 controles sem câncer foram recrutados de Tongji Hospital de Huazhong Universidade de Ciência e Tecnologia (HUST) entre 2008 e 2011. Todos os indivíduos eram independentes chineses Han étnicas que vivem na cidade de Wuhan e seus arredores. Os critérios de inclusão para casos foram confirmados histopatologicamente CRC sem quimioterapia ou radioterapia, e nenhuma restrição ao sexo e idade. Os controles foram selecionados aleatoriamente a partir de um programas de exame físico no mesmo hospital no mesmo período de tempo que os pacientes foram inscritos, parte do qual também estavam envolvidos em nossos estudos permeáveis ​​[43, 44], e foram adequadamente pareados aos casos em termos de género e idade (± 5 anos). Nisto, os fumantes foram definidos como aqueles que tinham fumado pelo menos um cigarro por dia, durante 12 meses ou mais, em qualquer momento da sua vida, enquanto os não-fumantes foram definidos como aqueles que não tinham. No recrutamento, sangue venoso periférico de 5 ml foram coletadas de cada indivíduo depois de um consentimento informado por escrito foi obtido. Este estudo foi aprovado pelo comitê de etnias de Tongji Hospital da Universidade Huazhong da Ciência e Tecnologia

Seleção de SNPs candidatos

SNPs candidatos neste estudo são identificados como comum freqüência do alelo menor (, MAF 0,05) variantes genéticas localizando na região de sobreposição entre os 5q31.1 do locus e específicos-CRC elementos reguladores marcados por marcas epigenéticas adequadas. Em primeiro lugar, fizemos o download da informação do genótipo de chineses han em Beijing, China (CHB), que foi 500kb a montante ea jusante das rs647161 tagSNP de banco de dados HapMap, e de entrada que dados no HaploView software para obter o desequilíbrio de ligação (LD) bloco de rs647161 com os critérios de

r

2 Art 0,8, que foi definido como o limite de GWAS lócus 5q31.1. Em segundo lugar, adquirimos dados do chip-seq de diferentes modificações de histonas produzidos em duas linhas de células CRC HCT116 e Caco2 do banco de dados UCSC integração com codificar dados (S1 Tabela), depois extraiu-se a extensão dos seus picos de sinal em pé por elementos reguladores, onde se cruzavam dois versões de replicação do mesmo conjunto de dados (intersecção) e unidos todos os conjuntos de dados diferentes (união). Em terceiro lugar, baseando-se no banco de dados dbSNP, nós escolhemos o SNPs com MAF 0,05 em CHB que jazem na região de sobreposição entre o bloco LD acima mencionado e picos. Finalmente, três SNPs, rs2193941, rs17716310 e rs7703385 foram escolhidos como SNPs candidatos para a genotipagem da próxima etapa.

A genotipagem

DNA genômico foi extraído de leucócitos do sangue periférico usando RelaxGene Sangue Sistema DP319-02 (Tiangen, Beijing, China) por referência a instruções do fabricante. Todos os SNPs foram genotipados com o SNP Genotyping Assay TaqMan (Applied Biosystems, Foster City, CA, EUA) em um rápido em tempo real do sistema de PCR 7900HT (Applied Biosystems, Foster City, CA, EUA). 5 amostras% duplicados foram selecionados aleatoriamente para avaliar a reprodutibilidade para controle de qualidade, com uma taxa de concordância de 100%.

Análise Estatística

O teste t e χ

2 teste foi aplicado a estimar diferenças nas variáveis ​​e distribuições de genótipos entre casos e controles. Hardy-Weinberg (HWE) foi avaliada através da aplicação do χ

2 teste goodness-of-fit nos controles. A força da associação entre cada risco SNP e CRC foi medida pela odds ratio (OR) e seu intervalo de confiança de 95% correspondente (IC 95%). A fim de evitar a suposição de modelos genéticos, heterozigoto, homozigóticos, dominantes, modelos recessivos e de aditivo foram analisados. O poder do teste estatístico de cada SNP foi calculada pela v3.0 POWER (https://www.mds.qmw.ac.uk/stat-gen/dcurtis/software.html). E RUP e correspondente IC de 95%, ajustada por sexo, idade e tabagismo foram calculados por regressão logística multivariada incondicional. As análises estatísticas foram realizadas utilizando v20.0 SPSS (SPSS, Chicago, Illinois, EUA). O potencial gene-ambiente e as interações SNP-SNP foram avaliados por uma análise por pares sob multiplicativos modelos [45] e aditivos de interação [46].

valores P Compra de interação multiplicativa foram calculados usando um termo de interação multiplicativa sob o modelo de regressão logística multivariada no software SPSS. E

valores P Compra de aditivo de interação foram avaliados por um teste de inicialização do bem-of-fit usando Stata v11.0 (Stata Corporation, College Station, TX). Todos

P

valores eram dois lados com os critérios de significância estatística de

P Art 0,05

Resultados

Seleção de SNPs candidatos

A área de GWAS susceptibilidade loci 5q31.1 definimos por LD foi cromossomo 5:. 134.467.220-134.518.445. Depois de um passo de três bioinformática análise, três polimorfismos comuns, rs2193941, rs7703385 e rs17716310 que situado dentro dos picos de dados do chip de modificação da histona-Seq gerados a partir de HCT116 ou Caco2, foram encontrados nos loci acima (Tabela 1).

Características da População

695 casos incidentes e 709 controles pareados por frequência foram incluídos neste estudo. Como mostrado na Tabela 2, a proporção de machos foi de 58,42% em comparação com os casos de 56,42% nos controlos (

P

= 0,449, Pearson χ

2 = 0,570). idade e correspondente desvio padrão médio foi de 60,16 ± 12,26 anos para casos e 59,80 ± 13,18 anos para controles (

P

= 0,598 pelo teste t), e não houve diferenças estatisticamente significativas entre casos e controles em termos de idade distribuição (

P

= 0,305, Pearson χ

2 = 3,625) entre os quatro categorias (≤50, 51-60, 61-70 e ≥71). Como esperado, mais fumantes foram apresentados nos casos do que nos controles (35,25% versus 29,62%;

P

= 0,022, Pearson χ

2 = 5,257), considerando que o cigarro era um bem estabelecida fator de risco para CRC (2).

Análise Associação

Todos os três SNPs, rs2193941, rs17716310 e rs7703385, estavam em HWE (

P

HWE = 0,55, 0,17 e 0,55), eo poder dos testes estatísticos foi de 95,9%, 95,3% e 95,5%, respectivamente. As distribuições genotípicas de polimorfismos investigados foram apresentados na Tabela 3. Na análise de associação, apenas a rs17716310 mostrou associação significativa com o CRC sob o modelo heterozigoto, enquanto os outros dois rs2193941 e rs7703385 SNP apresentada nenhuma evidência estatística da relação ao risco de CRC.

de acordo com modelo de regressão logística multivariada ajustada por sexo e idade, indivíduos com genótipo AC de rs17716310 tiveram um risco significativamente aumentado de CRC (OR = 1,273, IC 95% = 1,016-1,595,

P = 0,036

) em comparação com aqueles com homozigoto AA. Um modelo dominante foi realizada para melhorar o poder estatístico por combinação do AC com CC em um grupo C-transportador (AC além de CC), e mostrou-se que os portadores do alelo C tem um efeito marginal sobre CRC susceptibilidade (OR = 1,238, IC de 95% = 1,000-1,532,

P

= 0,050). No entanto, não há risco significativo de o alelo variante C foi visto no modelo homozigótica recessiva ou aditivo. Quanto rs2193941 e rs7703385, não houve resultados positivos sob todos os modelos genéticos que estudamos.

Análise de Desequilíbrio de Ligação

Mostrado na Figura 1, três SNPs investigados estavam em alta LD uns com os outros ( rs2193941 e rs17716310,

r

2

= 0,89; rs17716310 e rs7703385,

r

2

= 0,97; rs2193941 e rs7703385,

r

2

= 0,90) em nosso estudo. Por outro lado, rs2193941, rs17716310 e rs7703385 foram descobertos para estar em alta LD com as rs647161 tagSNP (

r

2

= 0,83,

r

2

= 0,88,

r

2

= 0,88, respectivamente) na população CHB de 1000 Projeto Genomas Fase 3.

interação análise

Tabela 4 detalhou os resultados da análise de interação entre o rs17716310 SNP promissor e de fumar, onde observamos uma interação significativa (

P

mult = 0,013) em multiplicativo termos. Quando examinamos as interações de pares entre os três variações candidatos, não encontramos resultados positivos, tanto ao abrigo modelo multiplicativo e aditivo (S2 Tabela).

Discussão

No pós-GWAS era , identificando variantes genéticas funcional específico que realmente responde por fenótipo é o principal objectivo e desafio, e elementos reguladores do genoma pode ajudar. Usando marcas epigenéticas obtidos a partir de tipos de células relevantes, procurou SNPs potencialmente funcionais que foram situadas em elementos supostamente reguladoras, e validado sua associação com o CRC em uma população independente.

Neste estudo, através da combinação de GWAS lócus 5q31.1 e as regiões regulatórias promissores previstos por modificações de histonas em linhas celulares de CRC, nós exibido fora três variantes comuns, rs2193941, rs17716310 e rs7703385, em sua sobreposição. Depois foi realizado um estudo de associação em uma população chinesa que contém 695 casos de CRC e 709 controles de saúde, encontramos efeito significativo e marginal de rs17716310, que estava em LD com rs647161 tagSNP e poder interagiu com o tabagismo.

Os resultados levaram -nos a assumir rs17716310 influenciaram risco CRC, alterando a atividade de elementos reguladores que controlam

PITX1

expressão. Encontrando-se dentro de uma região do genoma que apresenta modificações da cromatina e H3k4me1 H3k27ac, rs17716310 é altamente sugerido ser um reguladoras variantes pertencentes a um potenciador activo [47, 48]. Fica a cerca de 107 kb a montante do gene mais próximo

PITX1

, que foi classificado como um supressor tumoral downregulating da via RAS [33], ativando

TP53

[49] e da atividade de sintonia telomerase [ ,,,0],50]. Além disso, menor

PITX1

expressão foi encontrado em amostras de tecido de cancro humanas e linhas celulares [35-37], e associada com fraca sobrevivência em pacientes de CRC [51]. Por outro lado, em uma base de dados on-line HaploReg [52], rs17716310 foi indicado para alterar o motivo de ligação de p300 que funciona como um coactivador de transcrição e de histona acetiltransferase regulação da expressão de genes por remodelação da cromatina [53]. A variante pode alterar o local de ligação de alguns factor (es) de transcrição, e impacto sobre a interacção entre este intensificador e o promotor activa a jusante de

PITX1

, por conseguinte, prejudicar a transcrição e expressão do gene supressor e, consequentemente, facilitar CRC tumorigenicidade e susceptibilidade. Quanto à interação com tabagismo encontradas modelo multiplicativo, pode ser devido às relações entre o estado de fumaça e via RAS,

TP53 Comprar e atividade da telomerase [54-57], em que

PITX1

foi envolvidos. No entanto, a suposição precisa experiências funcionais adicionais a serem verificadas.

A aplicação de informações biofeature epigenética como dados Chip-seq modificação da histona para identificar potenciadores candidatos têm representado uma ferramenta útil para identificar candidatos SNPs funcionais em regiões reguladoras [ ,,,0],58, 59], e bases de dados, tais como UCSC e Encode ter fornecido acesso fácil a grandes quantidades de dados relevantes. Integrando epigentics recém-surgido e epidemiologia molecular tradicional pode ser uma abordagem eficaz para ajudar a interpretação resluts GWAS e descubra variantes causais de doenças em estudos de pós-GWAS. Aplicando estratégia semelhante para outras regiões CRC GWAS deve contribuir para uma compreensão mais profunda do risco de CRC.

Ainda assim, várias limitações deve ser reconhecido aqui. Primeiro, a estratégia de recuperação de polimorfismos candidatos dependia da previsão de dados do chip-seq de duas linhas celulares de CRC, que não foi suficientemente rigorosos para definir elementos reguladores exatas, e não abrangente o suficiente para descobrir todos os SNPs funcionais dentro. Em segundo lugar, o tamanho da amostra do nosso estudo de caso-controle foi relativamente pequeno. Em terceiro lugar, insuficiente informação ambiental e clínica nos restrita a investigar mais as interacções entre o gene e de outros factores. Forth, falta de experimentos funcionais, a realidade biológica sob a associação estatisticamente significativa já relatado é incerto.

Em resumo, descobrimos um SNP provavelmente regulamentar em alta LD com o GWAS tagSNP que está associado com o risco de CRC na população chinesa . pesquisas sistemáticas sobre mais loci susceptibilidade com maiores tamanhos de amostra e de acompanhamento das análises funcionais são necessários para identificar variantes causais e elaborar o mecanismo biológico de etiologia genética.

Informações de Apoio

Tabela S1. conjuntos de dados Chip-seq baixado do UCSC integração de dados Encode

doi:. 10.1371 /journal.pone.0138478.s001

(DOC)

S2 Table. análise de interação entre rs17716310 e rs2193941, rs17716310 e rs7703385, rs2193941 e rs7703385

doi:. 10.1371 /journal.pone.0138478.s002

(DOCX)

Deixe uma resposta