PLOS ONE: Múltiplas variantes de risco funcionais em um SMAD7 Enhancer Implicate um Colorectal Cancer Risk Haplotype

Abstract

estudos de associação

Genome-largos (GWAS) de câncer colorretal (CRC) levaram à identificação de um número de variantes comuns associados com o risco modesto. Vários risco variantes mapa nas imediações dos genes da via TGF /BMP sinalização, incluindo rs4939827 dentro de um intrão de

SMAD7

em 18q21.1. Um estudo anterior implicado um romance SNP (romance 1 ou rs58920878) como uma variante funcional dentro de um elemento potenciador em

SMAD7

intron 4. Neste estudo, mostramos que quatro SNPs incluindo novel 1 (rs6507874, rs6507875, rs8085824 , e rs58920878) em desequilíbrio de ligação (LD) com os SNP rs4939827 índice de demonstrar efeitos potenciador específico para o alelo em um grande potenciador, multi-componente de

SMAD7

. Todos os quatro SNPs demonstrar proteína específica de alelo de ligação aos extractos nucleares de linhas celulares de CRC. Além disso, alguns dos alelos associados a risco correlacionar com a expressão aumentada de

SMAD7

em tecidos normais do cólon. Finalmente, mostra-se que o potenciador é responsivo à estimulação BMP4. Tomados em conjunto, propomos que o risco CRC associado a 18q21.1 é devido a quatro variantes funcionais que regulam

SMAD7

expressão e potencialmente perturbar um ciclo de feedback negativo BMP em TGF /BMP vias de sinalização.

Citação: Fortini BK, Tring S, Plummer SJ, Edlund CK, Moreno V, Bresaliser RS, et al. (2014) Multiple Risk Variantes Funcionais em um SMAD7 Enhancer Implicate um Risco de haplótipos câncer colorretal. PLoS ONE 9 (11): e111914. doi: 10.1371 /journal.pone.0111914

editor: Ludmila Prokunina-Olsson, do National Cancer Institute, National Institutes of Health, dos Estados Unidos da América

Recebido: 16 de maio de 2014; Aceito: 01 de outubro de 2014; Publicação: 06 de novembro de 2014

Direitos de autor: © 2014 Fortini et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Data Availability:. O autores confirmam que todos os dados subjacentes às conclusões estão totalmente disponíveis sem restrições. Todos os dados relevantes estão dentro do papel e seus arquivos de suporte de informação

Financiamento:. Este trabalho foi financiado pelos Institutos Nacionais de Saúde (R01 CA143237, CA148107 U19 ao GC). O desenvolvimento científico e financiamento deste projecto foi em parte apoiada pelas associações genéticas e mecanismos de Oncologia (GAME-ON), iniciativa de Pós-GWAS Câncer NCI. O conteúdo é da exclusiva responsabilidade dos autores e não representam necessariamente as opiniões oficiais do Instituto Nacional de Câncer ou o National Institutes of Health, que não teve nenhum papel no desenho do estudo, recolha e análise de dados, decisão de publicar ou preparação do manuscrito

Conflito de interesses:.. Os autores declaram que não existem interesses conflitantes

Introdução

sinalização TGF tem sido associado com câncer colorretal (CRC). Em adição às funções canónicas na regulação de apoptose, diferenciação celular, e o crescimento de células de epitélio intestinal, a sinalização TGF-p é um interveniente importante na resposta imune e doença inflamatória do intestino, um factor de risco para CRC (avaliações [1] – [3] ). TGFp e sinalização de BMP definir os dois ramos principais da via de TGFp. A activação de qualquer um dos ramos leva ao recrutamento de R-SMADs, Smad2 /3, no caso do TGF-p ou Smad1 /8/5 no caso de BMPs, que formam um complexo com SMAD4. Este complexo, em seguida, dirige a transcrição de muitos genes alvo, incluindo

SMAD7

. SMAD7, um inibidor SMAD como SMAD6, por sua vez, serve como um regulador negativo da sinalização de retorno TGF e BMP, para além de actuar como um nó de interferência com outras vias, incluindo TNF [4], [5].

SMAD7 também desempenha outros papéis importantes na etiologia da CRC, tais como interagindo com β-catenina para regular

MYC

expressão e sinalização de Wnt [6].

SMAD7

superexpressão foi visto em algumas células CRC, e redução do

SMAD7

expressão usando RNA anti-senso leva à diminuição da proliferação na linha de células CRC HCT-116 e explantes neoplásicas CRC humanos, e reduziu tumorigênese na APC

min /- rato [7]

CRC GWAS levaram à identificação de várias regiões genômicas associadas ao risco que incluem genes na via de sinalização TGF incluindo

SMAD7.

,

BMP2

,

BMP4

, e

GREM1

[8] – [14]. Isto inclui o polimorfismo de um único nucleótido rs4939827 (SNP), localizado em

SMAD7

intrão 4, o qual foi classificado em vários estudos. Pittman et ai. relataram que um romance SNP (romance denominado um, mais tarde renomeado rs58920878) mapeado para um elemento potenciador que dirigiu a expressão da GFP em

Xenopus

músculos girino e colorectum de uma forma específica do alelo, implicando rs58920878 como uma variante funcional dentro desta região [15].

Alertado por nossa descoberta de múltiplas variantes funcionais dentro da região CRC GWAS a 11q23 [16], nós exaustivamente examinado a região genômica em torno das rs4939827 CRC tagSNP em 18q21.1 para outros SNPs funcionais potenciais. Identificamos 4 SNPs, rs6507874, rs6507875, rs8085824 e rs58920878 (romance 1), numa região de cerca de 2 kb, cada actividade potenciadora específica para o alelo demonstrando. Nós ainda determinado que os alelos correspondente ao haplotipo risco correlacionado com a expressão aumentada de

SMAD7

em tecidos normais epiteliais do cólon. As sequências que abrangem todas as quatro SNPs também ligado às proteínas nucleares a partir de linhas celulares de CRC de uma forma específica do alelo em ensaios de desvio da mobilidade electroforética (EMSAs). Finalmente, mostrámos que o intensificador foi responsivo a sinalização induzida por BMP4 em ensaios de luciferase, enquanto que nem o haplotipo foi responsivo a TGF-p1. Tomados em conjunto, propomos que o risco CRC em 18q21.1 cromossomo é devido às contribuições de 4 variantes funcionais em um potenciador que afetam a expressão de

SMAD7

, levando potencialmente a uma regulamentação perturbada do loop de feedback negativo BMP em BMP /TGF vias de sinalização.

resultados

Região Análise

o rs4939827 índice SNP associado com CRC em 18q21.1 cromossomo está dentro intron 4 do

SMAD7

gene. Há 20 SNPs em LD com rs4939827 com um r

2≥0.2 na população CEU (1000 Genomas Projeto, junho de 2011 release), o nosso limite LD selecionado para os potenciais candidatos funcionais (Figura 1A e 1C). Todos os 21 SNPs se encontram dentro de uma região de 16 kb do

SMAD7

intron 4. A fim de identificar as sequências genômicas regulatórias potencial desta região, os SNPs em LD com rs4939827 estavam alinhados com imunoprecipitação da cromatina e sequenciamento (ChIP-seq ) faixas de metilação e acetilação das histonas marcas associados com estimuladores, H3K4me1 e H3K27ac (Figura 1B). Para este estudo, nós referenciado sigmóide acetilação do cólon H3K27 do Epigenomics Consórcio Roteiro [17], e CRC linhas celulares SW480 e monomethylation HCT-116 H3K4 gerado no nosso laboratório e do projecto CODIFICAR, respectivamente [16], [18], [ ,,,0],19]. Vários picos potenciador potenciais contendo SNPs em LD com rs4939827 foram identificados no cólon sigmóide, SW480, ou HCT-116 células, incluindo uma região 2 kb contendo rs58920878 (listra verde, Figura 1B). A fim de caracterizar a região de forma abrangente, menores picos abaixo do limiar para o software ligando pico também foram clonadas e testadas quanto à actividade se contivessem um SNP reunião nosso LD de corte. DNase I hypersenstitivity faixas do projeto ENCODE também estavam alinhados, mas há picos sobrepostos com qualquer um dos SNPs candidatos em LD com rs4939827 [20], [21].

(A) O

SMAD7

gene representado com coordenadas genômicos (hg19) e a posição dos SNPs em LD (r

2≥0.2, CEU população) com rs4939827 tagSNP. (B) Vista para o navegador UCSC Genome de SMAD7 com SNPs em LD com rs4939827 indicados. faixas Chip-seq para marcas de histonas potenciadoras são cólon sigmóide (SC) H3K27ac de REMC /UCSD para o Epigenomics Consortium Roteiro, SW480 (SW) H3K4me1 e HCT-116 (HCT) H3K4me1 do consórcio ENCODE. DNase I hipersensibilidade faixas HCT-116 (HCT) e Caco-2 abaixo são do conjunto de dados ENCODE UW. A listra verde representa o fragmento potenciador A. listras vermelhas indicam clonados fragmentos B a G (esquerda para a direita), que foram mostradas a falta de actividade potenciadora. Coordenadas para cada fragmento são fornecidos em S1 Arquivo. plot desequilíbrio (C) Linkage para rs4939827, incluindo todos os SNPs em projeto 1KG com r

2≥0.2, criados com Haploview. r

2 = 1- preto, 1 r

2 0.2 – escala de cinza. (D) vista Zoomed de fragmento de uma exibição sub-fragmentos A1-A4. O ENCODE Layered H3K4me1 faixa de 7 linhas celulares é mostrado para identificar picos de tipo específico de célula. (E) haplótipos e percentagens (população CEU) para os 4 SNPs em fragmento A e rs4939827. Haplótipos associados com o alelo de risco rs4939827 T são em púrpura clara.

Actividade Ensaios Enhancer

sete regiões potenciadoras putativos foram clonados num vector de ensaio de luciferase para determinar actividade potenciadora em linhas celulares de CRC HCT-116 e SW480. Apenas o fragmento de 2 kb (faixa verde na Figura 1B) na extremidade 3 ‘de

SMAD7

intrão 4 apresentou actividade nos ensaios, mas apenas na orientação inversa (Figura 2A). Regiões testado, mas sem actividade neste ensaio são indicadas em listras vermelhas no Figura 1B (Figura 2B). A região potenciador de 2 kb, nós prazo fragmento A, contém 4 SNPs em LD com rs4939827: rs6507874, rs6507875, rs8085824, e rs58920878 (romance 1). Uma vista ampliada do fragmento A é mostrado na Figura 1D. Como mostrado na Figura 1C, estas quatro SNPs são em LD (R

2 = 1-0,494) um com o outro e definem 5 haplótipos na população CEU. Estes haplótipos estão apresentados em relação à variante rs4939827 (alelo de risco T) na Figura 1E [22], [23].

(A) a actividade de luciferase relativo de controlo positivo, fragmento A na frente, e o fragmento Um na orientação inversa. colunas de luz indicar atividade no HCT-116, colunas escuras indicam atividade no SW480. (B) Fragmentos de B a G, mostrada na figura 1B como listras vermelhas não mostram actividade potenciadora em qualquer orientação em HCT-116. Os controlos positivos são mostrados para cada grupo de construções analisadas na mesma placa. Fragmento E contém os rs4939827 tagSNP. (C) Actividade de fragmento A na orientação inversa com todos os SNPs no fragmento com o seu alelo C, com cada alelo alterada de forma independente para o alelo alternativo, como mostrado mudança vezes relativamente à construção que contém os quatro alelos C. Todos os quatro alelos resultar em uma redução estatisticamente significativa na atividade: rs6507874 T

p

= 8,25 × 10

-3 (HTC-116)

p

= 3.30 × 10

-2 (SW480); rs6507875 G

p

= 3.40 × 10

-2 (HCT-116),

p =

6,79 × 10

-3 (SW480); rs8085824 T

p =

1,20 × 10

-2 (HCT-116),

p =

3,12 × 10

-3 (SW480); rs58920878 G

p =

2,09 × 10

-3 (HCT-116),

p =

3.05 × 10

-3 (SW480).

em primeiro lugar, testou se existiam quaisquer diferenças específicas de alelo na atividade potenciador para cada um dos SNPs começando individualmente com um fragmento de 2 kb com todos os 4 SNPs contendo alelos C. Enquanto este haplótipo não é visto na população CEU, esta combinação de alelos apresentou a maior actividade potenciadora de todos os fragmentos testados. Foram observadas mudanças específicas de alelo em actividade potenciadora para cada uma das quatro variantes, quando alelos foram alterados por mutagénese dirigida ao local (Figura 2C). Todos os 4 SNPs mostraram uma diminuição na actividade potenciadora quando alelos foram alterados para a forma alternativa. A maior diminuição na actividade foi observado quando rs58920878 foi alterado de C para G. Apesar de os alelos menores para rs6507874 SNPs (t, frequência do alelo menor (MAF) = 0,44) e (G rs58920878, MAF = 0,34) mostraram uma actividade potenciadora inferior, os alelos menores para rs8085824 SNP (C, MAF = 0,34) e rs6507875 (C, MAF = 0,49) mostraram uma actividade potenciadora maior nestes ensaios.

Fragmento a engloba vários picos menores distinta HCT-116 H3K4me1, com mais à esquerda pico específico para HCT-116, quando comparado com o camadas H3K4me1 super-faixa de 7 linhas celulares ENCODE Tier 1 [19] (Figura 1D). Para testar as contribuições relativas destas regiões e SNPs individualmente sobre a actividade geral potenciador, 4 construções menores, A1-A4, foram desenhados (Figura 1D). O fragmento de A1 inclui rs6507874 SNPs e rs6507875 e engloba o pico específico HCT-116. Estes dois SNPs são separados somente por 13 pb, e estão em LD com uma outra com r

2 = 0,794, D ‘= 1. Como mostrado na Figura 3A, a actividade potenciadora fragmento A1 demonstrada. A principal haplótipo de alelos rs6507874 e rs6507875 na população CEU, CG, demonstraram o nível mais baixo de actividade potenciadora em comparação com as outras três possíveis combinações de alelos (Figura 3B). As CT e CC menores haplótipos mostrou cerca de 1,3-1,5 vezes e 2-2,5 vezes maior actividade em ambas as linhas celulares, HCT-116 e SW480, respectivamente (Figura 3B). A combinação de alelos TG, embora não seja um haplótipo CEU conhecido, mostrou menor atividade do que o haplótipo TC. Tomados em conjunto, conclui-se que, embora ambos os SNPs, rs6507874 e rs6507875, contribuir para o nível de actividade potenciadora global do fragmento A1, alelos rs6507875 mostram um efeito específico para o alelo maior do que rs6507874, na direcção consistente com o fragmento de 2 kb (Figura 2C ). Em contraste, o efeito do alelo rs6507874 na actividade potenciadora era dependente que rs6507875 alelo estava presente, sugerindo um efeito contextual dentro dos componentes intensificadores. Estes dados implicam existe uma relação funcional entre os SNPs complexo adjacentes.

(A) O fragmento A foi dividida em 4 fragmentos de ADN menores, A1-A4, representadas na Figura 1D. Cada fragmento demonstrou atividade menor potenciador tanto HCT-116 (barras claras) e SW480 (barras escuras). Para a experiência mostrada, todos os SNPs continha seus alelos C. (B) Actividade de Fragmento A1 contendo rs6507874 e rs6507875, como a mudança vezes em relação ao grande haplótipo CG para HCT-116 (barras claras) e SW480 (barras escuras). O TC haplótipo menor (

p

= 2.25 × 10

-2 (HCT-116),

p

= 8,59 × 10

-2 (SW480)), ea combinação CC (

p

= 5,06 × 10

-5 (HCT-116),

p

= 1,75 × 10

-5 (SW480)) não visto na população CEU mostram uma actividade mais elevada do que a maior haplótipo. Combinação TG (

p

= 0,450 (HCT-116),

p

= 0,287 (SW480)) demonstra uma actividade semelhante à CG. (C) Fragmento A2 contendo rs8085824 mostra 2 vezes maior actividade potenciadora com o alelo menor C do que o alelo principal T (

p =

4,75 × 10

-3 (HCT-116),

p =

3,61 × 10

-4 (SW480)). (D) Atividade de A3 fragmento contendo rs8085824 e rs58920878 em relação ao grande TC haplótipo. O haplótipo menor CG demonstra uma actividade superior ao TC (

p =

2,49 × 10

-2 (HCT-116),

p =

6,32 × 10

-3 (SW480 )). A T (major) alelo rs8085824 mostra a atividade mais baixa do que C (menor) alelo independentemente do alelo rs58920878. A maior atividade é visto em CC haplótipo que não seja relatado na população CEU (

p =

6.35 × 10

-7 (HCT-116),

p =

1,47 × 10

-6 (SW480)). (E) Atividade do fragmento A4 engloba o pico contendo rs58920878. O alelo menor G de rs58920878 mostra dramaticamente menos atividade do que os principais alelo C (

p =

1,92 × 10

-4 (HCT-116),

p =

1,52 × 10

-5 (SW480)). (F) O fragmento A foi testado para a actividade com os dois haplótipos mais comuns (Figura 1E) na população CEU. O haplótipo CGTC mostra maior atividade no HCT-116 (barras de luz,

p

= 1,04 × 10

-11) e SW480 (bares médias,

p

= 8.60 × 10

-11), mas não houve diferença significativa na atividade em RKO (barras escuras).

o fragmento A2 contém rs8085824 SNP e atravessa a região entre os dois picos HCT-116 H3K4me1 mais proeminentes no potenciador a (Figura 1D). Enquanto fragmento A2 tinham actividade por si próprio, que mostrou o menor actividade das 4 sub-regiões testadas (Figura 3A). Quando o alelo rs8085824 foi alterada de T (alelo principal) para C (alelo menor), a actividade aumentou duas vezes (Figura 3C) consistente com os resultados para o fragmento maior (Figura 2C). O fragmento A3 engloba a região de A2 (incluindo rs8085824) e mais 160 pb para incluir rs58920878. Este fragmento mostrou duas vezes mais actividade do que o fragmento A2. A principal haplótipo de rs8085824 e rs58920878 (r

2 = 1, D ‘= 1, CEU) é TC. O haplótipo menor CG demonstrado 1.3 a 1.6 vezes maior actividade do que os principais haplótipo em células HTC-116 e SW480, respectivamente. A combinação alelo CC artificialmente construído tinha o nível mais elevado de actividade testado para o fragmento A3. Comparando-se o fragmento de CC para os fragmentos de haplótipos GT e GC, observou-se que uma queda maior na atividade resultou da mudança do alelo rs8085824 do que rs58920878. Por outro lado, a mudança rs58920878 no haplótipo TC de TG não resultou numa diferença significativa na actividade potenciadora. Tal como acontece com o fragmento A2, para rs8085824 SNP estes resultados foram consistentes com os efeitos específicos dos alelos observados utilizando o fragmento maior (Figura 2C). No entanto, para SNP rs58920878, o efeito previsto por o fragmento de 2 kb era dependente que alelo rs8085824 estava presente, mais uma vez, sugerindo que existe uma relação funcional entre os SNPs complexo adjacentes.

Finalmente, fragmento A4, englobando o segundo menor HCT-116 H3K4me1 pico, continha apenas SNP rs58920878 e demonstrou uma actividade semelhante para os fragmentos A1 e A3 (Figura 3A). Este fragmento mostrou actividade potenciadora foi reduzida de 3 vezes quando o alelo principal C foi alterada para o alelo secundário L (Figura 3E). O rs58920878 fragmento A4 contendo era o único dos fragmentos menores, onde o alelo menor ou haplótipo demonstraram menor atividade do que o alelo principal /haplótipo.

Os dois haplótipos mais comuns no CEU para este grupo de 4 SNPs são CGTC (49,9%) e TCCG (33,4%) (Figura 1E). Estas combinações foram testados no contexto do intensificador Uma construção de 2 kb. Como mostrado na Figura 3F, em geral a maior haplótipo CGTC demonstraram maior atividade potenciador do que o menor haplótipo TCCG no HCT-116 e SW480. Interessantemente, quando se testaram os dois haplótipos na linha de células de CRC RKO, CGTC não foi significativamente mais activo do que o haplótipo TCCG, indicando que houve alguma especificidade para fragmentar uma actividade mesmo entre as linhas celulares de CRC. Nem haplótipo de fragmento A era activo na linha celular não CRC HEK293 que serviu como um controlo negativo (Figura S1A). Fragmentos contendo haplótipos TCTC (9,5% da população CEU) e CCTC (5,9% da população CEU) demonstraram níveis de atividade entre a de haplótipos CGTC e TCCG (Figura S1B).

eletroforética Mobilidade ensaios de desvio

para entender melhor estes efeitos potenciadores específicos de alelo, o próximo investigada a proteína nuclear de ligação com as sequências contendo cada um dos 4 SNPs, rs6507874, rs6507875, rs8085824, e rs58920878. Colocámos a hipótese de factores de transcrição que se ligam selectivamente aos alelos C com uma afinidade mais elevada, como o fragmento de 2 kb e os fragmentos A1-A4 com alelos C mostrou o mais elevado nível de actividade potenciadora. Por outro lado, as proteínas inibidoras podem ligar-se a alelos T ou G de preferência para regular negativamente a actividade potenciadora. Para este fim, 33 pb oligonucleótidos de cadeia dupla centrado em cada SNP, foram sintetizados. Em cada caso, o alelo C foi marcado com o corante vermelho de IR (700). Os alelos alternativos, T ou G foram marcadas com verde corante (800) IV (canais individuais são apresentados como imagens em preto e branco nas Figuras S2-S5 para facilidade de reprodução e análise). Os extractos nucleares foram preparados a partir de linhas de células SW480, HCT-116 e RKO CRC e incubadas com não específica e específica de DNA competidor não marcado, conforme indicado na Figura 4. Os dois alelos de cada SNP são marcados com cores diferentes, permitindo uma comparação directa do ligação de cada alelo de proteínas nucleares na mesma reacção. Como mostrado na Figura 4, para cada conjunto de sondas testado, existem bandas específicas para um alelo versus o outro alelo.

(A) a partir de extractos nucleares SW480, HCT-116, e linhas de células RKO foram incubadas com IR -dye 33mers rotulados centradas em rs6507874 C (etiqueta vermelha) e T (etiquetas verdes) antes da EMSA nativa. As faixas 1 e 2 mostram sonda sem extracto nuclear. Lanes 3, 4, 9, 10, 15 e 16 mostram a ligação de cada sonda marcada às proteínas nucleares individualmente com linha de células como descrito acima. Lanes 5-8, 11-14 e 17-20 são uma competição 01:01 com sondas alélicas marcados C e T. Lanes 6, 12 e 18 contêm 200 vezes em excesso concorrente C alelo não marcado. Lanes 7, 13 e 19 contêm 200 vezes em excesso não marcado concorrente alelo T. Lanes 8, 14 e 20 contêm 200 vezes em excesso concorrente de uma sequência unmatching com o conteúdo de nucleotídeos similar. Bandas específicas para um alelo e perderam sobre a concorrência são marcados com setas. Veja a Figura S2 imagem vermelha (700) do canal da sonda C e (800) do canal da sonda T em preto e branco verde para. (B) como no painel A, com o alelo rs6507875 C (sonda vermelha) e alelo G (verde). Veja a Figura S3 imagem vermelha (700) do canal da sonda C e (800) do canal da sonda G em preto e branco verde para. (C) como no painel A, com o alelo rs8085824 C (vermelho) e alelo T (verde). Veja a Figura S4 imagem vermelha (700) do canal da sonda C e (800) do canal da sonda T em preto e branco verde para. (D) como no painel A, com rs58920878 alelo C (vermelho) e o alelo G (verde). Veja a Figura S5 canal para (700) de imagem vermelho canal da sonda C eo verde (800) da sonda G em preto e branco.

Para cada conjunto alelo, pistas 3, 4, 9 , 10, 15 e 16 mostram uma única sonda de alelo incubados com o extracto nuclear. As pistas 5-8, 11-14, e 17-20 contêm reacções com 1:1 quantidades de cada alelo marcado. Para determinar a especificidade dos complexos desviados, oligonucleótidos não marcados competitivos para cada alelo foram adicionados em excesso de 200 vezes. Lanes 6, 12 e 18 contêm os alelos C não marcadas e pistas 7, 13 e 19 contêm as não marcadas alelos T ou G. Nas pistas 8, 14 e 20, um concorrente não marcado da composição de base semelhante, mas que não corresponde qualquer uma das sequências foi adicionado em uma quantidade igual. Bandas que desapareceu quando competiu com qualquer SNP alelo, mas presente com o concorrente independentes (não-específico) foram considerados específicos para a sequência SNP. O mais proeminente das bandas específicas são marcadas nas margens com setas.

No caso de rs6507874 e rs58920878 (Figura 4A, 4D), não foram encontrados os complexos de HCT-116 e SW480, que não foram vistos na RKO. Isto pode explicar porque a actividade específica haplótipo não foi observado na experiência a actividade de luciferase RKO. Nas Figuras 4A e S2, a banda marcada pela seta era específico para a sonda de alelo rs6507874 C. Note-se que em extractos de RKO, mesmo em excesso de 200 vezes de oligonucleótido não marcado o alelo T HCT-116 e não poderia competir fora do alelo C para a ligação. Para as sondas rs6507875 (Figura 4B e S3), enquanto houve bandas específicas para ambos os alelos (setas), o alelo G preso com mais afinidade do que o alelo C. Curiosamente, as sondas rs6507875 ligou-se fortemente aos componentes do extracto RKO, mesmo na presença de excesso de DNA não marcado (Figura 4B)

.

Para as sondas rs8085824, encontramos novamente vários complexos específicos para cada alelo. Um complexo proeminente, marcada pela seta inferior, mostraram que a sonda de alelo C não foi completamente outcompeted com excesso de 200 vezes do alelo T. Parece que as proteínas ligadas deste complexo são encontradas em quantidades elevadas em SW480 e HCT-116 de extractos nucleares RKO. No caso das sondas rs58920878, encontramos várias bandas específicas para o alelo C, enquanto que o alelo G foi encontrada predominantemente em complexos maiores (bandas mais elevadas) do que o alelo C.

a determinação da identidade destes alelos as proteínas de ligação específicas irá ser necessária para compreender totalmente a acção do intensificador SMAD7. Proteína software de predição de ligação Biobase Combinar, com base no banco de dados TRANSFAC motivo, foi utilizada para identificar candidatos a região cada SNP [24]. Os resultados desta análise são apresentados como tabelas S1, S2 e S3 em S1 Arquivo. A proteína de ligação de ADN com o topo diferença nos escores de ligação previstos entre alelos para rs6507874 /rs6507875 (analisados ​​em conjunto devido à proximidade) foi NF-1A, para rs8085824 foi Churchill, e por rs58920878 foi ZF5. No entanto, para cada locus, nenhuma das proteínas com as maiores diferenças alélicas previstos foram as proteínas com as maiores pontuações do núcleo ou matriz para cada sequência.

Análise eQTL em Colon tecido normal

A seguir, perguntado se o genótipo para estes SNPs correlacionados com os níveis de expressão do gene em tecidos normais do cólon. Como o potenciador está localizado no intron 4 do

gene SMAD7

,

SMAD7

era um gene alvo candidato óbvio. Além rs6507874, rs6507875 e rs8085824, nós também genotipados os rs4939827 tagSNP em amostras patologicamente normais humanos obtidos a partir de tecidos colonoscopias de seguimento através da Aspirina /folato pólipo Prevention Study [25] – [27]. Não fomos capazes de projetar um ensaio TaqMan para rs58920878, no entanto rs8085824 SNPs e rs58920878 estão em perfeita LD (r

2 = 1, D ‘= 1); portanto, rs8085824 representa também um proxy para rs58920878. Não houve correlação estatisticamente significativa entre a expressão dos dois outros genes dentro de 0,5 Mb de rs4939827,

CTIF

ou

DYM

, e qualquer um dos SNPs genotipados foi observada (dados não mostrados).

Nós descobrimos que as rs4939827 tagSNP não mostrou associação estatisticamente significativa com a

SMAD7

níveis de expressão, apesar de maior expressão tenderam com o alelo de risco T GWAS (p = 0,1130) (Figura 5). No entanto, rs8085824 SNP C (menor) alelo demonstrou uma correlação estatisticamente significativa (

p

= 0,01197) com o aumento da

expressão SMAD7

. Dado que rs8085824 SNPs e rs58920878 estão em perfeita LD, esse resultado pode ser extrapolada para implicar uma correlação entre rs58920878 G (menor) alelo e níveis mais elevados de

expressão SMAD7

. O alelo rs6507874 T (minor) (p = 0,07531) eo alelo rs6507875 C (menor) (

p

= 0,1337) não apresentaram correlação estatisticamente significativa com o aumento da

expressão SMAD7

. Note-se que em geral o haplótipo TCCG (menor haplótipo) correlacionado com maior

expressão SMAD7

em tecidos e em ensaios de luciferase no contexto de fragmentos A1, A2, e A3, mas foi oposto ao efeito observado para a actividade potenciadora de o fragmento de 2 kb em experimentos de luciferase em que o fragmento contendo o haplótipo TCCG (minor haplótipo) correlacionada com a actividade potenciadora reduzida em comparação com o fragmento contendo o haplótipo CGTC.

Dobre mudança (FC) de expressão SMAD7 foi medida em condições normais amostras de tecido do cólon de colonoscopias de vigilância. análise não paramétrica baseada no rank foi utilizado para estimar o efeito de cada alelo secundário extra para rs6507874, rs6507875, rs8085824 e rs4939827 (aditivo modelo) sobre a expressão gênica ajuste para sexo, idade e raça. Frente e verso

p

-Valores foram obtidos a partir de um teste da razão de verossimilhança. Log

2 (ΔΔCt) foram representados como uma função de genótipos usando um gráfico de caixa – dot sobreposição trama. Número de amostras é conhecida no âmbito de cada genótipo. A associação estatisticamente significativa foi encontrada para rs8085824.

serão necessários mais estudos para determinar como este controles potenciador multi-componentes

SMAD7

expressão de genes durante o desenvolvimento do cólon e do crescimento celular, e determinar se ou não os componentes individuais do ato realçador independentemente um do outro.

Regulamento do SMAD7 Enhancer

a seguir, queriam determinar a relação entre a actividade potenciadora e sinalização BMP /TGF. Como mencionado na introdução, SMAD7 actua como um mediador-chave do circuito de retroalimentação negativa para ambas as vias de sinalização de TGF-p e BMP. Nós estávamos interessados, portanto, para determinar se potenciador Um era uma parte de um ciclo de feedback, tornando-se mais ativo em resposta a qualquer TGF-p1 ou sinalização de BMP4. células SW480 HCT-116 e foram privadas de soro durante a noite anterior a 6 horas de tratamento com TGF-p1 100 pmol ou BMP4, e o fragmento de 2 kb A foi utilizado para testar a actividade de luciferase. Após o tratamento com TGF-p1, fragmentos contendo quer o haplótipo CGTC (major) ou o (menor) haplótipo TCCG demonstrou nenhuma alteração estatisticamente significativa na actividade em qualquer uma das linhas de células (Figura 6A). Em contraste, a seguir ao tratamento com BMP4, actividade potenciadora do fragmento contendo a maior haplótipo CGTC foi aumentada de 1,2 vezes em células HCT-116 e 1,5 vezes em células SW480 (Figura 6B). Um aumento na actividade potenciadora também foi observado com o fragmento contendo o haplótipo menor TCCG em células SW480, onde tratamento com BMP levou a um aumento de 1,4 vezes na actividade potenciadora, mas não no HCT-116 células em que se observou nenhum aumento significativo (

P

= 0,38) (Figura 6B). Porque fragmentos de ADN que contêm ambos os haplótipos foram estimuladas por BMP4 em SW480 a uma extensão similar (dobre mudança), postulamos que as 4 SNPs no haplótipo risco não perturbar os componentes reactivos BMP reais do potenciador. No entanto, devido ao défice de actividade com o haplótipo menor, após a estimulação BMP4, o construto haplótipo TCCG demonstra ainda menor do que a actividade potenciadora haplótipo CGTC BMP4 sem estimulação (Figura 6C). No total, estes dados implicam o intensificador num circuito fechado de realimentação negativo em resposta a sinalização de BMP mas não no braço TGFp da cascata de sinalização.

(A) Enhancer actividade foi medida pelo ensaio de luciferase para o fragmento A, contendo o major (CGTC) e menor (TCCG) haplótipos no HCT-116 e SW480 células carência de soro incubadas com TGF-p1 durante 6 horas. As amostras são marcadas como uma mudança vezes na actividade relativamente a células não-tratadas na mesma placa. atividade (B) Enhancer foi estimulado por 6 horas de tratamento BMP4 para o haplótipo CGTC no HCT-116 (

p

= 4,14 × 10

-3) e as células SW480 (

p

= 1,22 × 10

-10). O haplótipo TCCG no fragmento A mostra níveis mais baixos de estimulação, e apenas em SW480 (

p

= 1,61 × 10

-6). (HCT-116

p

= 0,38). Efeito de BMP é traçada como a mudança de dobragem e sobre as amostras não tratadas para cada haplótipo na mesma placa. (C) Enhancer comparação actividade entre os haplótipos CGTC e TCCG após o tratamento BMP4. atividade luciferase relativa foi traçada para cada haplótipo em HCT-116 e SW480 utilizando o mesmo conjunto de dados experimentais como (B).

Discussão

Recentemente, o nosso laboratório e outros começaram a considerar os efeitos de várias variantes funcionais em desequilíbrio de ligação (LD) que contribuem para o risco de doença identificado através GWAS em vez de uma única variante funcional [28]. Por exemplo, no cromossoma 11q23.1, o nosso laboratório identificados dois SNPs em LD (R

2 = 1), associada com o risco de CRC, um em cada um intensificador e uma em um promotor bi-direccional, que demonstraram actividade específica de alelo e correlacionada com os níveis de três genes alvos não caracterizados previamente [16] expressão.

Deixe uma resposta