PLOS ONE: A alta resolução Genome-Wide Verificação de HNF4α sítios de reconhecimento infere um rede de transcrição em Colon Cancer

Abstract

O fator nuclear HNF4α hepática é uma expressão do fator de transcrição versátil e controles de muitos genes no desenvolvimento , o metabolismo e as doenças. Para delinear a sua rede de gene regulador de cancro do cólon e para definir metas novo gene uma varredura do genoma abrangente foi realizado em uma resolução de 35 bp com cromatina de DNA IP obtido a partir da linha de células de carcinoma do cólon humano Caco-2, que é uma particularmente rica fonte de HNF4α. Mais de 90% dos sítios de ligação HNF4α mapeados, bem como sequências distais do promotor, enquanto elementos intensificadores podem ser definidos para promover lacetes de cromatina para a interacção com outros factores de transcrição ligado a promotores. análise motivo de sequência por vários algoritmos genéticos evidenciaram uma acentuassoma única que consistiu nas proteínas nucleares ERa, AP1, GATA e HNF1α como fatores de transcrição cooperando. Em geral 17,500 locais de ligação de ADN foram identificados com uma proporção de genes /local de ligação que diferiam 6 vezes entre cromossomas e agrupados em regiões cromossómicas distintas entre 6600 genes alvo por HNF4α. São apresentadas provas para o receptor nuclear cross-talk da HNF4α e α do receptor de estrogênio, que se condensa no nível sequência. Notavelmente, o cromossomo Y é desprovido de sítios de ligação HNF4α. A importância funcional das instalações de enriquecimento foi confirmado em estudos de expressão gênica do genoma em diferentes níveis de proteína HNF4α. Tomadas em conjunto, uma varredura do genoma de sítios de ligação HNF4α é relatado para melhor compreender os mecanismos básicos de controle da transcrição de genes HNF4α alvejados. sítios distal de ligação do promotor Novel são identificados que fazem acentuassoma facilitando assim os eventos de processamento de RNA

Citation:. Weltmeier F, Borlak J (2011) A alta resolução Genome-Wide Verificação de HNF4α Sites Reconhecimento Infere uma rede gene regulador em Cancer de colo. PLoS ONE 6 (7): e21667. doi: 10.1371 /journal.pone.0021667

editor: Ying Xu, Universidade da Geórgia, Estados Unidos da América

Recebido: 02 de fevereiro de 2011; Aceito: 06 de junho de 2011; Publicado: 28 Julho, 2011 |

Direitos de autor: © 2011 Weltmeier, Borlak. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este trabalho foi financiado pela Baixa Saxônia Ministério da Cultura e das Ciências e da Fundação Volkswagen, na Alemanha. número de concessão: 25A.5-7251-99-3 /00. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

hepática factor nuclear HNF4α é um membro da superfamília de receptores nucleares e um factor de transcrição extremamente versátil [1]. Esta proteína de dedo de zinco é expressa no fígado, intestino, pâncreas e outros tecidos, e liga-se a sequências de ADN cognatas como um homodímero [2]. No passado, foram relatados alguns sítios de ligação de promotores dúzia. O uso de imunoprecipitação da cromatina e metodologias ChIP-chip de hibridização microarray demonstraram que estes são apenas a menor fração dos sítios de ligação reais HNF4α. Por utilização de matriz que engloba os ladrilhos ENCODE regiões que representam 1% do genoma da linha celular de hepatoma humano HepG2 [3] com um total de 194 sítios de ligação HNF4α poderia ser mapeado. Em outro estudo de ligação HNF4α sites em hepatócitos e ilhotas pancreáticas foram mapeados, mas a abordagem focada em regiões promotoras apenas [4]. A partir de hoje, uma pegada de todo o genoma de HNF4α não foi relatada. Notavelmente, HNF4α é uma proteína reguladora mestre e disfunção de HNF4α tem sido associado com doenças metabólicas e cancerosos. Estamos particularmente interessados ​​em explorar uma pegada HNF4α genómico na linha de células de cólon humano adenocarcinmoa Caco-2 que tem sido amplamente utilizada para explorar a actividade HNF4α [5] identificando assim uma rede de genes regulados. Especificamente, a linha de células de enterócitos diferencia-se em cima do confluência [6] e expressa a proteína HNF4α comparável ao fígado [7]. Aqui nós relatamos a primeira varredura do genoma que permitiu a identificação de 17.500 sítios de ligação alvo de HNF4α e descrever sua distribuição cromossômica. Além disso, estudamos as consequências da indução de proteínas HNF4α sobre a atividade transcricional de

de novo

genes identificados e demonstram uma boa concordância entre os alvos novo gene e sua expressão em células Caco-2. Por fim, analisamos sites para motivos de ligação enriquecidos e fatores de transcrição cooperantes identificados que parecia agir em conjunto com HNF4α em um acentuassoma de regulação da transcrição de ligação HNF4α.

Resultados

experimentos cromatina IP foram realizadas com culturas celulares e um anticorpo altamente específico para HNF4α 2-Caco. Notavelmente, a entrada total, bem como IP-DNA a partir de três réplicas biológicas independentes foi obtido e submetido a um protocolo optimizado para a amplificação imparcial de acordo com a recomendação fabrica (ver também a secção de Material e Método). O DNA amplificado a partir de experimentos independentes foi hibridizada para Affymetrix Humanos matrizes azulejos 2.0R com uma resolução de todo o genoma de 35 pb. Em seguida, os dados em bruto foram examinados para as regiões enriquecidas através da utilização de três algoritmos independentes (TAS [8], MAT [9] e Mapa de tiras [10]). critério de corte iniciais foram definidos no controlo positivo fracamente enriquecido (

OTC) e ainda melhorada com base na frequência de HNF4α -motifs dentro das regiões enriquecidos, conforme determinado pelo algoritmo FÓSFORO [11]. Para ganhar a confiança nos dados, os resultados dos três algoritmos foram cruzaram. A sobreposição dos locais de enriquecimento (ES) identificados por três abordagens foi muito alta (Fig. 1), embora pequenas diferenças foram observadas possivelmente devido aos diferentes bibliotecas de repetição usado. No geral, esta abordagem levou a uma identificação de 17,561 ES (Tabela S1). Além disso, um conjunto de dados de rigor baixo foi gerado pela fusão dos dados ES detectados com o MAT e algoritmos TileMap. Isto resultou em um total de 25.419 ES (Tabela S2).

Os dados em bruto foi analisado com três programas diferentes (Mapa de tiras, MAT e TAS) para identificar sítios de ligação HNF4α. Embora tenham sido utilizadas diferentes ajustes dos parâmetros (por exemplo, largura de banda de 200, 300 e 400 nucleótidos) e os diferentes algoritmos, a sobreposição era surpreendentemente elevada. O diagrama de Venn foi calculada utilizando a função de intersecção de Galaxy [47].

Além disso, 15 ES de alvos conhecidos genes HNF4α foram escolhidos e seu enriquecimento na-DNA IP primário foi determinada por PCR quantitativa em tempo real . Para todos os sites selecionados enriquecimento pôde ser confirmada. Assim, a robustez e a qualidade dos dados foi validado (Fig. 2). Entre os ES identificados havia sítios de ligação HNF4α já descritas na literatura ou relatados em outros lugares, como

AAT

(R00114),

GCC

(R08885),

PCK

(R12074 ),

APOB

(R01612),

CYP2C9

(R15905),

AKR1C4

(R13037),

ACADM

(R15923) ou

CYP27A1

(R15917). No caso de SHBG (R15941), ES foram determinadas dentro de algumas centenas de pares de bases relativamente aos locais de ligação relatadas. Outros sítios de ligação descritas na literatura, como

ALDH2

(R15845), não pôde ser confirmada. No entanto, a quantificação por PCR em tempo real mostrou que o

ALDH2

local foi não enriquecido no DNA IP primário. À medida que as funções da proteína HNF4α de um modo específico do tecido, não é inesperado que alguns ES não estão ligados em células Caco-2; a sua acessibilidade, em vez depende da organização da cromatina, o que por sua vez depende do tipo de célula. Isto é suportado por investigações independentes, em que as diferenças significativas em sítios de ligação de DNA em diferentes tipos de células foram observadas [12].

Enriquecimento de novos sítios de ligação HNF4α detectados por Chip-chip foi confirmada por PCR em tempo real. foi utilizado ChIP-DNA a partir de três experiências independentes. A normalização foi realizada utilizando um controlo negativo β-actina, e os valores são apresentados como enriquecimento vezes contra entrada total. HNF1α a montante é um segundo controlo negativo, localizada a montante do sítio de ligação HNF4α conhecido no promotor HNF1α e é usada para confirmar o controlo negativo ß-actina.

O motivo HNF4α é altamente enriquecida no circuito integrado regiões

regiões enriquecida-chip foram examinados para motivos de ligação HNF4α com o algoritmo JOGO [11]. Utilizando critérios rigorosos para minimizar os falsos positivos, . Enriquecimento de 14 vezes foi observada para HNF4α sequências alvo, quando comparado com o fundo genómico (Tabela S3)

As regiões de 500 pb em torno dos locais de ligação identificados 17,561 foram analisadas quanto motivos HNF4α com configurações para minimizar falsos negativos por uso do algoritmo JOGO [11]. Essencialmente, as regiões foram segmentados em caixas de 25 pb, eo número de ocorrências dos motivos diferentes dentro de cada bin foi contado. Isto resultou em um total de 23,145 motivos e equivale a 1,32 motivos Região /Chip. Para 98,1% das regiões chip foi detectado pelo menos um motivo. Isto sugere que a maioria das regiões ChIP foram enriquecidas devido à ligação directa da HNF4α. Pela mesma abordagem os locais de ligação apresentada para os ENCODE regiões [3] foram examinados e 1,13 motivos /região Chip foram estimados que é menor do que o observado no presente estudo, possivelmente, sugerem matrizes de alta resolução de lado a lado para melhor identificar ES. Subsequentemente, foi analisada a distribuição dos motivos HNF4α em torno do centro das regiões de ChIP enriquecida (Fig. 3a). A maioria dos motivos está localizado numa região de apenas -500 pares de bases. Quando as regiões enriquecidas com as posições dos picos detectados com o algoritmo MAT foram alinhados contra a posição central, o número de motivos HNF4α aumentou, por conseguinte, indicando que a posição do pico melhor estima sítio de ligação real. Além disso, o motivo do amostrador de Gibbs foi aplicado para identificar regiões ES para permitir a fácil

de novo

definição do motivo HNF4α (Fig. 3b).

a) motivos HNF4α na área de 1000 pb pico ou centro posições circundantes instalação de enriquecimento (ES) como detectado com casamento, usando pontos de corte para minimizar falsos positivos. Foi calculada a distância do centro de motivos detectados ao pico ou centro de posição do ES. Um histograma foi criada usando caixas de 50 nucleótidos em torno do centro ou de pico posições. A linha azul mostra o desvio de HNF4α motifs em relação ao centro da ES, a linha vermelha mostra o desvio em relação à posição do pico. b) ES HNF4α ChIP-chip para permitir a fácil

de

predição do motivo de ligação HNF4α novo. Após a análise da sequência das regiões enriquecidas por HNF4α ChIP-chip com Gibbs motivo amostrador, o HNF4α-motif realmente foi detectada duas vezes, com o segundo motivo apresentando apenas metade de um site. c) Conservação de todos os sítios de ligação HNF4α (linha azul). centros ES (azul) ou posições de pico (vermelho) foram estendidas para 1.000 pb em ambas as direções, e para cada nucleotídeo a pontuação média conservação, baseado na alta qualidade Phast Contras informações do UCSC Genome GoldenPath Resource, foi calculado. As pontuações médias de conservação foram plotados contra a posição nucleotídeos. As análises foram realizadas com SECA [43].

Para sublinhar a importância biológica dos sítios de ligação identificou sua conservação média foi estudada também. Os nucleótidos no centro, onde um sítio de ligação poderia ser esperado, mostram uma conservação duas vezes mais elevado do que aqueles nas extremidades da trama (fundo genómico) (Fig. 3c). Novamente, quando as regiões ChIP enriquecidas foram alinhadas pela posição de pico, o pico de conservação foi ainda melhor definida.

HNF4α liga-se predominantemente em promover o aumento elementos

A distância do sítio de ligação HNF4α à transcrição mais próximo foi determinado local de início (TSS) de um gene RefSeq. Aqui, foi observada uma sobre-representação de quase 5 vezes de sítios de ligação na região do promotor de -1.000-0 relação ao TSS (Fig. 4a, b). No entanto, apenas 5,8% de todos os sítios de ligação mapeada para promotor proximal regiões e 3,6% de todas as RefSeq promotores estão vinculados por HNF4α. A falta semelhante e significativa de preferência para se ligar a regiões do promotor proximal 5 ‘tinha sido relatada para os factores de transcrição Sp1, P53, cMyc e ERa [13], [8]. Enquanto alguns fatores de transcrição como E2F1 mostram uma clara preferência por regiões 5 ‘do promotor-proximal [14], o acúmulo de evidências é altamente sugestivo de regiões promotoras-proximal para constituir apenas uma pequena fração de sequências reguladoras de genes de mamíferos. Com efeito, alguns dos receptores nucleares exibir uma actividade mais elevada no intensificador de ligação, em vez de locais de promotores [13], [15]. Por conseguinte, os estudos com matrizes de promotor são de valor limitado.

a) Localização dos locais em relação ao TSS mais próximo de genes RefSeq ligação HNF4α em comparação com distribuição aleatória. As regiões de 100.000 nucleotídeos que cercam cada TSS foram divididos em caixas de 5.000 nucleotídeos, eo número de locais de ligação em cada bin foi contado. b) distribuição de Genomic de sítios de ligação HNF4α. O número de locais de ligação situados nas regiões especificadas de genes anotados RefSeq foi calculada pela CisGenome ferramenta de software. TSSup1k: 1000 pb a montante de um local de início da transcrição (TSS); TESdown1k: 1000 pb a jusante de um local de extremidade de transcrição. c) Distribuição de sítios de ligação HNF4α localizados proximal para TSS de genes RefSeq, em comparação com distribuição aleatória. As regiões de 5.000 nucleotídeos que cercam cada TSS foram divididos em caixas de 200 nucleótidos, eo número de locais de ligação em cada bin foi contado. d) representação de sites em regiões TSS proximais a montante ea jusante e na primeira ligação HNF4α, segundo um terceiro íntrons de genes RefSeq anotados, relativamente a um regiões de controlo aleatórias. As posições de TSS, primeiro, segundo e terceiro intrões de genes anotados RefSeq foram recuperados a partir de UCSC, e o número de locais de ligação HNF4α localizados nas regiões especificadas foi calculada. TSSup600: 600 pb a montante de um local de início da transcrição; TSSdown600: 600 pb a jusante do sítio de iniciação da transcrição; TSSup10k: 10000 pb a montante de um TSS; TSSdown10k:. 10.000 bp a jusante de um TSS

Uma análise da distribuição de ES em 600 pb em torno do TSS fornecido evidências para ligação preferencial na região a montante (Fig 4c e d.). No entanto, a uma distância maior do que 800 pb do TSS, mais sítios de ligação estão localizados a jusante. Notavelmente, muitos factores de transcrição sítios de ligação estão localizados no primeiro intrão; o segundo pico mostrado na Fig. 4c é devido à ligação das regiões intrónicas. A frequência de locais de ligação HNF4α em RefSeq genes anotados foi ainda analisada. Este evidenciado uma sobre-representação da ES nos primeiros íntrons, mas nem tanto no segundo ou terceiro (Fig. 4d).

É importante ressaltar que um estudo recente HNF4α ChIP-chip sugeriu ES promotor-proximal são devido a interações indiretas de HNF4α com outros factores de transcrição [3]. Por conseguinte, foi desenvolvido um modelo no qual HNF4α liga-se a elementos intensificadores distantes e cria laços de cromatina através da interacção com outros factores de transcrição ligado a promotores. Infelizmente, este modelo foi baseado em menos de 1% de sequências genómicas. Com base na verificação de largura genoma relatado motivos em regiões promotoras-distai estão sobre-representados aqui ligação HNF4α, em comparação com as regiões de promotor proximal (Fig. 5a), no entanto, as regiões com baixo enriquecimento exibir uma maior percentagem de sítios de ligação do promotor proximal de regiões com elevado enriquecimento (Fig. 5b). regiões Possivelmente, contactos HNF4α promotor proximal por interacção física com outros factores de transcrição e, por conseguinte, exibe promotor, bem como uma actividade de ligação ao potenciador.

a) análise de bootstraping de HNF4α motivo de ligação (matriz M01031) no promotor proximal e promotor regiões distais. 100 ES promotor-proximal (-138 a -2 em relação ao TSS) foram comparados com 100 ES promotor-distal (-24.972–23.489 relação ao TSS) pela ferramenta de análise de bootstrapping POBO [48]. ES promotor proximal mostram um número significativamente menor de motivos HNF4α. b) ES (300 pb rodeiam a posição do pico) foram classificados pelo seu valor de P (tal como calculado pelo algoritmo MAT) e dividido em caixas de 1.000 ES. Para cada bin foram calculados o número de ocorrências motivo HNF4α ea percentagem de ES promotor-proximal. Como pode ser visto, ES com um elevado valor de P (fraco ES) são mais susceptíveis de ser localizado promotor proximal, mas para não contêm motivo de ligação HNF4α.

A distribuição de ES identificados entre os cromossomas variado 6 vezes. Surpreendentemente, o cromossomo Y é desprovido de HNF4α ES (Tabela S6) ea distribuição cromossômica de ES não é distribuída aleatoriamente; em vez agrupamentos são formados (Fig 6a;. A Fig. 7). Estes grupos não estão relacionadas com diferenças na densidade gene dentro destas regiões, como mostrado para o cromossomo 10. A região com a maior densidade de sítios de ligação no cromossoma 10 contém dois conjuntos de sites com o ACSL5 loci sobreposição e VTI1A1 (Fig vinculativo. 6b ). Ao digitalizar a sequência genómica para janelas de 100.000 pb que contêm ≥10 sítios de ligação HNF4α, quinze conjuntos poderia ser definido (Tabela S7). Na verdade, a maioria dos intensificadores parecem ser promíscuo e, assim, regular a múltiplos genes [16]. Enquanto a atividade potenciador pode ter lugar ao longo de centenas de kilobases [17] e até mesmo casos de regulação inter-cromossômica por melhoradores têm sido relatados [18], a maioria são de 100.000 pb da respectiva TSS. Para melhor definir uma possível acentuassoma para sequências de genes alvo mais próximo de genes RefSeq com TSS separados por menos de 100.000 nucleotídeos foram selecionados (Tabela S8).

a) A distribuição dos locais de ligação HNF4α (gráfico de linhas roxo, superior meia) é comparada com a distribuição de genes conhecidos no cromossoma 10. as setas verdes marcar duas regiões de genes-esparsa em que são encontrados ES. As setas vermelhas marcar duas regiões com um elevado número de sítios de ligação HNF4α e um baixo número de genes. As análises foram realizadas utilizando a ferramenta Ensembl Karyoview (https://www.ensembl.org/Homo_sapiens/karyoview). b) Os conjuntos de HNF4α locais em uma região genómica no cromossoma de ligação 10 com alto teor de locais de ligação (a região marcada pela segunda seta vermelha em a)). Os sítios de ligação identificados neste estudo, apresentados como picos azuis na metade superior, são apresentados usando o navegador do genoma IGB. Os locais de ligação são distribuídos em dois grupos em torno do local de início da transcrição do locus ACSL5 e na região 3 ‘do locus VTI1A.

Cada cromossoma foi dividido em 150′

lixeiras

‘, e dentro de cada bin o número de ES foi contado. No gráfico de linha azul, o número de sítios de ligação HNF4α dentro de cada bin é representado como um único ponto de dados. Abaixo de cada cromossomo, o número mínimo e máximo de sítios de ligação localizados em um único bin é dado. As análises foram realizadas utilizando a ferramenta Ensembl Karyoview (https://www.ensembl.org/Homo_sapiens/karyoview).

HNF4α fator de transcrição cross-talk

Para procurar fator de transcrição cross-talk foram consideradas as regiões chip para motivos sobre-representados. Entre os motivos de maior enriquecimento são matrizes semelhantes a HNF4α motivo de ligação, por exemplo aqueles para COUP-TF, ou PPAR LEF1 (Fig. 8, Tabelas S3, S4, S5). Estes factores de transcrição são conhecidos para competir com HNF4α para sítios de ligação comuns [19] – [21]. No entanto, muitos motivos diferentes a HNF4α, por exemplo, os motivos de ligação para HNF1α, AP1 ou fatores de transcrição GATA, também foram enriquecidos de forma significativa. Se estes factores actuam em comum com HNF4α, pode-se esperar que a frequência dos seus motivos aumenta com a diminuição da distância para os sítios de ligação HNF4α. Por isso, a frequência de tais motivos em relação aos sítios de ligação HNF4α foi analisada (Fig. 9a e 9b). O enriquecimento destes motivos é restringida a uma região de poucas centenas de pares de bases em torno da posição do pico, portanto, apoiando a ideia de que eles fazem parte de um acentuassoma definido por HNF4α. Além de um aumento na freqüência de motivos de ligação para AP1, GATA, ERa e HNF1α foi observada uma relação inversa entre HNF4α e motivos carro, mas não havia nenhuma relação com SREBP1 (Fig. 9a). É tentador especular que isso é de importância regulamentar para HNF4α. Outros motivos analisados ​​apresentaram apenas uma ligeira correlação entre o número de motivos e a distância para a posição de pico, embora eles foram claramente enriquecidas em regiões chip (eg USF, CREB, HNF6).

O 10,000 picador mais significativo regiões enriquecidas foram analisados ​​por motivos sobre-representados por utilização da ferramenta SECA [43]. São mostrados os 10 motivos com o enriquecimento mais significativo, enquanto motivos redundantes (isto é, vários motivos para o mesmo factor de transcrição) foram removidos. A similaridade ou dissimilaridade dos motivos é visualizada usando Weblogo representação (https://weblogo.berkeley.edu/). análise de enriquecimento Motivo com Genomatix RegionMiner e MATCH [11] são encontrados nas Tabelas S3, S4, S5.

a) as posições de pico (representado como 0) foram estendidas para 500 pb em ambas as direções, e motivos foram detectadas por utilização do algoritmo FÓSFORO [11], utilizando critérios de corte para minimizar a soma de falsos positivos e falsos negativos. Regiões foram segmentados em caixas de 25 pb, eo número de ocorrências dos motivos diferentes dentro de cada bin foi contado. b) Parcela da distância relativa de motivos HNF4α a outros motivos enriquecido na região do chip. Dentro regiões chip motivos HNF4α mais conservada, onde identificados. As sequências dos nucleótidos 500 que rodeiam estes motivos HNF4α mais conservadas onde recuperadas e analisadas para os motivos de outro TF que também foram enriquecidas nas regiões de chip. Então, a distância entre estes motivos e o motivo HNF4α foi calculada usando CisGenome motivo para a detecção e representada graficamente como histogramas utilizando caixotes de 20 pb. O motivo HNF4α é encontrado no centro, atingindo desde pb -6 a bp +6. HNF4α e ERa compartilhar sites comuns e sobreposição de ligação. c) Indicação da sobreposição entre os motivos de ligação de HNF4α e o receptor de estrogênio (ERa) pelo uso de Weblogo ilustrações. Ambos os motivos apresentam uma sobreposição parcial. d) A sobreposição entre os sítios de ligação ERa e sítios de ligação HNF4α. O rigor elevado conjunto de locais de ligação de ERa identificados pelo chip chip [13] foi obtido. A percentagem de locais de ligação ERa identificados neste estudo e também vinculados por HNF4α é exibido em um gráfico de barras. Determinou-se a sobreposição dos locais de ligação ERa com as regiões de controlo aleatórias.

A similaridade de sequência alta de locais para HNF4α e receptor de estrogênio (ERa) de ligação é de considerável importância (Fig. 9c). Para analisar ainda mais a probabilidade de co-ocupação de motivos enriquecidos os locais de ligação HNF4α foram determinados exatamente por análise motivo. A posição genômica do maior motivo HNF4α pontuação dentro das regiões chip foi recuperada e ampliada para 500 nucleótidos com as sequências de esquerda e direita flanqueando. Dentro destas sequências, outros motivos enriquecidos foram detectados e foi calculada a distância ao motivo HNF4α (Fig. 9b). Como esperado, a maioria ERa motivos de co-localizar a HNF4α ES causando um pico elevado no centro. Em contraste, HNF1α, AP1 e GATA motivos exibir enriquecimento a uma distância de 20 a 60 nucleótidos para o motivo HNF4α. Também há um enriquecimento de locais de ligação HNF4α menos conservadas em estreita proximidade com a mais alta pontuação HNF4α motivo. Esta sobre-representação de motivos HNF4α menos conservadas podem desempenhar um papel no aumento da probabilidade de HNF4α vinculativo no contexto sequência locais em torno do local de ligação.

Como o motivo ERa sobrepõe parcialmente com o motivo HNF4α, é tentador especular que esse enriquecimento dentro das regiões chip é devido a uma ligação funcional entre os dois factores. Recentemente, um mapa de todo o genoma de locais de ligação ERa foi relatada [13]. Por conseguinte, os dados para os sítios ERa e HNF4α foram analisados ​​e verificou-se sobrepõem consideravelmente (Fig. 9d). Utilizando quer o rigor baixo ou alto conjunto de HNF4α ou ERa locais de ligação de até cerca de 15% dos sítios de ligação ERa também foram alvo de HNF4α, apoiando assim a ideia de cooperação entre HNF4α eo receptor nuclear ERa. É importante ressaltar que várias investigações independentes relatam sinergismo na actividade do factor de transcrição de HNF4α e ERa na regulação dos genes de, por exemplo, apolipoproteína A1, apoVLDII eo pequeno parceiro de heterodímero.

Uma varredura do genoma revela função de mestre de HNF4α

os dados do presente estudo foi comparado com os dados publicados, a fim de identificar as regiões que se sobrepõem entre esses estudos (Fig. 10). Das 194 ES relatados nas regiões ENCODE [3], 76 sobreposto com resultados do presente estudo. Infelizmente, os ENCODE regiões compreendem uma única% de todo o genoma. Além disso, em um estudo com foco no promotor [4] 1.553 sequências ligadas foram relatados para hepatócitos. No presente estudo e selecionando regiões de sequências comparáveis ​​um total de 575 sítios de ligação poderia ser investigado. Destes, 200 foram em locais de ligação comum, por conseguinte, reconfirmar a 13% dos sítios de ligação de promotores propostos. Além disso, o mesmo investigador relatou ES para ilhéus pancreáticos, mas apenas 9% pode ser confirmada no presente estudo, com ADN de IP a partir da linha celular Caco-2. Tais diferenças podem surgir a partir dos diferentes protocolos experimentais e as diferenças de tipos de células.

Percentagem de locais de ligação HNF4α identificadas pela Rada-Iglesias et al. [3] ou Odom et ai. [4], que pode ser confirmada neste estudo. Para Rada-Iglesias et al. um grupo de sequências genómicas aleatórias de controlo foi utilizado para calcular a sobreposição aleatória. Para Odom et al., Um grupo de controle foi criado selecionando aleatoriamente um número de regiões promotoras da matriz Huk13 utilizada em seu estudo, igual ao número de promotores que detectado como sendo vinculado por HNF4α.

ontologias biológicas da

de novo

identificados genes alvos HNF4α

com base na Gene Ontology o

de novo

genes identificados foram agrupados (Tabela S9). Muitos dos genes alvo estão envolvidos em diferentes processos metabólicos, por exemplo lípido, ácido orgânico ou o metabolismo de hidratos de carbono. Categorias relacionadas com o transporte, ou seja, o transporte de lipídios, foram significativamente sobre-representados, como foi o metabolismo dos ácidos graxos e colesterol [1], [22]. Além disso, foram identificados muitos genes para o desenvolvimento e diferenciação, por conseguinte, o papel da tranquilizando HNF4α em desenvolvimento [23] e a diferenciação epitelial [22], [24] – [26]. Esta proteína também controla a via de secreção de insulina [27] e está ligado à doença rara monogenic, ou seja, diabetes dos jovens (MODY) vencimento de início [28]. Assim, os genes alvo de HNF4α na via de sinalização de insulina, bem como tais relacionado com a actividade de morte celular e supressor de tumor foram identificados [29]

Definindo sítios de ligação funcionais -. Correlação entre HNF4α ChIP-chip de todo o genoma e gene dados expressão

uma abordagem comum para identificar genes alvo de um fator de transcrição é determinar mRNA abundância causados ​​por sua aumentada ou diminuída atividade transcricional como investigada em rim embrionário humano (HEK293 [30]) e células de hepatoma (HUH7 [31], HepG2 [32]). Surpreendentemente, HNF4α experiências de transfecção influenciado transcrição de um pequeno número de genes únicos. Enquanto se sabe que a regulação da transcrição não é mediada ao nível de ligação de ADN sozinho [33] Em tais experiências a maioria dos factores de transcrição ligam sob condições não activadoras ”. Para confirmar os locais de ligação funcionais de

de novo

genes alvos HNF4α identificados, culturas de células Caco-2 foram tratadas com um indutor de proteína HNF4α [34]. Após o tratamento de células Caco-2 com Aroclor 1254, a ligação da proteína para o HNF4α

HNF1α

promotor foi aumentada [7], enquanto a indução da proteína foi confirmada por experiências de transferência de Western (Fig. 11). Os aroclor 1254 culturas tratadas foram submetidas a genoma-wide transcrição profiling. Usando critérios rigorosos, 536 genes anotados-RefSeq únicas foram definidos como diferencialmente expressos (Tabela S10). Destes, 383 genes foram regulados positivamente e 153 para baixo regulado. As sequências promotoras de genes regulados foram analisados ​​pelos locais de ligação HNF4α e comparadas com a lista de genes alvos ChIP-chip recentemente identificados. Uma sobreposição de 63% ou 336 genes diferencialmente expressos (Tabela S11) foram identificadas como alvos de genes HNF4α, confirmando assim a importância funcional dos ES identificadas no ensaio de ChIP-chip.

a) HNF4α Western blotting de 20 ig de extracto de célula Caco-2. Uma clara indução da expressão da proteína HNF4α foi observada após 48 h e 72 h de tratamento Aroclor1254. b) ensaios de deslocamento da mobilidade electroforética com extracto nuclear de células de 2,5 ug de Caco-2 e oligonucleótidos correspondentes à A-local do promotor HNF1α (HNF1pro) como sonda marcada com 32P. Em supershift Ensaios de um anticorpo dirigido contra HNF4α (+) foi adicionada. A ligação de HNF4α foi significativamente aumentada após 72 h de indução Aroclor1254.

Finalmente, os dados publicados sobre HNF4α com superexpressão linhas de células de mamíferos foi comparado com os dados do presente estudo. A sobreposição variou de 65 a 94% dos genes identificados (Tabela S10). Importante, a maior sobreposição foi obtido em estudos que utilizaram knock-down experiências siRNA para validar as suas conclusões [32]. Portanto, genes alvos aqui relatados pode ser considerado mais confiável.

Discussão

No passado, a investigação sobre os factores trans-actuantes e sua correspondente

cis

-elements focada na promotor -proximal sítios de ligação. Com o desenvolvimento de ensaios ChIP-chip, varreduras de todo o genoma para locais de ligação do factor de transcrição tornou-se viável. Isto melhorou consideravelmente na compreensão dos mecanismos básicos de controlo da transcrição e uma identificação de sítios de ligação distais promotoras que facilitem eventos de processamento de RNA.

No presente estudo, um mapa do genoma de sítios de ligação HNF4α foi construído. Esta proteína desempenha um papel essencial no desenvolvimento do fígado, e o seu papel regulador mestre na manutenção da competência metabólica do fígado estimulou a pesquisa sobre HNF4α alvo terapias do cancro pela sua capacidade de reverter o cancro do fígado para um fenótipo menos agressivo [35].

o presente estudo evidencia 90% dos sítios de ligação HNF4α a ser localizado em regiões promotoras-distai e esta distribuição de ES é semelhante à relatada para a ERa [13]. Notavelmente, com a excepção das regiões a menos de 600 pares de bases no TSS, sítios de ligação eram mais frequentemente a jusante. Assim, ensaios ChIP-chip com foco em regiões promotoras apenas [4], [36] pode perder a maioria dos locais de ligação.

Além disso, uma análise dos motivos HNF4α dentro das regiões enriquecida-chip demonstra como alta precisão como em

Deixe uma resposta