PLOS ONE: Chip-seq Definido Mapa Genome-Wide de TGF /SMAD4 Targets: Implicações com a evolução clínica de ovário Cancer

Abstract

A desregulação do fator transformador de crescimento β (TGF) via de sinalização em epitelial de ovário cancro tem sido relatado, mas o mecanismo exacto subjacente interrompido sinalização TGF-p na doença permanece obscura. Foi realizada cromatina imunoprecipitação seguido de sequenciamento (ChIP-seq) para investigar a triagem do genoma da ligação induzida por TGF SMAD4 em câncer epitelial de ovário. Após a estimulação de TGF-p a linha celular de cancro epitelial do ovário A2780, identificamos 2,362 loci de ligação SMAD4 e 318 genes alvo SMAD4 expressos diferencialmente. exame abrangente de loci SMAD4-bound, revelou quatro padrões de ligação distintos: 1) basal; 2) Shift; 3) Estimulada Apenas; 4) Só não estimulados. TGFp estimulada loci ligados a SMAD4 foram classificadas principalmente como seja estimulada única (74%) ou a tecla Shift (25%), indicando que TGFp-estimulação altera os padrões de ligação SMAD4 em células epiteliais de cancro do ovário. Além disso, com base em análise de rede reguladora do gene, determinou-se que a, rede reguladora SMAD4-dependente induzida por TGF-p era notavelmente diferente do cancro do ovário em comparação com células normais. Mais importante, os genes alvo TGFp /SMAD4 identificados na linha celular de cancro epitelial de ovário A2780 foram preditivos de sobrevivência do paciente, com base em silício na mineração de bases de dados publicamente disponíveis paciente. Em conclusão, os dados destacam a utilidade da tecnologia de sequenciamento de próxima geração para identificar genes alvo SMAD4 do genoma do câncer epitelial de ovário e link aberrante TGF /sinalização SMAD para tumorigênese de ovário. Além disso, o loci ligação SMAD4 identificado, combinado com perfil de expressão gênica e em mineração de dados in silico de coortes de pacientes, podem proporcionar uma abordagem poderosa para determinar assinaturas genéticas potenciais com a investigação translacional biológica e futuro em cancros do ovário e outros.

citação: Kennedy BA, Deatherage DE, Gu F, Tang B, Chan MWY, Sobrinho KP, et al. (2011) ChIP-seq Definido Mapa Genome-Wide de Metas de TGF /SMAD4: Implicações com a evolução clínica de cancro do ovário. PLoS ONE 6 (7): e22606. doi: 10.1371 /journal.pone.0022606

editor: Patrick Tan, Duke-National University of Singapore Graduate Medical School, Singapura

Recebido: 22 de fevereiro de 2011; Aceito: 26 de junho de 2011; Publicação: 25 de julho de 2011

Direitos de autor: © 2011 Kennedy et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este estudo foi apoiado por bolsas de Institutos Nacionais de Saúde U54CA113001, R01CA069065 e National Cancer Institute CA85289 e por fundos da Ohio State University Comprehensive Cancer Center e The Ohio State University Informática Biomédica. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

o factor de crescimento β transformação (TGFp) via de sinalização desempenha um papel importante no controlo da proliferação, diferenciação, e outros processos celulares incluindo o crescimento das células epiteliais da superfície do ovário (OSE) [1], [2]. Desregulação da sinalização TGF é frequentemente observada no câncer epitelial de ovário (EOC) e pode ser crucial para o desenvolvimento EOC [3], [4]. Os efeitos do TGF são mediados por três ligantes TGFp – TGF-p1, TGF-P2 e TGF-P3, por intermédio de TGF tipo 1 e tipo 2 receptores [5] – [7]. TGFBR2 é específico para o receptor de TGF-p ligandos. O complexo receptor funcional regula a activação de Smad a jusante e vias não Smad [8]. Os recrutas receptores fosforilados tipo 1 e fosforila regulados pelo receptor SMADs R Smads). Dos cinco R-Smads em mamíferos, o complexo TGFBR2-ALK5 activa Smad2 e Smad3, enquanto que o complexo TGFBR2-Alq1 activa Smad1, SMAD5 e SMAD8 [9]. Ativados R Smads formar complexos heteroméricos com o parceiro comum Smad (co-Smad; SMAD4 em mamíferos) e translocar para o núcleo [6]. Como a afinidade do complexo Smad activado para o elemento de ligação de Smad é insuficiente para apoiar associação com os promotores endógenos de genes alvo, os complexos de Smad deve associar-se com outros factores de transcrição de ligação de ADN para regular a expressão [7]. Numerosos estudos têm mostrado que várias famílias de factores de transcrição, tais como o forkhead, homeobox, de dedo de zinco, LEF1, Ets, e hélice-volta-hélice famílias (bHLH), pode servir como proteínas parceiras SMAD4 para atingir elevada afinidade e selectividade para promotores alvo com os elementos de ligação adequados [10] – [14].

a linha de epiteliais humanas A2780 ovário célula cancerosa é sensível a cis-diaminodicloroplatina (II) (cisplatina), um dos agentes do tipo de platina ( carbolatin ou cisplatina) utilizado no tratamento de cancro do ovário. Além de servir como um modelo útil para estudar a doença sensível ao fármaco, as células A2780 exibir desregulação TGFp parcial, indicado por apenas um aumento modesto na expressão SMAD4 e transdução de SMAD4 existente a partir do citoplasma para o núcleo seguinte a estimulação TGF [15]. Assim, esta linha celular também é um sistema modelo adequado para a realização de mapeamento do genoma dos genes-alvo SMAD4 e identificar os genes alvo TGF /SMAD4 desregulados e caminhos implicados em pacientes com câncer ovariano.

comparações recentes de picador seq (cromatina imunoprecipitação-seqüenciamento) para abordagens baseadas em matrizes claramente demonstrado que a tecnologia de chip-seq rendeu maior resolução, maior profundidade e precisão de mapeamento do fator de transcrição de ligação e modificações de histonas em uma escala de todo o genoma [16] – [18]. No presente estudo, foi utilizada a tecnologia de chip-seq para estudar regulação TGF /SMAD4 na linha de células de cancro do ovário A2780 sensível à platina. Nós perfilado SMAD4 loci seguintes com estimulação TGF vinculativo. Usando abordagens computacionais, nós investigamos o padrão de ligação SMAD4 e comparou-o com o padrão de ligação SMAD4 de ambos uma célula do epitélio normal de superfície do ovário imortalizado (Iosé) do nosso estudo anterior [12] e queratinócitos humanos (HaCaT) a partir Koinuma et al [11 ]. Além disso, geramos assinaturas de gene TGF /SMAD4 regulamentados e utilizado um

in silico

abordagem de mineração para correlacionar as assinaturas identificado com dados de resultados clínicos de duas câncer de ovário coortes de pacientes publicamente disponíveis. A nossa abordagem integrativa revelaram associações significativas de redes reguladoras TGF /SMAD4 tanto com a sobrevida livre e global de progressão em doentes com cancro do ovário. Ao identificar milhares de loci de ligação SMAD4, bem como genes regulados, nossos dados fornecem tanto um novo recurso para estudar o mecanismo subjacente desregulado TGF sinalização em células de cancro do ovário, bem como potenciais biomarcadores de prognóstico para o futuro investigação translacional cancro do ovário.

Resultados

Genome-Wide ocupação SMAD4 definido pela tecnologia de chip-seq

Nossos estudos anteriores [12], [15], [19], [20] e outros [2], [ ,,,0],4], [21] – [23] tentaram estabelecer e caracterizar os mecanismos moleculares de sinalização de TGF-mediada desregulada de células cancerosas do ovário e células de cancro do ovário resistentes à cisplatina adquiridos. A fim de elucidar os detalhes dos mecanismos subjacentes, usamos a tecnologia de chip-seq para identificar os locais genómicos vinculados por SMAD4 em células A2780 antes e após a estimulação TGF.

Usando ChIP-seq, todas as amostras foram inicialmente sequenciado para gerar um conjunto de rama lê (cada leitura tem um comprimento de 36 pb) a partir do sistema Ilumina /Solexa GAII (Tabela S1) que varia de ~43 milhões de ~51 milhões leituras por amostra. Após o mapeamento da montagem UCSC HG18 humano, um conjunto de ~26 milhões e ~32 milhões mapeados lê com localizações genômicas únicas foram obtidas para não estimulados A2780 e A2780 TGF-estimulou respectivamente. Em seguida, aplicamos o nosso programa de chamar pico de detecção, CORREIA, [24], [25] (ver Materiais e Métodos) para identificar os loci ligação de SMAD4 nestas duas condições. Resumidamente, o nosso programa CORREIA utiliza um método de pontuação percentil para determinar o valor de limiar para o enriquecimento de cada um dos principais percentis de todas as regiões de ligação, seguido de identificação do número de loci de ligação em cada nível percentil. A fim de determinar o significado de cada percentil, um conjunto de leituras simulado aleatoriamente é usado como um fundo para estimar a taxa de detecção falsa (FDR). Os nossos dados confirmaram chip SEQ SMAD4 múltiplos loci previamente identificados em diferentes tecidos e tipos celulares, incluindo Gadd45A, CTGF, JAG1, LEMD3 [14], MYC [26], EDN1, RYBP, DST, e BCAT1 [11] de ligação.

ocupação basal.

Foram identificados 2.009 loci ligação SMAD4 na condição basal (não estimulada) na linha de células A2780 (Tabela S1). Descobrimos que 1,499 (74,6%) loci estavam localizados dentro de +/- 100 kb de um gene de RefSeq conhecido [27]. Surpreendentemente, apenas uma pequena porção (267, de 1499, 13,3%) estavam dentro da região do promotor de (+/- 8 kb), de um gene, enquanto a maioria dos loci de ligação eram ou 10 kb a montante do 5’TSS ou 10 kb a jusante 3 ‘TSS (Figura 1A – linha vermelha). Este genoma análise de localização de largura inteira imparcial sugeriu que muitos outros estudos genômicos anteriores baseados na tecnologia promotor ChIP-chip [11], [12], [28] só pode identificar subconjuntos de genes alvo SMAD4.

A ) a distribuição da localização de locais de ligação em SMAD4 um histograma com base na sua relação a um RefGene 5’TSS conhecido mais próximo. B) A classificação dos loci de ligação SMAD4 em quatro padrões de ligação. Estimulados loci Apenas ligação são aqueles cuja RefGene associado tem loci obrigatória apenas no conjunto estimulada, mesmo para não estimulados somente. vinculativo turno loci têm loci de ligação aparecem no mesmo gene em ambas as condições e eles são maiores do que 1.000 nt distante. Basal loci de ligação aparecem no mesmo gene em ambas as condições, mas eles são menos de 1.000 nt distante. C) A captura de tela mostrando padrão de ligação LRRC17, onde SMAD4 se liga a 5’TSS de LRRC17 após a estimulação TGF, é categorizado para Stimulated Só Binding. D) Abundância de DNA seguinte SMAD4 ChIP puxar para baixo, em comparação com DNA presente seguinte puxar para baixo com anticorpo IgG não específico, conforme determinado pelo Syber PCR quantitativo verde. U e S usado para representar as regiões não estimuladas e estimuladas de ligação de SLC40A1, respectivamente. * Representa um valor de p t-teste menor que 0,05 e denota enriquecimento significativo em relação ao controle de IgG.

TGF-estimulado vinculativo.

Após a estimulação com TGF, encadernação 2.362 SMAD4 loci foram identificados (Tabela S1). Em geral, a distribuição da localização de locais de ligação, após a estimulação SMAD4 TGFp é muito semelhante ao que antes da estimulação (figura 1A – linha preta para linha estimulada e vermelho para não estimulado). No entanto, os padrões de ligação entre as duas condições (antes e depois da estimulação TGFp) são radicalmente diferentes (Figura 1B). Nós primeiro removido esses loci de ligação localizados longe de quaisquer genes conhecidos RefSeq (+/- 100 kb) e depois classificou-os (1.723 loci para estimulado e 1.499 loci para não estimulada) em quatro diferentes padrões de ligação: 1) basais Encadernação – dois loci de ligação estão associados com o mesmo gene e dentro de 1 kb distância uns dos outros (isto é, sem alterações de ligação); 2) Deslocamento de Ligação – dois loci de ligação estão associados com o mesmo gene em ambas as condições, mas eles são mais do que 1 kb separados um do outro; 3) estimularam Apenas Binding – um loci de ligação associado com um gene somente na condição estimulado; 4) não estimulados Apenas Binding – um loci de ligação associado com um gene somente na condição não-estimuladas. Com base na classificação acima, determinou-se que 74,2% (1.279 de 1.723) e 73,5% (1.102 de 1.499) dos loci de ligação estavam no Stimulated sejam vinculativas e não estimulados categorias Só encadernação respectivamente. Enquanto 24,8% (429 de 1.723) e 25,5 (382 de 1.499) loci de ligação foram classificados em Shift Encadernação para a estimulada e a condição não estimulada, respectivamente, apenas 15 loci obrigatório em cada condição (0,9% e 1,0%, respectivamente) caiu em o basal Encadernação. Nossos resultados mapeamento genômico mostrou que a estimulação TGF de células de cancro do ovário pode alterar a paisagem de padrões de ligação SMAD4. Uma lista completa dos padrões de ligação classificadas é mostrada na Tabela S2.

Além disso, a fim de verificar que a estimulação TGF resultou nas mudanças de ligação que observamos nos dados Chip-seq, escolhemos aleatoriamente um conjunto de 22 metas identificado por nossa análise e realizada ChIP-qPCR utilizando ADN isolado a partir de uma imunoprecipitação que era distinto do ADN utilizado para Chip-seq. Nossos validações ChIP-qPCR não só confirmaram os alvos identificados nos dados do chip-seq mas também ainda demonstrado que a sinalização TGF exógena ativado é capaz de produzir mudanças drásticas no SMAD4 vinculativo padrões (Figuras 1C, 1D e Figuras S1A, B).

Regulação da expressão do gene alvo TGF-estimulado SMAD4 em A2780

em seguida, foi realizada microarrays de expressão de genes para determinar o status de expressão para genes alvo SMAD4 após a estimulação TGF. A2780 ARNm a partir de três réplicas biológicas independentes de ambos antes e depois de 3 horas de estimulação, o TGF-p foi preparado e ensaiado em Affymetrix U133 Plus 2 Plataforma. No geral, 3.191 genes foram identificadas como sendo significativamente para cima ou para baixo-regulada após a estimulação com o TGF-p, pelo menos, uma mudança Log2 0,5 vezes na expressão e valor de p inferior a 0,1 (Figura 2A). Depois de examinar a correlação com 1,443 genes alvo SMAD4 estimulada por TGF-p (que corresponde a 1,723 SMAD4 loci de ligação no estado estimulado), a maioria (2873 de 3191) de genes com expressão diferencial em células A2780 surpreendentemente faltava loci ligação SMAD4, em que 318 genes tinham pelo loci menos uma ligação SMAD4 e mostrou pelo menos uma alteração de expressão Log2 0,5 vezes após 3 horas de estimulação TGFp (Figura 2B). Detalhes de 3.191 genes significativamente diferencialmente expressos estão disponíveis nas Tabelas S4 e 318 genes da Tabela S5.

A) A heatmap da expressão dobre mudanças para genes entre o unstimulated eo TGF condição estimulada, que mostra três grupos de genes ,-regulada, nenhuma mudança, e para baixo-regulado. genes regulados para cima e para baixo são definidos como tendo uma mudança Log2 vezes maior do que 0,5 ou menos do que -0,5, respectivamente. B) Uma comparação entre os genes com loci de ligação SMAD4 (1443) no TGFp estimulada condição com todos os genes que mostram uma expressão diferencial (3193), que mostra três grupos diferentes, aqueles com expressão diferencial e sem loci ligação SMAD4, aquelas sem expressão diferencial e um loci ligação SMAD4 e aqueles com ambos. C) GO anotações para os três genes diferentes do grupo que mostram em diagrama de Venn (B). D) nível de expressão de ARN, tal como determinado por qRT-PCR em relação aos níveis de expressão de GAPDH. As experiências foram realizadas em triplicado biológica. * Representa um valor de p t-teste menor que 0,05 e denota diferença significativa na expressão entre as condições não estimuladas e estimuladas.

Análise

Gene ontologia mostrou que os genes diferencialmente expressos com loci de ligação SMAD4 foram significativamente enriquecida de genes envolvidos com a parte da célula morfogênese e proteínas de desenvolvimento (Figura 2C-Gene Loci), em linha com os estudos anteriores em diferentes tipos de células [12], [36]. Nós também descobrimos que a ligação SMAD4 genes associados sem expressão diferencial foram enriquecidas para genes com domínio EGF e polimorfismo que sugerem que diferentes vias de sinalização pode mediar SMAD4 excepção TGF sinalização (apenas figura 2C-Loci) funções, enquanto o grande conjunto de diferencialmente expressos genes que faltam loci de ligação SMAD4 estavam envolvidos em funções imunológicas e da matriz extracelular proteica. Depois de examinar uma restrição de valor de p mais de 0,05 e dobre mudança de 0,5 para TGF estimulada genes diferencialmente expressos, obteve-se um conjunto de 1763 genes. Destes genes, encontramos 184 (10,4%) genes para ter pelo menos um local de ligação ao TGF-p estimulada SMAD4 (Tabela S6). Esta percentagem é muito semelhante ao conjunto de dados dos quais 318 (10%) de 3191 genes diferencialmente expressos tem, pelo menos, um local de ligação ao TGF-p estimulada SMAD4 (Tabela S5). A análise da função GO também foi muito semelhante em categorias superiores (Figura S2). Para confirmar ainda mais diferenciais expressa SMAD4 genes alvo resultante da estimulação TGF, escolhemos aleatoriamente um conjunto de 18 alvos identificados pela nossa análise e realizou um RT-qPCR. Mais do que 70% (13 de 18) os genes foram validados por RT-qPCR como mostrado na Figura 2D e a Figura S3. Uma lista de primers desenhados é mostrada na Tabela S7.

gene SMAD4 dependente redes reguladoras em TGF-induzida células de cancro do ovário

O nosso estudo anterior [12] e um estudo da Koinuma et al [ ,,,0],11] identificaram um conjunto de 150 TGF estimulada genes alvo SMAD4 em Iosé (uma linha de células epiteliais da superfície do ovário imortalizado) e um conjunto de 92 TGF estimulada genes alvo SMAD4 em HaCaT (uma linha de células de queratinócitos imortalizados). Não foi surpreendente encontrar sobreposição limitada de apenas 6 de 150 em Iosé, 6 de 92 em HaCaT, e 1 para todos os três estudos em comum com os 318 genes alvo SMAD4 neste estudo (Figura 3A) como um só, A2780, é uma linha celular de cancro e as outras duas são linhas de células normais. Outra possibilidade para tais taxas baixas que se sobrepõem é que ele pode ser devido aos alvos identificados utilizando limitados matriz promotor (ChIP-promotor-chip). GO análise [29] também mostraram genes alvo em HaCaT e Iosé eram principalmente envolvidos na regulação da proliferação celular (ou anti-apoptose) e processo de desenvolvimento (desenvolvimento muscular), que eram diferentes dos genes-alvo em A2780 (Figura 3B).

a) Um diagrama de Venn mostra a comparação dos genes alvo TGFp /SMAD4 em três tipos de células diferentes. B) GO anotações para os genes exclusivos para cada tipo de célula.

Para comparar ainda mais a diferença do SMAD4-dependente informações reguladora do gene TGF-estimulada entre estes três tipos de células, nós aplicamos uma abordagem analítica computacional que desenvolveu anteriormente [30] para construir as redes reguladas SMAD4-dependentes em HaCaT, Iosé, e A2780, respectivamente (Figura 4). Resumidamente, a nossa abordagem analítica computacional começou com conjuntos de dados baseada em chip e dados de expressão de genes. Cada ligação wa loci SMAD4 combinados para conhecer um ID gene RefSeq que foram então ser examinados para a expressão diferencial de genes. Um conjunto de genes alvo SMAD4 diferencialmente expressos após a estimulação TGF foram ainda utilizados para encontrar o fator de transcrição mais significativo (TF) parceiros de ligação por ChIPMotifs [31] ou ChIPModudles [32], que foram utilizados como TFs Hub. A ligação de TF-Hub gene foi determinado através do varrimento PWMs TFS Hub ‘em todos os loci de ligação e um teste de permutação foi utilizado para testar a fiabilidade de cada ligação da rede. A rede de regulamentação resultou foi visualizada por Cytoscape [33].

Foram identificados seis TFs Hub, GFI1, NR3C1, Sox17, STAT4, ZNF354C e TCF8 de 318 genes alvo SMAD4-dependentes em células A2780, enquanto quatro TFs Hub, LEF1 (TCF), ELK1, COUPTF (NR2F5) e E2F, foram identificados em células Iosé pelo nosso estudo anterior, utilizando uma abordagem (modelo CART) semelhantes [12]. Nossa abordagem analítica computacional também identificou três TFs Hub, E2F1, SP1, e USF, de 92 genes alvo dependente de SMAD4 em células HaCaT, que foi muito semelhante aos motivos TF identificados a partir da Koinuma et al. estudo [11]. O motivo topo relatou em seu estudo, AP1, foi perdido nos nossos resultados devido ao uso de um algoritmo de classificação avançado em nossos ChIPModules [32] e ser capaz de eliminar esses motivos TF que também são enriquecidas em conjuntos aleatórios. Curiosamente, também encontramos um Hub TF E2F (E2F1) era comum entre as duas células normais, mas não em comum com células A2780. Juntamente com a análise GO função, os nossos resultados indicam que E2F pode actuar como um parceiro importante factor de transcrição de co-SMAD4 na mediação da proliferação celular em células normais, mas perdido em células de carcinoma. As redes reguladoras de genes resultante (GRN) para todas as três células são mostradas na Figura 4. De modo geral, a nossa análise de rede de transcrição indica que o TGF-p estimula fortemente um mecanismo regulador SMAD4-dependente diferente em células de cancro do ovário em relação às células normais, isto é, o SMAD4 rede de regulação tornou-se “religado” em células de cancro do ovário.

assinaturas de gene de selecção e evolução clínica

Uma das promissoras aplicações potenciais de «estudos de genómica do genoma utilizando sistemas de linha de células é a identificação de assinaturas genéticas que podem fornecer uma melhor informação de prognóstico em comparação com parâmetros clínicos e patológicos padrão [34], [35]. Para abordar a relação de TGF estimulada genes alvo dependente de SMAD4 e evolução clínica de pacientes com câncer ovariano, examinamos os 307 genes alvo identificados em células A2780 neste estudo, que não foram identificados em estudos anteriores de células normais, em duas ovário clínica diferente estudos de coorte câncer que tinham relatado dados de sobrevivência [36], [37]. Classificamos primeiro os pacientes em diferentes sub-grupos, com base em suas assinaturas de genes, e então correlacionados os dados com as informações de sobrevida do paciente. Em mineração a 153 coorte paciente Bild et al [36], fomos capazes de utilizar os 187 de 307 genes identificados no conjunto de dados de expressão gênica para aplicar o método de agrupamento hierárquico com medidas baseadas na distância de uma perspectiva de tentativa e erro e classificar os genes em quatro grupos de genes (Figura 5A). Para cada um dos quatro grupos de genes, que ainda agrupado as 153 amostras em quatro grupos de pacientes (PGs, Figura 5B), e correlacionados com as PGs sua informação sobrevivência. De 153 pacientes, apenas 124 têm informações completas sobrevivência, portanto, foram ainda utilizados para parcelas da curva de sobrevivência. Descobrimos que uma assinatura de um subconjunto de 49 genes (gene de grupo G2) que foi capaz de prever uma correlação significativa para a sobrevivência de 62 dos pacientes com um valor de p de 0,0471 (Figura 5C, D). Especificamente PG: 4 (25 pacientes) apresentaram sobrevida média pobre de 31 meses em comparação com PG: 3 (37 pacientes), com uma sobrevida mediana de 63 meses. Um gráfico da curva de sobrevivência para dois grupos de pacientes, PG: 3 e PG: 4 usando um selecionados aleatoriamente 49 genes (onde eles não estão dentro 49 genes G2) mostrou um valor de p teste log-rank de 0,1558 (Figura 5E). Devido à informação patológica limitado disponível para esse grupo de pacientes, não fomos capazes de correlacionar significativamente nossas assinaturas genéticas com outros resultados clínicos. No entanto, uma porcentagem muito alta da fase IV pacientes agrupadas em PG3 enquanto todos estágio IC e dois pacientes estágio IIC agrupadas em PG4, apesar de um número semelhante de pacientes estágio IIIC em cada (Tabela S8), talvez indicando que o TGF-p /SMAD4 genes regulados poderia ser potencialmente usada para classificar um subtipo de pacientes com câncer ovariano.

a) O resultado de agrupamento hierárquico dos 187 genes em quatro grupos de genes, ou seja G1, G2, G3 e G4. O eixo vertical representa os agrupamentos de genes (187 genes) e o eixo horizontal representa diversas amostras (153 pacientes). B) O resultado de agrupamento hierárquico dos 153 pacientes em quatro grupos de pacientes, ou seja, PG: 1, PG: 2, PG: 3 e PG: 4 utilizando o grupo G2 de 49 genes. C) enredo curva de sobrevivência para o grupo gene G2. O eixo horizontal representa os meses de sobrevivência e a vertical para a sobrevivência percentual (%) no grupo de doentes correspondente. Totalmente quatro grupos de pacientes, isto é, PG: 1, PG: 2, PG: 3 e 4: PG são analisadas para o grupo de genes G2. D) A trama detalhada curva de sobrevivência para dois grupos de pacientes, PG: 3 e PG: 4, mostrando um teste log-rank valor p significativo de 0.0471.E) Um gráfico da curva de sobrevivência para dois grupos de pacientes, PG: 3 e PG: 4 usando um selecionados aleatoriamente 49 genes (onde eles não estão dentro 49 genes G2), mostrando-rank teste log p-valor é 0,1558.

Quando aplicamos o mesmo

in silico

abordagem de mineração para o segundo grupo de pacientes de Lu et al [37], (composto por 42 pacientes e 5 pessoas normais), os resultados mostraram que um gene assinatura de 19 dos 307 genes previu melhores taxas de sobrevivência para PG4 e normais do que outros PGs com um valor p de 0,0078 (Figura S4).

Discussão

Temos pela primeira vez aplicada a tecnologia de chip-seq para todo o genoma em todo o mapeamento de TGF-estimulado, SMAD4- genes regulados dependentes numa linha celular de cancro do ovário (A2780). Os nossos dados mostram que em comparação com o estado basal (sem estimulação TGFp), a maioria dos SMAD4 loci de ligação ou são recém obrigado a cromatina (74,2%) ou deslocado ligado (24,8%) após estimulação TGFp, sugerindo TGFp estimuladas células cancerosas podem alterar o paisagem de padrões de ligação SMAD4. Além disso, nossa análise GO revelou similaridades impressionantes entre as 10 principais categorias de ir para 1.443 e 1.316 genes alvo SMAD4 em estimulada e condições não estimuladas (dados não mostrados). No entanto, 318 genes diferencialmente expressos, contendo pelo menos uma estimulado loci ligação SMAD4, foram significativamente enriquecido para termos GO mais específicos, como parte de células morfogênese e proteínas de desenvolvimento. Este resultado indica que SMAD4 pode regular um conjunto muito específico de genes alvo em resposta a sinalização de TGF-p, a fim de facilitar as funções específicas nesse tipo de célula através desta via de sinalização específicos. Na verdade, GO análise de genes alvo SMAD4 sem alterações do nível de expressão gênica após a estimulação TGF encontrada uma das categorias de gene enriquecida é ‘EGF como sinalização’, fornecendo mais evidências de que outras vias de sinalização pode modular genes regulados SMAD4-dependentes em câncer de ovário. Um tal exemplo pode ser as proteínas morfogenéticas do osso (BMPs), que estão também a montante da SMAD4 e, assim, podem ser capazes de regular alguns destes genes alvo SMAD4. BMPs foram mostrados para ser reguladores chave da fisiologia do ovário e envolvido no desenvolvimento do cancro do ovário e outros cancros [38] – [40]. Em estudos futuros a contribuição de regulação dos genes-alvo SMAD4 identificados uns dos caminhos de sinalização tentará ser disambiguated

À semelhança de outros resultados para fatores de transcrição, incluindo estrogênio receptor alfa (ERa) [41] -. [43 ], o receptor de androgénio (AR) [44], e receptor de peroxissoma activado por proliferador (PPAR) [45], observou-se que a maioria ( 70%) de loci de ligação SMAD4 localizado a mais de 8 kb de distância a partir de 5’TSS um gene RefSeq conhecido. Isto pode sugerir o loci ligação TGF vêm em estreita proximidade com o promotor através do cromossomo looping com a estimulação TGF. Curiosamente, a análise

de novo

motivo também identificado um motivo Smad-como em um conjunto de loci de ligação do 5-distal, mas não em um conjunto de loci 5′-promotor (dados não apresentados). Nossa análise local do genoma também aponta a importância das tecnologias de sequenciamento de todo o genoma escala, como mostramos muitos loci de ligação estão longe do 5’TSS de um gene conhecido e, portanto, uma tecnologia promotor-array pode perder muitos loci de ligação ao alvo de um factor de transcrição. Nossos estudos futuros incidirá sobre a realização de ChIP-3C-qPCR para confirmar se estes loci de ligação distais são, de facto relativa a estes genes particulares, potencialmente descobrir o mecanismo subjacente da regulação de genes mediada TGF /SMAD4.

Um aspecto importante da este estudo é o uso de

in silico

de mineração de dados de coorte de pacientes disponíveis ao público para identificar um subconjunto de genes alvo TGF /SMAD4 como uma assinatura genética para prever os resultados clínicos (sobrevivência). Tanto quanto sabemos, este é o primeiro estudo a tentar usar TGF sinalização genes regulados SMAD4 responsivos para classificar os pacientes de cancro do ovário em diferentes sub-tipos de grupos de pacientes, bem como prever pobres sobrevivência das boas populações de sobrevivência com significância estatística (Figura 5). Assim, combinando ChIP-seq identificados loci vinculativo, perfil de expressão gênica, e um

in silico

mineira de coortes de pacientes podem fornecer uma abordagem poderosa para a identificação de assinaturas genéticas potenciais com importância biológica e clínica.

em conclusão, o estudo fornece a primeira mapa de todo o genoma completo de milhares de alvos TGFp /SMAD4 numa linha celular de cancro do ovário, o que poderia ainda ser usados ​​para o estudo de funções SMAD4 na tumorigénese. Para nosso conhecimento, este é o primeiro estudo a relacionar TGF /SMAD4 genes regulados à informação clínica sobre a sobrevida do paciente de cancro do ovário e identificar assinaturas de genes potenciais para o prognóstico no câncer de ovário. Em nossos estudos futuros, iremos realizar análise ChIP-seq de locais de ligação de TGFp /SMAD4 utilizando um painel de linhas celulares de cancro do ovário, representando diferentes subtipos histológicos e células cancerosas iniciar ovarianos.

Materiais e Métodos

cultura celular e TGFp estimulação

células A2780 [15] foram cultivadas em meio RPMI 1640 (Invitrogen, Carlsbad, CA) suplementado com soro fetal bovino a 10% numa CO 37 ° 5%

2 incubadora. Antes da estimulação TGFp, células foram divididas em ~ 70% de confluência e inspeccionados diariamente. Para o chip, 80% de células confluentes foram optimamente estimuladas com 10 ng /ml de TGF-p1 recombinante (Sigma, St. Louis, MO) durante 1 hora antes de formaldeído de ligação cruzada, enquanto a análise da expressão foi realizada após 3 horas de estimulação com 10 ng /mL TGF-p1.

Cromatina imunoprecipitação e maciça sequenciamento paralelo

a cromatina imunoprecipitação (CHIP) foi realizada como descrito anteriormente [46], [47] com algumas notas alterações dignas. Resumidamente, as células foram enxaguadas com PBS temperatura ambiente antes de ser reticulado em solução de formaldeído a 1%. As células foram então recolhidas e homogeneizados na presença de inibidores de protease antes DNA foi sonicado. esferas Dynal Magnetic (Invitrogen), combinada com uma mistura de anticorpos (20% SMAD4 # 9515 (Tecnologia Cell Signaling, Danvers, MA) e 80% SMAD4 DCS-46 (Santa Cruz Biotechnology, Santa Cruz, CA) foram usadas para puxar para baixo SMAD4 durante a noite. O DNA purificado foi utilizado para detectar o enriquecimento vezes por Syber verde qRT-PCR ver Tabela S3 para obter uma lista de iniciadores.

bibliotecas de sequenciação foram gerados para a sequenciação em paralelo massivo, utilizando métodos convencionais. Resumidamente, 500 ng de ADN de pulldown foi sujeito a reparação terminar, adenilação do terminal, e a ligação adaptador antes de fragmentos que variam de ~175-250 foram isolados a partir de um 2% e-gel (Invitrogen). subsequente a um ciclo de 12 padronizado de PCR, ADN de qualidade foi avaliado numa ADN Bioanalyzer 1000 . chip (Agilent Technologies, Santa Clara, CA) antes de ser submetido à sequenciamento em uma Illumina GAII Todos os dados do chip-seq é depositado no banco de dados Gene Expression Omnibus (GEO) do Centro Nacional de Informações sobre Biotecnologia (http: //www.ncbi .nlm.nih.gov /geo) e são o número de acesso GSE27526.

a expressão de genes de perfil

o ARN total foi extraído a partir de células utilizando Trizol (Invitrogen) para análise em uma microrarray Affymetrix HGU133 Plus 2

Deixe uma resposta