PLOS ONE: Gamma-Retrovirus Marcas Integração tipo de célula-Specific genes do câncer: uma ferramenta de análise Novel em Câncer Genomics

Abstract

Os retrovírus têm sido fundamental na pesquisa do câncer desde os primeiros estudos identificados proto-oncogenes como alvos para inserção mutagênese. Integração de gama-retrovírus murinos no genoma do hospedeiro favorece promotores e intensificadores e implica interacção da integrase viral com BET hospedeiro /factores bromodomain. Relatamos que este padrão de integração é conservada no vírus da leucemia felina (FeLV), um gama-retrovírus que infecta vários tipos de células humanas. Análise de locais de inserção de FeLV na linha de células de carcinoma mamário MCF-7 revelaram forte tendência para as marcas de cromatina activas com nenhuma evidência de selecção significativa do crescimento pós-integração. Os alvos mais proeminentes de integração FeLV tinha pouca sobreposição com as transcrições mais abundantemente expressos, mas foram fortemente enriquecido para genes do cancro anotados. Uma meta-análise baseada em vários perfis de integração gama-retrovírus (GRIP) estudos em células humanas (CD34 +, K562, HepG2) revelou um viés gene do cancro semelhante, mas também notável tipo de célula especificidade, com exceções de destaque, incluindo um hotspot integração universal na longa não-codificante RNA

MALAT1

. Comparação de alvos aderência com bases de dados de super-potenciadores das mesmas linhas celulares mostraram que estes têm única sobreposição limitada e que GRIP oferece uma visão única para os motoristas a montante do crescimento celular. Estas observações elucidar a potência oncogênico dos gama-retrovírus e apoiar a aplicação mais ampla da GRIP para identificar os genes e crescimento circuitos reguladores que dirigem tipos de câncer distintas

Citation:. Gilroy KL, Terry A, Naseer A, de J Ridder, Allahyar A, Wang W, et al. (2016) Gamma-Retrovirus marcas Integração tipo de célula-Specific genes do câncer: uma ferramenta de análise Novel em Câncer Genomics. PLoS ONE 11 (4): e0154070. doi: 10.1371 /journal.pone.0154070

editor: Maria Bryk, Texas A M University, United States |

Recebido: 15 de fevereiro de 2016; Aceito: 10 de abril de 2016; Publicação: 20 de abril de 2016

Direitos de autor: © 2016 Gilroy et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Data Availability:. Todos relevante os dados estão dentro do papel e seus arquivos de informação de suporte, ou que tenham sido disponibilizadas anteriormente através de manuscritos publicados

Financiamento:. KLG, AT, AN, AK, ERC e JCN foram apoiados por um programa conjunto do Cancer Research UK e Bloodwise (números de subvenção A11951 (CRUK) e 13046 (Bloodwise); URLs são https://www.cancerresearchuk.org/e https://bloodwise.org.uk/). JDR foi financiado por uma bolsa VENI (639.021.233) da NWO (Holanda Organização de Investigação Científica, https://www.nwo.nl/). AM foi financiado pela Canadian Institutes for Health Research (MOP 97.798, https://www.cihr-irsc.gc.ca/~~number=plural). GK-SW foi financiado pela Alberta Inova Tecnologia Futuros (IATF, https://www.albertatechfutures.ca/) e Inova Centro de Investigação de Excelência (Icore). Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

a capacidade de retrovírus para dirigir integração estável é inerentemente mutagénicas e pode perturbar genes da célula hospedeira no local de inserção proviral ou mesmo a uma distância significativa [1,2]. Embora esta característica tem vindo a ser considerada, principalmente, como uma complicação indesejada para a utilização de vectores retrovirais em terapia génica [3,4], que tem sido um recurso valioso na investigação do cancro, como os locais de integração de retrovírus, em que ocorre naturalmente ou experimentalmente cancros induzidos a partir de aves, ratos e gatos têm proporcionado uma rica colheita de genes motorista câncer e famílias, incluindo

Myc

,

Myb

,

Pim

,

Runx

,

Bmi1

,

Gfi1

e

Notch

[1]. A conclusão da sequência do mouse genoma eo advento da alta clonagem rendimento e sequenciamento de locais de inserção alargou o âmbito destes estudos maciçamente, revelando vários novos genes alvos potenciais [5-7]. Supunha-se nos primeiros estudos que a integração retroviral é efetivamente aleatória, e que os locais comuns de integração específicos do cancro (CISS) surgiu apenas da expansão clonal após inserções raros em locais sensíveis que coincidiram em tumores independentes por acaso. Por outro lado, tornou-se claro nos últimos anos que os retrovírus têm preferências de integração significativas que reflectem as suas características biológicas distintas e modos de colonização do hospedeiro.

A predileção do lentivírus HIV para integrar genes ativamente transcritas é uma característica fundamental da sua patogênese onde ele transita entre a infecção latente e replicação citopático. Para o HIV, este processo implica interacção entre a proteína integrase viral e LEDGF, um co-activador transcricional que amarra o complexo de integração a cromatina e facilita a integração [8,9]. Em contraste, a replicação de gama-retrovírus é geralmente não citopático e hospedeiros infectados persistentemente podem exibir elevados níveis de viremia, com tumores induzidos por mutagénese insercional um resultado relativamente comum de infecção [10,11]. O não-aleatoriedade do vírus da leucemia murina (MLV) integração foi apreciado primeiro dos estudos iniciais que destacou preconceitos em relação locais hipersensíveis DNAseI e transcricional de começar locais [12]. A base desta especificidade foi recentemente elucidados com a demonstração de que a integrase MLV interage com BET /proteínas bromodomain (Brd2, 3 e 4), que por sua vez se ligam a histona acetilada H3K27ac, marcando algumas das regiões mais ativas da cromatina [13-15 ]. A importância dessa interação é sublinhada pela redução significativa no título e /ou perda de TSS alvo de MLV cultivadas na presença de inibidores BET JQ1 e I-BET

in vitro

[13-15]. Isso cria uma nova conexão com a investigação do cancro como inibidores BET estão actualmente a ser investigada em ensaios clínicos para o tratamento de vários tipos de câncer [16].

A extensão total de saída do aleatória de integração MLV tornou-se claro apenas com o advento de métodos de grande escala para capturar e locais de integração sequência em populações de células policlonal infectados

in vitro

antes de qualquer seleção crescimento significativo. estudos de grande escala de integração vector de MLV em células CD34 humanos ou infecção pseudotipo MLV de linhas celulares de cancro humano revelou um processo notavelmente selectiva em que mais de metade das integrações alvo menos do que 2% do genoma humano [17,18]. Além disso, os sites genômicas preferenciais ocorrer em marcas de cromatina activos e incluem potenciadores fortes, bem como promotores.

Neste estudo nós exploramos as preferências de integração de outro gamma-retrovírus, vírus da leucemia felina (FeLV). Utilizou-se o FeLV-B, uma variante de ocorrência natural comum de FeLV que é capaz de infectar células humanas praticamente todos cultivadas sem citopatologia evidente [19] através da interacção com o transportador de fosfato amplamente expresso PIT1 [20]. Nós inicialmente analisados ​​integrações na linha de células MCF-7 humana de câncer de mama que é permissiva para espalhar, replicação título elevado FeLV-B, e está entre as melhores linhas celulares de cancro caracterizados com relação à genómica funcional. FeLV-B exibida uma preferência semelhante para locais de início da transcrição e marcas de cromatina ativa a MLV, consistente com a conservação do loop C-terminal da integrase, que se liga a apostar /Brd [21]. No entanto, FeLV especificidade integração não foi dirigido principalmente para os genes mais abundantemente expressa, mas foi fortemente desviada para genes motorista de câncer de mama. Esta constatação inspirou uma meta-análise de preferência integração gama-retrovírus a partir de vários estudos que revelaram um elevado grau de tipo de célula especificidade, enquanto que os genes do câncer foram favorecidos em todos os casos, incluindo em células normais. Estes achados sugerem que o perfil de gama integração retroviral (GRIP) vai ser uma valiosa ferramenta para a identificação de genes de driver de câncer de linhagem específica em uma ampla variedade de tipos de câncer humano.

Resultados

integração FeLV em células de câncer de mama humano como alvo locais de início da transcrição e marcas de cromatina ativos

Clonagem de locais de integração FeLV-B em células MCF-7 de cancro da mama infectados por PCR mediada por ligante e mapeamento para o genoma humano produziu 20.634 autêntica a vírus hospedar fragmentos de junção, correspondendo a 8.052 inserções únicas (Fig 1A, S1 Dataset). O número relativamente baixo de cópias por inserção única sugeriu que nenhuma selecção clonal significativa havia ocorrido durante o breve período de crescimento

in vitro

, e esta questão foi examinada ainda pela análise de viés de orientação pró-viral. Enquanto o próprio processo de integração é aleatória no que diz respeito à orientação, a propensão de gama-retrovírus para ativar genes hospedeiros por meio da inserção potenciador, um processo que é fortemente afetado pela orientação, leva ao surgimento de clones dominantes com viés acentuado na chave de integração hot-spots que pode ser demonstrado estatisticamente por uma análise ‘heads-caudas’ [22]. Nós aplicamos este teste para o conjunto de dados FeLV /MCF-7. Dos 100 genes mais frequentemente alvo, 8 mostraram evidência de viés de orientação (p valoriza 0,011-0,049 pelo teste exato de Fisher), mas nenhuma dessas observações sobreviveu correção de Bonferroni ou Benjamini-Hockberg para testes múltiplos (em todo o valor p 8 casos com Bonferroni correção foi de 1, eo valor p com correção Benjamini-Hockberg era 0,612). Além disso, nenhum dos genes próximos foram anotados motoristas de câncer, e nenhum apresentou o clássico “a montante e para trás ‘agrupamento que é mais frequentemente observado com este modo de ativação de oncogenes [1]. Além disso, as inserções em 100 genes mais frequentemente alvo não mostraram nenhuma evidência de aumento do número de cópias em comparação com o conjunto de dados como um todo, com uma média de 2,7 e 2,6 cópias /inserção, respectivamente (p = 0,44). Estas observações sugerem que o mínimo selecção clonal ocorreu após a integração e que uma distribuição não aleatória no genoma observado é devido, principalmente, com a preferência local de inserção. Clustering de inserções FeLV cerca de transcrição começa locais (TSSS) foi evidente a partir do conjunto de dados, com um pico duplo em +/- 1,5 kb e uma calha diretamente na TSS indistinguível do padrão observado para MLV [17] (Fig 1B). A posição das inserções dentro do gene mais próximo foi determinada e é mostrada na Figura 1C. A maioria das inserções estão dentro do gene, com a próxima maior grupo a montante do gene, consistente com a sua segmentação de elementos intensificadores

A:. Fluxo de trabalho experimental. B: Posição de inserções em células MCF-7 em relação à TSS, mostrando um pico duplo com calha no TSS. C:. Gráfico de pizza que mostra a posição das inserções em células MCF-7 em relação ao gene mais próximo

Para determinar se as marcas epigenéticas específicas também foram alvo de vírus, foram analisados ​​os dados do consórcio ENCODE. conjuntos de dados de chip seguintes para todas as marcas de histona disponíveis em células MCF-7 foram processados ​​e os picos anotados como descrito em Materiais e Métodos. marcas histonas disponíveis eram H3K27ac, H3K9me3, H3K36me3, H3K27me3 e H3K4me3. A sobreposição de MCF-7 inserções com marcas de histonas foi determinada e está resumida na figura 2. Em primeiro lugar foram considerados marcadores de cromatina ativa, sendo estes H3K27ac (marca potenciador), H3K4me3 (marca promotor activo) e H3K36me3 (marcador de alongamento). Tal como resumido na Figura 2A, uma grande proporção das células MCF-7 inserções de sobreposição com estas marcas de histonas (41,8%); a maior sobreposição ocorre apenas com tanto H3K4me3 (1119 inserções, 15,7%) ou com ambos H3K4me3 e H3K27ac (1508 inserções, 21%). Ao considerar marcas repressivas H3K9me3 e H3K27me3, havia muito pouca sobreposição com MCF-7 inserções (apenas 0,97% no total, Fig 2B). Considerando a importância de sobreposição de pares de MCF-7 inserções com cada uma das cinco marcas de histonas, nenhum foi estatisticamente significativa com a excepção de H3K27ac, que foi altamente significativa com um valor de p de 4.96E-69 (valores de p para todos os outros sobreposições foram emparelhadas 1). Tendo examinado a relação global entre anotação marca de histona e inserção MCF-7, foi analisada a relação de marcas de histonas dos clusters de inserção mais significativos. Uma análise ‘mais próxima gene “foi efectuada como descrito em Materiais e Métodos, atribuindo a cada inserção para um gene e avaliar a importância da inserção no gene que. Da mesma forma, as marcas de histonas foram anotados e dezenas de significância (p-scores) obtidos usando o conjunto Galaxy /Cistrome como descrito em Materiais e Métodos. Os 500 melhores sucessos de genes para cada marca de histona (identificado por p-score) foram recolhidos e em comparação com os principais alvos de integração retroviral e se sobrepõem avaliada. A probabilidade de uma tal sobreposição ocorrer por acaso foi avaliada por meio de simulação de Monte-Carlo tal como descrito em Materiais e Métodos. Os dados são resumidos na figura 2C e na Tabela 1. Os três marcas de cromatina activas mostram sobreposição significativa quando os aglomerados genes mais importantes são considerados, com valores de p de 1.67E-8, 0,00236 e 0,0014 por H3K27ac, H3K4me3 e H3K36me3 respectivamente. A cromatina repressivo marca H3K9me3 e H3K27me3 não mostram nenhuma associação significativa com a MCF-7 inserções (p = 1 ep = 0,97, respectivamente). No geral, a comparação com todas as modificações das histonas disponíveis mostram consistentemente que as inserções são direcionados para marcas de cromatina ativa e está ausente de marcas repressivas

A:. Associação global de inserções com marcas de histonas ativo que mostra o número de recursos que se cruzam. B: associação global com marcas de histonas repressivas. C: associação estatística dos genes mais próximos mais significativamente enriquecido para inserções e marcas de histonas. Os valores de p mostrados são transformadas. A linha a tracejado representa p = 0,05. D: agrupamentos de genes Exemplo alvo de FeLV em células MCF-7, como exibido no navegador UCSC Genome. As inserções são mostrados em púrpura no topo, seguido por esquemas de estrutura do gene, e densidade de sinal finalmente H3K27ac ChIP-seq.

O número de sobreposição de genes a partir do top 500 são notadas, assim como a p valores de significância de sobreposição. Note-se que o valor de p para H3K27ac representa um 1 em 60×10

6 hipótese da associação ocorrer por acaso, mas o verdadeiro valor de p será menor que esse nível de sobreposição não foi observada em 60×10

6 simulações.

genes motorista câncer de metas de integração FeLV em células MCF-7 de cancro da mama

anteriores estudos de grande escala se concentraram em murino gama-retrovírus e integração vector em células normais e malignas e notou-se anecdotally que muitas inserções vetor em células CD34 normais foram em sites “perigosos” no que respeita ao risco de malignidade, incluindo o locus LMO2 que tem caracterizado como um alvo frequente de integração vector em terapia genética leucemias associados [3,4]. inspecção inicial das maiores aglomerados de inserção de FeLV em células MCF-7 mostraram um notável concentração em genes com relatada sobre-expressão ou amplificação no cancro da mama ou com uma perda de função fenótipo knockdown em células MCF-7. aglomerados de genes exemplo mostrado na figura 2D incluir três conjuntos de genes HOX, incluindo o tempo de não codificação de RNA

HOTAIR

, juntamente com chromobox

CBX2

e o tempo de ARN não codificadora

MALAT1

. Na maioria dos casos, as inserções coincide essencialmente com picos de H3K27 acetilação, e em menor grau com o trimethylation H3K4 e marcas trimethylation H3K36, consistente com os dados anteriores mostrando associação com marcas de cromatina activas (anotação histona total para estes genes é mostrado na S1 FIG) .

Estas observações nos encorajou a levar a cabo uma análise mais sistemática dos locais de inserção preferenciais. análise do gene mais próximo identificados 6926 genes. Os 100 melhores genes foram determinadas seleccionando primeiro para significância estatística (p 0,05 pelo teste exato de Fisher), e em seguida no ranking por ordem do número de inserções. Os alvos principais de integração 100 MCF-7 por estes parâmetros compreendem inserções 773 (6,7% de inserções total), e estão apresentados na Tabela S1. Estes foram cruzados com o Gene Census Cancer [23], uma rigorosa, banco de dados regularmente actualizada de genes de câncer com base em fortes evidências do estado gene driver (https://cancer.sanger.ac.uk/census/).

11 dos 100 MCF-7 metas de integração foram encontrados para ser genes motorista do cancro (ver Fig 3A e S2 Tabela). Este é um enriquecimento altamente significativa sobre o nível de fundo de genes do controlador de cancro no genoma, como um todo, que é de 2,2% (p = 2.01E-09). Para investigar as vias visadas pela integração FeLV, os genes alvo top 100 foram interrogados pela suíte de software QIAGEN Ingenuity Pathway Analysis (IPA) (IPA, QIAGEN Redwood City, www.qiagen.com/Ingenuity). Descobrimos que o processo biológico superior definido para este conjunto de genes foi ‘Cancer’ (p valor da faixa de 1.95E-2-4.6E-6, p mediana = 0,00789), fornecendo mais evidências de seletividade para os programas do gene do cancro (Fig 3B). Tendo estabelecido direccionamento preferencial dos genes do cancro do controlador, examinou-se o tipo de célula especificidade de genes alvo. anotação IPA ‘câncer’ para o top MCF-7 hits foi examinado ainda mais, olhando para câncer de sub-processos. Surpreendentemente, três dos cinco maiores câncer sub-processos foram relacionados ao câncer de mama, mostrando uma assinatura gene do câncer específica do tecido forte nos objectivos de integração de topo (Fig 3C)

A:. Percentagem de clusters top 100 genes de inserção que são genes do controlador de cancro, em comparação com o genoma como um todo. B: IPA melhores processos agrupamentos que mostra a gama de valores de p transformadas, com mediana transversal indicado pela cinza. C: Top 5 subtipos “cancro” identificados pelo IPA, com valor de p transformado mostrado. A linha pontilhada representa p = 0,05. D:. Percentual das 100 maiores agrupamentos de genes de inserção com anotação do cancro da mama conhecido como determinado pela revisão sistemática da literatura em relação a um conjunto aleatório de 100 genes

Para verificar a anotação gene do cancro da mama enriquecido no MCF locais de integração top -7, uma tela da literatura científica revisada por pares foi realizada para os 100 melhores genes MCF-7-alvo em comparação com 100 genes escolhidos aleatoriamente. Para minimizar o viés, em cada caso, foi utilizado o mesmo termo de pesquisa ( nome do gene + “cancro da mama”), e os mesmos critérios para a anotação do cancro da mama conhecido (associação direta do gene com cancro da mama com o controlo a posteriori por exemplo knockdown ou estudos de expressão). 29 dos 100 MCF-7 metas de integração tinha conhecido anotação do cancro da mama, em comparação com 5 dos aleatórios 100 genes, uma diferença que foi altamente significativa (p = 3.35E-28, Fig 3D). Em conjunto, estes resultados indicam que a integração preferencialmente como alvo um conjunto de genes específicos do tipo de célula, que também é relevante para o fenótipo do câncer.

Genes em locais de inserção preferenciais da FeLV exibir níveis heterogêneos de expressão

Anterior estudos têm demonstrado que a gama-retrovírus integram em regiões de expressão do gene activa, muitas vezes em regiões reguladoras, tais como regiões de promotor e intensificadores. Para determinar se FeLV tem como alvo os genes mais altamente expressos, os melhores alvos MCF-7 de integração foram comparados com os genes mais altamente expresso em células MCF-7 de células utilizando um conjunto de dados de microarray publicado anteriormente [24]. MCF-7 genes foram classificados de acordo com a intensidade e a posição dos 100 melhores genes alvo GRIP observado (Fig 4A). Esta análise revelou nenhuma tendência aparente de integração FeLV para os genes mais altamente expressos. Para analisar esta relação estatisticamente, aumentando o tamanho das amostras foram usadas para examinar como a relação variou quando considerando apenas os top hits ou uma seleção genética mais ampla. O nível de sobreposição em cada tamanho da amostra foi comparado com o previsto para ocorrer por acaso, por simulação de Monte-Carlo, e valores de p calculados (ver Materiais e Métodos para detalhes)

A:. Trama ordem de classificação que mostra a intensidade de todas as sondas de microarranjo para MCF-7. Mostrados em vermelho são os top 100 grupos de genes direcionados pela inserção FeLV. B: Transformado valores de p do significado da associação entre as principais genes alvo de inserção e os genes mais altamente expresso para diferentes tamanhos de amostra. A linha tracejada representa o nível p = 0,05 importância. C: Tabela mostrando os valores de p representado em B para os diferentes tamanhos de amostra

As 150 principais genes alvo retrovirais não mostrou maior sobreposição com as 150 principais genes altamente expressos do que o esperado por acaso em MCF-7. células (valores p para os top 50, 100 e 150 genes foram 1, 0,22 e 0,43, respectivamente (Fig 4B e 4C)). O longa não-codificante RNA

MALAT1

era o único elemento genético que se sobrepunham os genes mais altamente expresso e as metas retrovirais preferenciais nesta análise. Com a ressalva de que as taxas de transcrição e níveis de ARN do estado estacionário não são sinónimos, estes resultados sugerem que as 150 principais metas de integração retrovirais estão sendo selecionados por um processo mais sutil do que afinidade para as regiões mais ativas da cromatina host. Em contraste, estendendo a análise a um número maior de alvos preferenciais ( 200) detectado crescente sobreposição com os genes mais altamente expresso, sugerindo um processo de seleção bimodal

preferências integração Gamma-retroviral:. Uma meta-análise

Depois de ter mostrado que FeLV seletivamente metas genes motorista câncer em uma linha de células de câncer de mama humano, foi aplicada a mesma abordagem para conjuntos de dados publicados de locais de integração ‘não selecionados’ retrovírus gama em células humanas para estabelecer a generalidade destas observações. Para esta meta-análise que utilizou dados publicados inserção de duas linhas humanas de câncer de celulares, K562 e HepG2 [18] e células CD34 + normais [17]. Enquanto estes estudos foram realizados com gRVs murino e infecção de células humanas foi conseguido por pseudotipagem de vírus MLV infeccioso com o VSV-G de envelope [18] ou de distribuição de vector anfotrópico [17] em vez de uma infecção natural, uma preferência código histona muito semelhante ao nosso estudo foi notada, o que sugere que a função de integrase conservado é o principal determinante da especificidade.

os detalhes dos conjuntos de dados utilizados na meta-análise estão resumidos na Figura 5A. Os conjuntos publicados são substancialmente maiores do que a nossa MCF7 definir e obter um número similar de genes do sítio de inserção preferidos que definir um limite maior significado, antes de classificar os genes pelo número de inserções como anteriormente. Durante três MLV conjuntos de dados houve novamente um enriquecimento altamente significativa para genes motorista câncer. Para as células CD34 +, 15% dos principais genes-alvo teve como condutores de cancro (enriquecido em relação à linha de base do genoma total de, p = 2.69E-18), por K562 o número foi de 11% (p = 2E-9) e para HepG2 6% . (p = 0,0096)

a: Resumo dos dados utilizados, incluindo o tamanho dos conjuntos de dados. B: Heatmap mostrando a associação global dos locais de inserção GRV com modificação da histona para todas as linhas celulares. O azul representa marcas favorecidas enquanto o vermelho representa marcas desfavorecidas. Os asteriscos indicam significância, com * sendo p 0,05, ** p 0,01 e *** p 0,001. C: Enriquecimento de genes motorista do cancro com o refinamento dos top hits para todas as linhas celulares. A linha tracejada representa a percentagem de genes do controlador de cancro no genoma (2,2%) D: Posição de inserções em relação ao local de início da transcrição para todas as linhas celulares. Número aproximado de inserções totais é mostrado abaixo de cada gráfico.

As marcas epigenéticas visados ​​pelo vírus em cada contexto celular foram examinadas como descrito acima, utilizando dados do chip-seq de ENCODE (para células K562 e HepG2) ou o Roteiro Epigenética Humano (para células CD34). As mesmas modificações de histonas foram considerados como para as células MCF-7, sendo estes H3K27ac, H3K4me3, H3K36me3, H3K9me3 e H3K27me3. De acordo com os estudos publicados anteriormente, houve um enriquecimento geral para inserções virais nas marcas de cromatina ativos (H3K27ac, H3K4me3 e H3K36me3), enquanto marcas repressivas (H3K9me3 e H3K27me3) foram desfavorecidas pelo vírus [17,18]. A única excepção a este padrão foi K562s que mostraram um enriquecimento de inserções na marca H3K27me3, embora isso não foi estatisticamente significativa. Os resultados estão resumidos na Figura 5B.

Figura 5C representa uma tendência clara, com o aumento de enriquecimento para os genes do cancro do controlador para com os genes mais altamente orientados em todas as quatro linhas celulares. Este padrão é menos clara para o conjunto de dados HepG2, embora não haja razão para suspeitar que os top hits pode ter sido obscurecida pela saturação neste imenso conjunto de dados (3 x 10

6), devido à pontuação de inserções verdadeiramente independentes na grande hotpots como duplicatas. Provas em apoio desta interpretação é fornecida por inspeção da distribuição de inserções em torno dos locais de início da transcrição. Quando estes são normalizados por altura do pico, o HepG2 mostra um nível muito maior basal de inserções não-SST, consistentes com a hipótese de saturação (Fig 5D).

Figura 6A mostra a sobreposição dos genes no top 100 para cada uma das linhas celulares testadas. Embora existam alguns genes alvo comuns compartilhados por mais de um tipo de célula, o que é mais impressionante é que a maioria dos top hits são únicos para esse tipo particular de célula com relativamente pouca sobreposição. Expandir os conjuntos de dados para abranger os 500 genes não diminui este padrão geralmente exclusivos de acordo com tipo de célula, embora esta mais relaxado cut-off revelou um pequeno subconjunto de seis elementos “universalmente” alvo:

MALAT1

,

MIR7851

.

1 |,

RCC1

,

VMP1

,

ZC3H4

e

ZMYND8

(Fig 6B).

a: diagrama de Venn, mostrando o nível de sobreposição entre as 100 melhores genes alvos em cada linha de células testadas. B:. Como (A), mas considerando a sobreposição das 500 melhores genes em cada linha de células

profiling integração Gamma-retroviral é complementar à criação de perfil super-potenciador

A recente descoberta de que integração GRV é mediada pela ligação a BET revelou uma ligação convincente para o câncer, como BET ligação a histonas acetiladas é uma das característica definidora de ‘super-potenciadores “, um termo cunhado para descrever grandes aglomerados de potenciadores que exibem ligação densa de master reguladores e desempenham um papel na identidade da célula específica de tecido [25]. Além disso, os inibidores da BET ligação pode interromper o crescimento das células cancerosas [16] e este fenômeno tem sido atribuída à sensibilidade aguda para apostar interrupção de super-potenciadores em oncogenes, tais como MYC e BCL2 [26,27].

Para investigar o paralelo entre GRIP e super-potenciadores definidos através de abordagens bioquímicas, foram comparados os genes mais próximos identificados por ambos os métodos. Listas de genes super-potenciador associados foram obtidos da base de dados dbSUPER [28] para MCF7, K562, HepG2 e células primárias CD34 (RO01480, RO01536 e RO01549). Para as células MCF-7, apenas 98 genes foram registrados na lista de super-potenciador, e destes, 8 eram genes motorista de cancro, tal como definidos pelos mais recentes dados Cancer Gene Censo, em comparação com 11 das 100 principais alvos GRIP (Fig 7A) . Observações semelhantes foram observadas para os outros conjuntos de dados, e apenas o conjunto K562 revelou um enriquecimento mais forte para genes motorista câncer nos genes super-potenciador associados ao longo dos alvos alça superior (23% vs 11%; p = 0,004). A dificuldade em definir um corte preciso entre super-potenciadores e potenciadores convencionais [29] é ilustrado pela grande variação no número de super-potenciadores para um determinado tipo de célula, com as três CD34 primária + dbSUPER entradas com números de superenhancers variando de 326 a 733.

a: Percentagem dos 100 melhores genes identificados para GRIP e superenhancers que são genes motorista câncer para todas as linhas celulares. B:. Sobreposição entre as 100 melhores genes para maior aderência e superenhancers em cada linha celular

Apesar dos números semelhantes de genes motorista do cancro identificados usando os dois métodos, os genes identificados foram principalmente distinta, e apenas 2 /genes do controlador 11 do cancro identificados pela GRIP também foram observados na base de dados de super-potenciador para células MCF-7 (S2 tabela). Olhando para os conjuntos de genes mais amplos, há também foi relativamente pouca sobreposição entre os genes identificados no top 100 GRIP e super-Enhancer alvos (Fig 7B).

análise Pathway revela reguladores a montante distintos de alvos retrovirais e super-potenciador genes associados

O pacote de software IPA inclui um módulo para avaliar os reguladores de transcrição a montante provável de qualquer conjunto de genes abstraída, ajudando a iluminar atividades biológicas em que o sistema celular. Para obter uma análise abrangente e estatisticamente robusta, foram analisados ​​os 500 melhores genes alvo GRIP para cada tipo de célula (Tabela 2). Os motoristas montante fortemente previstos para a MCF-7 dataset GRIP incluiu principalmente os motoristas câncer (MYC, KMT2A) e genes de câncer associado (ATF4). Notavelmente, estes genes foram-se altamente segmentados por inserção retroviral, o que reflecte o seu estado transcricionalmente ativa e acessibilidade a integração. Esta análise sugere que esses genes estão envolvidos na orquestração expressão do conjunto alvo GRIP e, portanto, pode representar os drivers críticos do programa de câncer. Observações semelhantes foram observados para as outras linhas celulares de cancro, e para as células normais CD34 +, embora neste último caso, dois dos condutores a montante mais fortemente previstos foram citocinas (CSF, IL15) que não foram alvo de integração retroviral e aparentemente não foram transcricionalmente activa nas células alvo.

Esta análise foi realizada para os conjuntos de genes super-potenciador-associados, tendo os 500 melhores genes, conforme determinado pelo ‘ranking’ sobre a entrada de banco de dados dbSUPER ou todo definir se havia menos de 500 genes. Embora os conjuntos de genes super-potenciador-associados estavam em alguns casos menor (intervalo 98-742 genes), eles renderam previu reguladores a montante com pontuações estatísticas semelhantes. Novamente estes reguladores a montante revelado relativamente pouca sobreposição entre GRIP e super-Enhancer genes regulados, ilustrando as perspectivas distintas sobre os programas de crescimento subjacentes descobertos por estas abordagens. Outra diferença é que a integração retroviral foi significativamente mais propensos a atingir os reguladores a montante GRIP em comparação com o conjunto de super-potenciador (p = 0,005, teste exato de Fisher).

Discussão

mostras Este estudo que a integração gama-retrovírus em células humanas está inclinada no sentido do controlador de genes do cancro de um modo altamente específico de células-tipo. Embora gama-retrovírus têm sido amplamente utilizados como ferramentas de descoberta de gene do cancro, devido ao seu potencial mutagênico de inserção em seus hospedeiros naturais, esta abordagem necessária a pesada tarefa de coleta de múltiplos tumores em estágio terminal de modelos animais e genômica comparativa análises para confirmar a relevância dos resultados ao câncer humano [5-7,11,30].

Deixe uma resposta