PLOS ONE: Genes preditivos em tecido normal adjacente Preferencialmente são alterados por sCNV durante Tumorigênese no cancro do fígado e Taxa de Maio Limiting

Abstract

Fundo

No carcinoma hepatocelular (HCC) genes preditivos da sobrevivência foram encontradas em ambos os tecidos normal adjacente (a) e de tumor (TU). As relações entre estes dois conjuntos de genes preditivos e o processo geral de tumorigênese e progressão da doença permanece incerta.

Metodologia /Principais Achados

Aqui nós investigamos tumorigênese HCC pela expressão do gene comparando, cópia de DNA variação do número e sobrevivência usando -250 amostras AN e TU representam, respectivamente, o estado pré-câncer, e o resultado de tumorigênese. Genes que participam na tumorigênese foram definidos através de um processo meta-análise de correlação gene-gene que, em comparação AN contra tecidos TU. Os genes preditivos de sobrevivência em um (AN-genes de sobrevivência) foi encontrado para ser enriquecido no gene para o gene conjunto de genes de correlao diferencial indicando que eles directamente participar no processo de desenvolvimento de neoplasias. Além disso os genes AN-de sobrevivência na sua maioria não eram preditivo após tumorigénese em tecido TU e esta transição foi associada com e pode em grande parte ser explicada pelo efeito do DNA somático variação do número de cópias (sCNV) e em cis em trans. Os dados eram consistentes com a variação de genes AN-sobrevida de passos limitantes da velocidade na tumorigénese e isto foi confirmado usando um tratamento que promove HCC tumorigénese que alterou selectivamente genes AN-sobrevivência e genes diferencialmente correlacionados entre AN e TU.

Conclusões /Significado

Isso sugere que o processo de evolução do tumor envolve etapas limitantes da velocidade relacionadas com o fundo a partir do qual o tumor evoluiu, onde estes eram frequentemente preditivo da evolução clínica. Adicionalmente tratamentos que alteram a probabilidade de ocorrência tumorigénese pode actuar por alteração genes AN-de sobrevivência, o que sugere que o processo pode ser manipulado. Além disso sCNV explica uma fração substancial da expressão específica do tumor e pode, portanto, ser um motorista causal da evolução do tumor em HCC e talvez muitos tipos de tumores sólidos

Citation:. Lamb JR, Zhang C, Xie T, Wang K, Zhang B, K Hao, et ai. (2011) Genes preditivos em tecido normal adjacente são preferencialmente alterada por sCNV durante Tumorigênese no cancro do fígado e maio de limitação de taxa. PLoS ONE 6 (7): e20090. doi: 10.1371 /journal.pone.0020090

editor: Xin Wei Wang, do National Cancer Institute, Estados Unidos da América

Recebido: 31 de agosto de 2010; Aceite: 25 de abril de 2011; Publicação: 05 de julho de 2011

Direitos de autor: © 2011 Lamb et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este trabalho foi inteiramente financiado pela Merck Co e sua subsidiária Rosetta Inpharmatics, Inc. Muitos dos autores foram ou são funcionários da Merck. O manuscrito foi avaliada pelo Merck e aprovados para liberação no domínio público sem alteração. Fora isso Rosetta Inpharmatics ea Merck teve nenhum papel no desenho do estudo, coleta de dados e análise, ou preparação do manuscrito

CONFLITO DE INTERESSES:. JRL, CZ, TX, KW, BZ, KH, CE, HF, JM, MF, CS, II, ZZ, JB, RS, DG, MC, JD, CM, VE, JZ, MM, HD e ES foram todos os funcionários da Merck no site da Rosetta; MS, UP, DB, AL, JW, CB-D, SF e PS foram funcionários da Merck em outros locais; RP, CY, NL e JML foram empregadas pela Universidade de Hong Kong. Diferente de financiamento deste estudo e emprego de autores como descrito acima, não existem outros concorrentes interesses financeiros ou outros para serem declarados. As afiliações acima não alteram a adesão dos autores para todos os PLoS ONE políticas em dados e materiais de compartilhamento.

Introdução

Uma característica universal das células cancerosas é a instabilidade do genoma [1], [2 ], [3], [4], [5], que se pensa ser necessária para gerar variabilidade suficiente a partir da qual as mudanças vantajosas para o crescimento e sobrevivência do tumor são seleccionados [6]. Seguindo este paradigma, é agora entender-se que a instabilidade do genoma pode resultar de defeitos na síntese de DNA e de reparação, a segregação cromossoma, postos de controlo, a perda de telómeros e outros processos biológicos que resultam em mutações pontuais, copiar a variação do número e do ganho /perda de funções biológicas [2 ], [3], [4], [7], [8], [9], [10]. O carcinoma hepatocelular (HCC) é o segundo câncer mais prevalente de populações asiáticas ea terceira principal causa de morte por câncer no mundo. Atualmente, a única opção de tratamento eficaz é a cirurgia [11]. HCC comumente surge em pacientes com hepatite viral e /ou em que a inflamação cirrose extensa expõe hepatócitos a estímulos mitogénicos [11]. A fase de pré-neoplásica é caracterizada por uma série de alterações, incluindo o aparecimento de encurtamento dos telómeros e o aparecimento de alterações genómicas [12]. As mudanças estruturais no genoma acumulam progressivamente durante a transição para a neoplasia e da cedo para HCC fase tardia [11]. alterações genômicas em HCC são heterogêneos em que muitos loci foram relatados para ser alterada, mas geralmente com uma prevalência de baixo [12]. Isso leva à hipótese de que existem perturbações alternativas que promovam a tumorigênese em HCC [11], [12].

genômica integrativa análise tem sido aplicado com sucesso em muitas doenças não-cancerosas [13], [14] e descreveu redes de variação genética, testando todas as possíveis associações em diversas populações segregantes a doença de interesse. Este trabalho demonstrou que os genes são geralmente parte de redes coerentes, e que as associações mais significativos dos genes para a doença muitas vezes ocorrem no contexto de sub-regiões de rede onde muitos ou todos os membros de um destes sub-redes são associados uns com os outros e com traços de doença [13], [15], [16]. Tais sub-redes foram ainda associado à variação de DNA e validado como causalmente dirigir a evolução da doença [13]

.

Aqui nós examinamos estrutura de rede de genes utilizando uma coleção de -250 tumor combinado (TU) e adjacente normal ( AN amostras) removido de pacientes HCC durante a ressecção cirúrgica e verifiquem se essas redes estão associados com a variação do DNA e da doença na coorte de HCC. A abordagem foi, em essência, para descobrir as interações dentro e entre os tipos de dados medidos nesta população (DNA, expressão, sobrevivência) em tecidos AN e TU de uma forma aberta ended, abrangente e completamente os dados conduzido. As interacções característicos de tumores (TU) foram comparados com o tecido normal (AN) para revelar alterações específicas do tumor. Apresentamos aqui os resultados da referida análise abrangente e mostram que sCNV altera de forma robusta a expressão de um grande número de genes e também a relação entre os genes para a sobrevivência em qualquer tecido AN ou TU, e que tumorigénese pela maior parte envolve a interrupção das funções normais e o activação de um pequeno conjunto de funções que pode ser crítico para a progressão da doença. Os dados sugerem que os genes preditivos de sobrevivência num tecido podem ser passos limitante da velocidade para a tumorigénese. Consistente com esta hipótese um tratamento que induz a tumorigénese HCC em ratinhos, a sobre-expressão do oncogene MET, foi encontrado para alterar selectivamente a expressão de genes preditivos de sobrevivência em um tecido de seres humanos.

Resultados

Para caracterizar redes de genes em tumores de fígado humano e tecidos normais adjacentes nós compilamos uma coorte específica tecido composto de tumor no fígado (TU) e tecidos adjacentes normais (AN) de 272 indivíduos asiáticos (incluindo 151 amostras TU e AN emparelhados, suplementar Tabela S1 [17]) submetidos a ressecção cirúrgica para o tratamento de HCC. O ARN foi isolado a partir de todas as amostras e TU AN e perfilado numa micromatriz Affymetrix costume composto de sondas de oligonucleótidos que representam transcritos de segmentação 37,585 conhecidos e previstos genes, incluindo sequências de ARN não codificantes de confiança elevada. O ADN foi isolado a partir de todos os tecidos AN e TU e genotipados na matriz de genotipagem de SNP Ilumina 650Y. marcadores de aberração número de cópias (marcadores sCNV) foram então imputada de 32.711 locais no genoma deste painel de SNP de alta densidade (Métodos).

redes de genes em tumores de fígado e amostras normais adjacentes

Dada as alterações genómicas grande escala geralmente conhecidos para ocorrer em amostras de tumor, a nossa observação de diferenças de expressão em larga escala entre as amostras de AN e TU na coorte HCC não foi surpreendente, com 28,233 ( 75%) dos 37,585 genes representados na micromatriz utilizada neste estudo, foram detectadas diferencialmente expressos como (p 0,05, 0,07 FDR, ver Tabela S2), consistente com relatos anteriores [18]. O principal problema, em seguida, ao interpretar as mudanças de estado moleculares entre AN e TU é distinguir entre aquelas mudanças que são relevantes para a progressão do tumor a partir dessas mudanças que estão simplesmente de rastreamento com as alterações genômicas, mas não relevantes para a biologia do tumor. Por isso, procurou-se caracterizar o impacto destas alterações em grande escala tinha sobre a estrutura de conectividade das redes de genes específicos de tecido, fornecendo um caminho para identificar as alterações que levam a alterações nas redes moleculares que definem os processos biológicos efectuados pela tecidos.

para caracterizar as alterações entre as redes AN e TU usamos um procedimento de meta-análise [19], [20] para testar se a magnitude da associação entre qualquer par de genes em um tecido foi significativamente diferente a partir da associação observada para o mesmo par no segundo tecido (Métodos). diferenças significativas de correlação indicam a presença de diferenças de conectividade entre as redes de AN e TU (Figura 1). Em um Bonferroni ajustado, conectividade diferencial p = 7e-11 ( 1% de família-wise taxa de erro), identificamos 1,156,638 pares diferencialmente correlacionados (apenas 2 teria sido esperado por acaso), ou cerca de 12% da 9.976.814 pares de genes correlacionados encontrados em qualquer um dos tecidos ou AN Tu. Nós também empiricamente estimado a distribuição nula conectividade diferencial e observaram pares diferencialmente conectadas com p 7e-11 (Figura 1), sugerindo que este grau de conectividade diferencial é altamente significativa

A É mostrado números do diferencialmente. genes correlacionados descoberto usando um procedimento de meta-análise (métodos) entre os tecidos AN e TU. Para comparação, a mesma análise foi executado em ambos os dados reais e em uma permutação das atribuições de AN e TU. O painel superior mostra o número de pares de genes diferencial (eixo Y) para os dados reais (AN vs TU, em azul) em comparação com a permutação (vermelho) como uma função do valor de p (mostrado como log10 negativos [P] , no eixo dos X). O número de genes diferencialmente ligados (painel do meio) e taxas de falsos descoberta (painel de baixo), também são mostrados. B Para estabelecer que os pares de genes diferencialmente correlacionados resultou da diferença entre um e tecido TU e não, por exemplo, diferenças entre indivíduos da mesma análise foi executado utilizando um vs AN em comparação com AN vs TU usando o mesmo número de amostras (métodos). O painel superior mostra o número de pares de genes diferencial (eixo Y) para tanto um vs TU (azul) e um contra AN (vermelho) como uma função do valor de p (mostrado como log10 negativos [P], na X- eixo). O número de genes diferencialmente conectados (painel do meio) e as taxas de descoberta de falsas (painel inferior) também são mostrados.

Para aumentar a confiança de que pares de genes identificados como diferencialmente correlação entre as redes AN e TU refletido biologicamente relevante mudanças nos estados de rede relacionados a tumorigênese e progressão tumoral, restringimos a atenção para esses pares de genes diferencialmente correlacionados que eram altamente improvável que tenha ocorrido por acaso (p 1e-19, com uma alteração média na coeficiente de correlação de Spearman entre os tecidos de 0,73; nenhuma pares de genes observadas nos dados permutados, FDR 1e-6, ver Figura 1). Neste rigorosos de corte, foram identificados 49.300 pares de genes que cobrem 8.736 genes cuja relação diferiram significativamente entre a TU e AN tecidos. Dos 49.300 pares diferencialmente conectados identificados, 42.179 (86%) foram fortemente correlacionados nos tecidos AN, mas significativamente menos correlacionada nos tecidos TU, enquanto apenas 7.121 pares (14%) apresentaram correlações mais fortes na TU contra amostras AN, indicando que as alterações na rede que ocorrem no tumor foram mais propensos a destruir, em vez de criar fortes associações entre as características de expressão.

para distinguir entre os tipos de genes envolvidos em conexões diferenciais que definimos ganho de conectividade (GOC) genes como aqueles em que mais de 90% de suas interações diferenciais refletido correlações que eram mais fortes em TU comparação com AN. Do mesmo modo, definiu-se a perda de genes de conectividade (LOC) como aqueles em que mais de 90% das suas interacções diferenciais reflectida correlações que eram mais fraca em comparação a uma TU (quadro suplementar S2). Embora estes são arbitrárias pontos de corte que servem para destacar a distribuição relativa de ganho e perda de conectividade associada a tumorigénese, dada maior do que 80% dos genes diferencialmente ligados caem em uma das duas categorias. Sob esta classificação, havia 6.053 genes do LOC e apenas 1.020 genes GOC. GO análise enriquecimento após a correcção de Bonferroni para o número de categorias revelou que os genes GOC foram enriquecidas em ciclo celular (3,93 vezes enriquecido, p = 1.6e-20) e processos relacionados (por exemplo, cromossoma segregação, a replicação do ADN, e a organização do fuso) , ao passo que os genes foram principalmente LOC enriquecido para processos metabólicos (1,11 vezes enriquecido, p = 1.4e-20), especialmente aquelas associadas com mitocôndrias (1,56 vezes em enriquecido, p = 1.5e-20). Estes resultados sugerem que o processo de tumorigénese é em grande parte uma interrupção da de redes normais (LOC), e em menor grau um de criação de novas redes (GOC). Consistente com isto, eventos LOC foram enriquecidas para genes de função hepática normais, enquanto que os eventos GOC foram enriquecidas para genes envolvidos no crescimento canceroso da célula. eventos GOC, embora menos numerosas, podem representar funções específicas tumorais necessárias para a progressão da doença e como tal pode ser uma interessante fonte de metas para HCC. Para ilustrar a natureza das ligações diferenciais os 5 primeiros genes e os genes aos quais foram ligados diferencialmente são mostrados na Figura 2. Exemplos de pares de genes individuais que foram diferencialmente ligados em TU ou um tecidos são mostrados na Figura 3, incluindo o inibidor do G1 a transição de fase S (CDKN2C com perda de conectividade) e fator de licenciamento de replicação do DNA (CDT1 mostrando ganho de conectividade).

o top 5 genes diferencialmente conectados e seus parceiros diferencialmente conectados são mostrados. Cada gene é representado por uma forma oval azul e a parte superior 5 são indicadas por caixas. Para cada uma das 5 principais genes também indicado é o número de correlações diferenciais entre AN e TU no total (DiffConn) e os números para ganho (GOC) e perda (LOC) de correlação em cada caso. Linhas que ligam genes indica que o par foi diferencialmente correlacionados entre AN e TU onde ambos LOC (linhas azuis) e GOC (linhas vermelhas) são indicados. conexões diferenciais entre os 5 principais genes e qualquer outro gene são mostrados, bem como correlações diferenciais entre genes diferencialmente ligados ao top 5. O top 5 genes foram encontrados para ser diferencialmente correlacionada com um conjunto altamente sobreposição de parceiros. Mostrados na tabela de inserção (canto superior direito) é o Fishers valor de p teste exato de sobreposição entre parceiros de genes diferencialmente correlacionadas para cada um dos 5 principais genes (inferior esquerdo da tabela). Também é mostrado (superior direito) é o enriquecimento de dobragem para a sobreposição em relação ao que seria esperado por acaso. Como mostrado uma complexa teia de correlações diferenciais resultantes de tumorigênese é revelado

Para ilustrar tanto a perda e ganho de correlação de dois genes do ciclo celular foram escolhidos, que tem muitas conexões diferenciais:. A CDKN2C inibidor da ciclina quinase dependente ( a, 149 perdas e 11 ganhos de conectividade) e do fator de licenciamento de cromatina e replicação do DNA CDT1 (B, 0 perdas e ganhos 38 de conectividade). Os valores de intensidade de expressão para CDNK2C (eixo X) e DCN (eixo Y) são mostradas (A), em (azul, CC 0,548, p = 2e-20) e tecidos tu (vermelho, cc -0,358, p = 7,14 e-10). Os valores de intensidade para CDT1 (eixo X) e MCM3 (eixo Y) é mostrado (B) num meio (azul, cc-0,153, p = 0,0166) e tecidos tu (vermelho, cc 0,673, p = 3.05e-38 ). Mostrado em C é o grau de distribuição para os 8.736 genes diferencialmente ligados como descrito no texto. O número de ligações diferencial para cada gene (log10, eixo X) foi comparada com a contagem (log10, eixo Y). Como se mostra a distribuição era livre de escala, o que indica que os genes identificados tendem a prender preferencialmente a um pequeno número de genes de cubo em qualquer tumor ou tecidos normais adjacentes, mas não em ambas.

Para avaliar se as correlações diferenciais foram distribuídos aleatoriamente entre as correlações gene de gene significativas ou se houve alguma estrutura de nível mais elevado, foi examinada a distribuição do número de correlações diferencial para cada gene. Observou-se que enquanto a maioria dos genes participou em um pequeno número de correlações diferenciais, houve um subconjunto de genes que participou em muitos correlações diferenciais. Na verdade, as correlações diferenciais seguido de perto uma distribuição de lei de potência que era bastante diferente do que seria esperado por acaso (ver Figura 3). Isso indica que certos genes representar nós hub na matriz diferencialmente ligado que surgiu da tumorigênese e como tal pode ser de particular importância.

sCNV explica uma grande parte da variação expressão TU

Dado o grande mudanças de escala em estruturas de expressão e de correlação surgiu durante o processo de desenvolvimento de neoplasias, buscou-se identificar os drivers causais dessas mudanças. Somatic variação do número de cópias é uma característica comum de muitos tipos de tumores sólidos e tem sido associado com a agressividade da doença. Para HCC em particular sCNV tem sido observado nos estágios iniciais da doença e aumento da prevalência com a progressão da doença [11]. Por isso, avaliou a prevalência de sCNV no HCC e em que medida foi associado com variação genética no tecido TU.

variação DNA foi avaliada nas amostras AN e TU usando Illumina de alta densidade microarrays SNP. sCNV foram estimadas usando alisou LOGR rácio de de marcadores adjacentes em 32.711 loci uniformemente espaçados através do genoma (Métodos). No TU amostras evidência de amplificação ou supressão envolvendo grandes regiões genômicas frequente foi visto (Figura 4). Em contraste foram observadas muito poucas tais eventos nas amostras de NA com esta análise (4 amostras AN foram encontrados para ter a evidência limitada de cópia número variação). sCNV variação foi comparada com a variação do gene em ambos as amostras AN e TU.

É mostrado um mapa de calor de aberrações no número de cópias (sCNV) para amostras derivadas de tumor (eixo Y) agrupados por K significa em 10 grupos, contra as posições lineares através cromossoma 1 (eixo X). sCNV foi estimada como descrito nos métodos e é indicado como um continuum de cor de vermelho (amplificação) para preto (sem alteração) para verde (supressão). Uma escala para os dados sCNV é indicado no lado direito do calor mapa (razão LOGR de 1 a -1). Como pode ser visto a maioria das aberrações apareceram a implicação de partes cromossômicas grandes na escala de armas de cromossomos inteiros.

De acordo com estudos anteriores de outros tipos de câncer e híbridos de radiação [4], [21], [22], [23], fortes correlações positivas entre genes e marcadores sCNV foram identificados nos casos em que os genes correspondentes sobrepostas ou estavam perto do marcador sCNV sendo testado, aqui referida como associações de actuação cis (Figura 5a e Tabela S2). A explicação mais provável para esta observação é que o tecido TU sCNV induzir alterações proporcionais em genes que foram proximal ao local do que sCNV. Em contraste não houve associações de actuação cis entre os marcadores UM CNV e genes AN para além do que seria esperado por acaso, indicando que as cis-correlações entre sCNV e expressão foram tumor específico. Dada esta correlações para copiar número variação só foram investigados usando tecido TU.

Distribuição de correlações (X-eixos) entre os genes (Y-eixos) e o marcador sCNV mais próximo (em cis) em TU (A) e An (B) tecidos. A distribuição dos dados reais (azul linhas a cheio) foi comparada com a de permutação do gene de marcador de conexão (verde linhas tracejadas). Nenhuma associação significativa foi visto em um acima do que seria esperado pelo acaso. Em TU houve um viés acentuado de correlações positivas. C. Distribuição de correlações entre todos os genes (eixo Y) e todos os marcadores sCNV, mostrado de forma linear por localização cromossoma através do genoma (eixo X). limites de cromossomos são indicados pelas linhas verdes verticais e são numerados. Usando uma correlação de corte de 0,3 (p 4.7E-4, FDR 0,02), a contagem de todos os genes (não incluindo genes cis, verde), genes trans positivamente correlacionados (vermelho) ou negativamente correlacionada trans genes (azul) é indicado para cada marcador (trans aqui foi definida como genes e marcadores sCNV queda nos cromossomos separados). Vários hotspots eram aparentes em que muitos genes foram associados com sCNV num locus particular, especialmente para regiões nos cromossomos 1, 2, 6, 7, 12, 14 e 20 (ver texto para discussão adicional). D. genes associados com hotspots sCNV em HCC e linhas celulares sobrepõem-se significativamente. marcadores de ponto de acesso sCNV foram selecionados através da identificação de regiões associadas com 500 genes (Pearson coeficiente de correlação 0,3) e em seguida, selecionando o marcador superior único por cromossomo. Os genes associados a cada ponto de acesso marcador foram comparados (círculos azul, tamanho equivalente ao número de genes) e sobreposições significativas (teste exacto de Fisher p 1e-6) são mostrados como arestas ligando pares de nós. Uma análise semelhante foi realizado em um conjunto de linhas celulares de cancro (CCL, círculos verdes). Neste caso, um número menor de genes totais foram medidos (vs 23,404 37,585), de modo que uma fracção equivalente do total de genes ( 370) foi necessário significativamente associados com um marcador sCNV. A espessura das arestas que ligam os nodos representa o enriquecimento dos genes que se sobrepõem em relação ao esperado por acaso (sobreposição observada dividida pela esperado; enriquecimento 5 vezes – linha fina, 5 – linhas grossas). Como mostrado os genes associados com hotspots foram compartilhadas dentro conjuntos de dados. Por exemplo, os genes em HCC ligada aos hotspots de cromossomos 2, 6, 12, 14 e 20 sobrepõem significativamente entre si. Hotspot sobreposições entre CLL e HCC envolvendo as mesmas regiões genômicas são destacadas em vermelho (cromossomos 1, 14 e 20).

Em termos mais gerais, testes de associação entre todos os genes TU e marcadores TU sCNV revelou muitos altamente significativa associações, referidos aqui como associações trans-acting (veja a Figura 5C). Diversos loci genômicos foram encontrados para ser associado com muitos mais genes do que seria esperado pelo acaso, referidos aqui como hotspot sCNV loci (veja a Figura 5C). Foram identificados sete loci sCNV ponto de acesso em 7 cromossomas diferentes que foram associados com cada 500 (trans genes de correlação 0,3; FDR 0,001). Os genes associados a esses pontos de acesso eram altamente sobrepostas, sugerindo que sCNV em múltiplos loci coordenadamente conduzir redes de genes (Figura 5D e Tabela S3). Para avaliar se estes loci hotspot eram específicos para HCC, realizou-se uma análise de associação semelhante entre os marcadores e genes sCNV em uma coleção de ~130 linhas celulares de cancro (CCL) a partir de vários tipos de tecidos [24] (métodos). Três dos loci 7 hotspot identificados nos dados HCC sobrepõem hotspots sCNV nos dados CCL. Em todos os três casos, os mesmos locais genómicos estavam envolvidos. Estes dados sugerem que os pontos de acesso sCNV não são únicos para o HCC, mas, de facto, pode ocorrer em muitos tipos de tumor e pode envolver pares semelhantes de loci de genes genómico e, talvez, a condução do núcleo processos biológicos cruciais para a formação e progressão tumoral. Consistente com isto, tem sido relatado recentemente que a estrutura de sCNV é frequentemente partilhada entre vários tipos de tumores [25]. Isto pode sugerir que os cis e correlações trans aqui relatados no HCC e células em cultura pode ser relevante para muitos tumores tipos com estrutura sCNV compartilhada.

Para estabelecer o percentual de variação do gene TU explicadas por qualquer combinação de marcadores sCNV , construímos modelos genéticos, utilizando um procedimento de regressão para cada gene (Métodos e ver Tabela S2). Como um controlo que executou a mesma análise utilizando os dados permutados em que a ligação entre os genes marcadores e sCNV foi randomizados. Usando o corte rigoroso de correlação absoluta 0,3 (FDR 0,001), a quantidade de variância explicada por sCNV era tão alta quanto 80%. Surpreendentemente, maior do que 40% dos genes representados nas micromatrizes utilizadas neste estudo (15,993 de 37585) foram significativamente associados com marcadores sCNV, em que a variância média entre estes genes explicadas pelos marcadores sCNV foi de 21,8%. Para os genes de 3031 (8,1% dos genes representados na micromatriz) maior do que 30% a sua variância foi explicada por marcadores sCNV (Tabela 1 2). Além disso, enquanto as associações de actuação cis explicado mais das associações sCNV, 6,6% dos genes (n = 2490) tinha variância explicada por marcadores sCNV que eram diferentes cis, e um subconjunto de genes (7,8%, n = 2974) foram verificou-se que a variância explicada em mais do que um e até cinco sCNV marcadores em diferentes cromossomas. Como mostrado acima (ver Figura 5), ​​a maioria dos genes trans associar com um número limitado de pontos de acesso que sugerem que a variação no número limitado de estes loci foi causando uma proporção significativa da variação do gene TU. Estes efeitos genéticos na expressão do gene do tumor são ordens de magnitude maiores do que os efeitos induzidos pela variação DNA germinal.

genes diferencialmente correlacionados preferencialmente associar com marcadores sCNV em TU

Para explorar se sCNV estava dirigindo mudanças coerentes em redes que, por sua vez induziu alterações fenotípicas no tumor, que testamos para as relações entre os marcadores sCNV e genes diferencialmente correlacionados entre os tecidos AN e TU. Os genes diferencialmente correlacionados foram significativamente enriquecidas para genes associados com marcadores sCNV em cis (2,36 vezes enriquecida; p 1e-300), bem como para a quantidade de variância explicada (2,12 vezes enriquecido, p 1e-300) e para o número de marcadores (1,89 enriquecido, p 1e-300) no modelo de regressão. Este enriquecimento realizada para os genes GOC (cis 1,49 vezes enriquecido, p = 1.03e-11, variância explicada no modelo de regressão de 1,55 vezes enriquecido, p = 3.48e-25, o número de marcadores de 1,38 vezes enriquecidas, p = 1.04e-18), conforme bem como genes LOC (cis 2,17 vezes enriquecido, p 1e-300, variância explicada no modelo de regressão de 1,91-dobra enriquecido, p = 1.1e-321, o número de marcadores de 1,81 vezes enriquecido, p = 2.5e-287). O aparecimento de correlações diferenciais em HCC, portanto, parecia ser em grande parte explicado pelo efeito de sCNV no tecido TU.

Previsão da sobrevivência em tecidos AN e TU

A seguir, caracterizada a relevância da maciça mudanças nas redes de genes para o curso clínico da doença, comparando as mudanças de rede para o subconjunto de genes que predizem sobrevivência. Genes preditivos da sobrevivência foram identificadas em tecidos AN e TU usando um modelo de regressão de Cox (métodos, consulte a Tabela S2). Cerca de três vezes mais genes prognósticos foram encontrados na AN (p 0,0112, n = 5.387; FDR 0,1) versus TU (p 0,002, n = 1.836; FDR 0,1). Embora os genes preditivos em um e TU sobrepor mais do que seria esperado por acaso (1,52 enriquecimento dobra, p = 6.8e-19, o que representa 7,4% e 21,8%, respectivamente, dos genes preditivos AN e TU), houve muitos casos de genes altamente preditivos de um tecido, mas não nos outros. Por exemplo, dos 5.387 genes preditivos na AN, 4.987 (92,6%) não foram preditivos no TU, e dos 1.836 TU genes preditivos, 1.436 (78,2%) não foram preditivos na AN, utilizando os critérios acima de corte (ver Figura 6A). Em ambos os casos, o nosso poder estatístico foi de 45% para detectar genes preditivos em um tecido que foram identificados como preditivo nos outros tecidos (Métodos), indicando que a sobreposição mínima não era uma consequência do baixo poder estatístico.

A . É mostrado o significado da associação (como negativo log10 do valor p regressão de Cox) encontrada entre todos os 37,585 genes na AN (eixo X) e TU (eixo Y) e sobrevivência. Genes encontrados para ser significativamente associada à sobrevida (FDR 0,1, Métodos) são indicados na AN (pontos verdes), TU (pontos vermelhos) ou ambos AN e TU (pontos roxos). Tal como descrito no texto a maioria dos genes preditivos em um tecido não foram preditivos no outro. B. É mostrada uma representação das transformações de rede associados com o HCC tumorigénese (transição de estado de pré-tumor, a caixa superior, ao estado do tumor, a caixa inferior), onde os genes preditivos em um (verde) em grande parte perdem a sua associação com a sobrevivência em TU seguinte associação para sCNV não preditivo. Em contraste genes preditivos da sobrevivência em TU (vermelho) não são, em grande parte preditivo na AN, e foram preferencialmente associado com marcadores sCNV que foram também preditiva. Não mostrado são genes preditivos, tanto na AN e TU, e os genes não preditivo em qualquer tecido. C. Mostrada esquematicamente é a hipótese “de efeito de campo”, tal como proposto [26] (quadro superior), onde os genes normais adjacentes prever a sobrevivência do paciente, porque eles reflectem um meio (de efeito de campo) em que futuras tumores são mais ou menos provável que surjam . Neste modelo os tumores atuais não têm um grande impacto sobre o resultado enquanto tumores futuros fazer. Uma modificação desta hipótese é proposta aqui (caixa inferior), onde os genes normais adjacentes representam um estado que afetou diretamente a probabilidade de os tumores atuais decorrentes e progredindo. Nesta hipótese modificada sobrevivência ou morte é mediada pelos tumores actuais. Veja o texto para discussão adicional

Genes preditivo do resultado na AN e TU foram enriquecidas para as correlações diferenciais e associação para sCNV marcadores

Usando os genes AN preditivos da sobrevivência (doravante referida como genes AN-sobrevivência), quase metade (2,646 de 5,387, 49%) foram consideradas diferencialmente correlacionados na transição para o tumor, que é 2,11 vezes maior do que seria esperado por acaso (p 1e-300). Os genes AN-de sobrevivência também eram mais propensos a ser correlacionada com sCNV em cis (1,36 vezes o enriquecimento, p = 1.38e-47), e para ter uma maior proporção de sua variância explicada por sCNV (enriquecimento 1,32 vezes, p = 3.94e-50) e por um número maior de marcadores sCNV (enriquecimento de 1,33 vezes, p = 1.09e-53) no modelo de regressão.

Deixe uma resposta