PLOS ONE: uma abordagem para a identificação de alvos específicos para metástase óssea usando genes do cancro interactome e Gene Ontology Analysis

Abstract

A metástase é um dos aspectos mais enigmáticos da patogênese do câncer e é uma das principais causas de câncer mortalidade -associated. câncer ósseo secundário (SBC) é uma doença complexa causada por metástases de células de tumor do seu local principal e é caracterizada pela interacção complexa de interacções moleculares. Identificação de alvos para doenças multifatoriais, como a SBC, a complicação mais freqüente dos cânceres de mama e próstata, é um desafio. No sentido de alcançar o nosso objectivo de identificação de alvos específicos para SBC, construímos um ‘Cancer Genes Rede “, um interactome proteína representativa de genes do cancro. Usando gráfico métodos teóricos, obteve-se um conjunto de genes-chave que são relevantes para os mecanismos genéricos de cânceres e têm um papel na essencialidade biológica. Nós também compilou um conjunto de dados com curadoria de 391 genes SBC da literatura publicada, que serve como base de correlatos ontológicos de câncer ósseo secundário. Com base nestes resultados, vamos implementar uma estratégia baseada em genes do cancro genéricos, genes SBC e método de enriquecimento de ontologia gênica, para obter um conjunto de metas que são específicas para a metástase óssea. Através deste estudo, apresentamos uma abordagem para sondar uma das principais complicações em cancros, nomeadamente, metástase. Os resultados sobre genes que desempenham papéis genéricos no fenótipo do câncer, obtidos por análise de rede de “genes do cancro Rede”, ter implicações mais amplas na compreensão do papel dos reguladores moleculares nos mecanismos de cânceres. Especificamente, o nosso estudo fornece um conjunto de alvos potenciais que são de relevância ontológica e regulamentar para câncer ósseo secundário

Citation:. Vashisht S, Bagler G (2012) uma abordagem para a identificação de alvos específicos para metástase óssea Usando Genes do câncer interactome e Gene Análise Ontologia. PLoS ONE 7 (11): e49401. doi: 10.1371 /journal.pone.0049401

editor: Matthias Dehmer, UMIT, Áustria

Recebido: 05 de julho de 2012; Aceito: 11 de outubro de 2012; Publicado: 14 de Novembro, 2012 |

Direitos de autor: © 2012 Vashisht, Bagler. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Nenhuma corrente fontes de financiamento externas deste estudo

Conflito de interesses:. Os autores declararam que não existem interesses conflitantes

Introdução

O câncer é uma doença de múltiplos sistemas e componentes que interagem. em ambos os níveis moleculares e celulares que conduzem ao início, a progressão e a propagação da doença [1], [2]. As interações mudança desses sistemas em um ambiente dinâmico ressaltam a complexidade inerente da doença. Até recentemente, o câncer tem sido estudada com uma abordagem reducionista concentrando-se em uma mutação específica ou um caminho. Ultimamente tem havido um enorme aumento no estudo em nível de sistemas de câncer eo uso de abordagens integradoras para entender mecanismos de cânceres [3], [4] e as suas metástases [5], [6].

Metástase é uma das marcas mais enigmáticas de cancros caracterizados por interações moleculares complexas [1], [7]. É responsável por até 90% de mortalidade associada a cancro, ainda continua a ser o componente mais mal compreendidos da patogénese do cancro [7], [8]. Metástase tumoral é um processo de vários estágios, durante o qual as células malignas se espalhar a partir do tumor primário para órgãos adjacentes [7]. disseminação metastática envolve uma seqüência de etapas que envolvem invasão, intravasation, extravasamento, sobrevivência, evasão de defesa do hospedeiro e adaptação ao microambiente externa [7], [8].

câncer ósseo secundário (SBC) é uma doença complexa envolvendo interacção de osteolíticas e mecanismos osetoblastic [9] (Figura 1). As metástases ósseas são a complicação mais frequente dos cancros da mama e da próstata com uma muito alta propensão de metástase para o osso causando dor óssea, fraturas, hipercalcemia e paralisia [10] – [13]. carcinomas da mama e da próstata são muitas vezes conhecidos para levar anos para se desenvolver colónias metastáticas (em um número limitado de locais), sugerindo que nestes cancros, as células empregam programas adaptativos distintas para remendar laboriosamente turnos juntos complexas em programas de expressão genética [14]. Muitas moléculas e vias associadas são relatados para ser envolvida na metástase de células de cancro a partir de cancro da mama [13], [15] – [22] e os de cancro da próstata [10], [18], [23] – [30].

metástase óssea resulta de desequilíbrio do processo de remodelação óssea normal envolvendo osteolítico (levando à destruição óssea) e osteoblastos (levando a formação óssea aberrantes) mecanismos. metástases de cancro da mama são geralmente osteolítico, enquanto que as metástases do câncer de próstata são geralmente osteoblástica. metástases osteolíticas: osteolíticas metástase de células tumorais envolve um “ciclo vicioso” entre as células tumorais e o esqueleto. O ciclo vicioso é propagado por quatro contribuinte: células tumorais, os osteoblastos formadores de osso, os osteoclastos de reabsorção óssea e factores armazenados dentro da matriz óssea. formação de osteoclastos e actividade são regulados pelo osteoblasto, aumentar a complexidade do ciclo vicioso. As células tumorais libertar certos factores, incluindo IL-1, IL-6, IL-8, IL-11, TNF e PTHrP que estimulam a reabsorção óssea osteoclástica. Esses fatores aumentar a expressão de RANKL sobre OPG por osteoblastos, inclinando a balança para a ativação dos osteoclastos causando assim a reabsorção óssea. Esta lise óssea estimula a liberação de BMPs, TGF, IGF e FGF para estimular o crescimento de células cancerosas metastáticas para o osso. Metástases osteoblásticas: Factores libertadas por células osetoblastic, tal como ET-1, Wnt, ErbB3, o VEGF desempenha um papel importante nas metástases osteoblásticas através do aumento da proliferação de células de cancro e potenciar o efeito de outros factores de crescimento, incluindo PDGF, FGF, IGF-1. a diferenciação dos osteoblastos é também aumentada por BMPs através da activação de determinados factores de transcrição. Activador de Plasminogénio uroquinase (uPA), uma protease, também actua como mediador para a metástase óssea osteoblástica por clivagem de factores da reabsorção óssea mediada pelos osteoclastos responsáveis ​​pela regulação da diferenciação dos osteoclastos; bloqueando assim a reabsorção óssea.

Os cancros são caracterizados por processos marcantes e os mecanismos compartilhados envolvidos na expressão do fenótipo da doença. É um desafio para identificar tais genes envolvidos em mecanismos de cancro genéricos. Identificação de tais “genes do cancro genéricos ‘podem ajudar-nos concentrar em” doença genes específicos de câncer “de valor terapêutico potencial. Devido à complexidade e subtis mecanismos envolvidos em metástase, é difícil identificar os seus mecanismos de controlo. Por isso, é importante ter métodos para a identificação de genes e mecanismos reguladores que são fundamentais para um estado patogênico complexas como o câncer ósseo secundário. modelos de redes complexas de interactoma, juntamente com estudos de análise e sobre-representação gráfico-teórica, apresentam-nos uma estratégia útil para sondar moléculas que são centrais para mecanismos SBC e, portanto, potenciais alvos terapêuticos.

funções celulares refletem o estado da célula como uma função de uma rede complexa de interacções entre grande número de genes, metabolitos, proteínas e moléculas de ARN. Um fenótipo da doença reflecte vários processos pathobiological que interagem de uma rede complexa e raramente é uma consequência da anomalia em um produto do gene efector único [3]. Compreender doenças no contexto de organizar princípios da arquitectura de redes biológicas nos permite resolver algumas propriedades fundamentais de genes que estão envolvidos na doença. Estudo de interactoma proteína doença oferecer uma melhor compreensão dos genes e processos específicos da doença em questão e pode oferecer melhores alvos para o desenvolvimento de drogas. redes de interação molecular são caracterizados pela presença de alguns nós altamente conectados, frequentemente chamados hubs, sugerindo um papel especial destas interagentes promíscuas. Eixos de interactoma de proteínas são mais susceptíveis de ser essencial para a sobrevivência [31] e também relatado como sendo importantes para a taxa de crescimento celular [32]. Proteínas com alta betweenness [33], [34] são referidos como tendo muito maior tendência a ser genes essenciais [35], [36]. proteínas cancerígenas são relatados para ser mais central no interactome proteína e são, em média, envolvido em duas vezes mais interações como os de proteínas não-câncer [37].

O Gene Ontology [38] projeto prevê uma ontologia de termos definidos que representam as propriedades do produto do gene. A ontologia abrange três domínios: componente celular, partes de uma célula ou do seu ambiente extracelular; função molecular, actividades elementares de um produto do gene ao nível molecular e processo biológico, conjuntos de eventos moleculares com um início e fim definidos, pertinentes para o funcionamento de unidades de estar integrados. métodos de enriquecimento GO fornecer uma maneira de extrair uma visão biológica de um conjunto de genes usando o poder de conjuntos de genes [39]. análise de enriquecimento envolve a identificação de termos GO que são significativamente sobre-representados em um determinado conjunto de genes utilizando modelos estatísticos, tais como distribuições quadrados hipergeométricas e qui [40]. Um grande repertório de ferramentas tem sido desenvolvida nos últimos anos para a Análise de Enriquecimento de [41], [42]. Métodos de estudos de análise de rede e de enriquecimento foram efetivamente utilizados para identificar alvos de doenças como a síndrome da fadiga crônica [43], transtorno depressivo maior [44], glioblastoma [45], carcinogênese colorretal [46] e imunodeficiência primária [47].

neste estudo, buscou-se identificar genes específicos câncer ósseo secundário. Para atingir este objetivo, usamos uma estratégia composta (Figura 2) que envolve a identificação dos genes do cancro especificando mecanismos de câncer genéricos, compilação de genes implicados em metástases para o osso e identificação de genes anotados com termos GO específicas para câncer ósseo secundário, para obter metas específicas de doenças . Embora a análise de rede fornece uma perspectiva de sistemas de mecanismos moleculares complexas e ajuda a identificar seus componentes centrais (elementos funcionais), método de enriquecimento de gene permite a identificação de características ontológicas característicos dos conjuntos de genes. Em primeiro lugar, construiu um interactome proteína representativa de todos os genes do cancro e hubs obtidos que estão envolvidos nos mecanismos de câncer genéricos. Além disso, nós compilamos um conjunto de genes experimentalmente verificados, da literatura, que está envolvido na metástase de mama primário e câncer de próstata em osso, a causa dominante de câncer ósseo secundário. Usando uma combinação de análise interactome proteínas e genes estudos de enriquecimento ontologia, obteve-se um conjunto de genes (metas) específica para mecanismos SBC. Nosso estudo fornece uma abordagem para identificar alvos específicos de um fenótipo da doença complexa (metástases ósseas) através da combinação de análise ao nível de sistemas interactome e estudos ontológicos.

A estratégia que foi implementada neste trabalho compreendia três tarefas, levando a três gene-conjuntos que foram utilizados para a obtenção de alvos específicos do SBC de potencial valor terapêutico correspondente. (A) Uma compilação de genes do cancro da base de dados CancerGenes foi usado para construir uma genes do cancro representante interactome (genes do câncer de rede; CGN), mapeando-os para um interactome referência humana da proteína (proteína humana de referência de banco de dados; HPRD). foram obtidos através de métodos de análise de rede, proteínas que são centrais para CGN e interação dinâmica. Esse conjunto de genes (SET-A; área sombreada) foi encontrado para ser correlacionando bem com genes implicados em mecanismos genéricos de câncer (Figura 6), bem como aqueles anotados como usando dados essenciais do mouse fenótipo (Figura 8). A CGN, composto de 11602 interações entre 2665 proteínas, também serve como um conjunto de referência (o universo) para estudos de enriquecimento de gene; (B) Um conjunto de genes (Genes câncer ósseo secundário; SBCGs) que estão implicados na metástase para o osso da mama primário e câncer de próstata, as causas mais prevalentes de metástase óssea, foi compilado a partir da literatura. Este conjunto (SET-B) serve como base de genes e correlatos ontológicos de câncer ósseo secundário, que caracterizam o fenótipo da doença; (C) termos vão significativamente enriquecidos que caracterizam SBCGs foram obtidos por meio de análise sobre-representação contra o universo dos genes do câncer “. SET-C, um subconjunto de CGN, foi obtido por segregar os genes do câncer que foram anotados com esses termos ontológicos SBC-específicas. Parte do SET-C (área chocado; Set-c e Set-bc na Figura 10A) serve como um “conjunto de fonte de genes de câncer alvo” que, ambos, carregam a essência ontológica da SBCGs e não estão envolvidos nos mecanismos de câncer genéricos. metas específicas-SBC (Figura 3 e Figura 10b), que são anotados com termos GO-chave (Figura 9) papel reflete em, ambos, processos ósseos e mecanismos de metástase, foram ainda obtidas a partir do conjunto de origem.

Resultados

CGN como um interactome Representante de câncer mecanismos

Nós destinados a construir um interactome que representa mecanismos envolvidos nos processos que contribuem para o câncer. Para isso, usou genes listados na base de dados CancerGenes [48], uma compilação de genes do câncer que são causalmente implicado na oncogênese. Obtivemos 3164 genes do cancro da base de dados CancerGenes, que foram usadas para construir uma interactome. Estes genes foram mapeados em Proteína Humana banco de dados de referência [49], uma base de dados de informações de proteómica curadoria pertencentes a proteínas humanas, para construir os genes do cancro de rede (CGN). CGN representa assim uma intrincada rede de proteínas cancerígenas. CGN compreende 11602 interações entre 2665 proteínas. A Figura 3 representa a CGN, uma interactoma proteína representativos de agentes moleculares e as suas interacções, reguladoras envolvidas no fenótipo da doença de cancros. Com base em relatórios anteriores [3], os autores sugerem que as proteínas que são essenciais para a integridade e interação dinâmica estrutural de CGN corresponderia a proteínas envolvidas em mecanismos de regulação genéricos para câncer.

genes do cancro Network (CGN) é uma interactome proteínas de genes do câncer que incorporem mecanismos moleculares de cânceres. Cada nó representa uma proteína de cancro e uma aresta entre dois nós representa uma interacção proteína-proteína. O aglomerado gigante compreende 89% de todos os genes do cancro. Os cubos de CGN, genes do cancro centrais para a dinâmica de estabilidade e de informação estruturais, são representadas em tons de vermelho. Os cubos codificam genes envolvidos nos mecanismos de câncer de genéricos e os classificados como essenciais, utilizando dados fenotípicos de rato Genoma Informática. 88% destes centros são essenciais ( “vermelho escuro”) eo resto não-essenciais ( ‘luz vermelha’). metas específicas-SBC, com papel ontológico em processos ósseos e metástases, são destacadas em “verde”.

Genes Topologicamente Central de CGN Correlacionar a mecanismos de Câncer Genéricos

redes de interação molecular foi relatado que tem uma natureza de livre-escala marcada pela presença de alguns eixos que são críticas para as redes [50]. Tais centros de interactoma de proteína são registadas como sendo mais essencial para a sobrevivência [31] e também importante para a taxa de crescimento celular [32]. Proteínas com alta betweenness são referidos como tendo muito maior tendência a ser genes essenciais [35], [36]. proteínas do cancro são registadas como sendo mais central na interactoma proteína e são, em média, envolvido em dobro de interacções de proteínas não-cancerosas [37]. Como relatado para outras redes moleculares biológicos [50], [51], descobrimos que CGN tem uma natureza livre de escala que indica presença de excepcionalmente promiscuamente interagindo nós hub e aqueles mediação de um grande número de interações (Figura 4) [52].

As distribuições de (a) grau e (B) o estresse (bem como o seu homólogo normalizado “betweenness ‘) mostram uma natureza sem escala. As linhas pontilhadas mostram o ajuste da lei de potência com um expoente de -2,85 e -2,13, respectivamente. Isso indica presença de promiscuamente proteínas que interagem com elevados graus e mediadores centrais que desempenham papel na dinâmica de informações através da rede, respectivamente.

Nós calculado sete parâmetros que refletem características topológicas (grau [53] e conectividade bairro [54]), o fluxo de rede (betweenness [33], [34], o estresse [33], [34] e comprimento médio caminho mais curto [55]) e clustering local (coeficiente de agrupamento [53], [55], [56 ] eo coeficiente topológica [57]). As proteínas ‘chave’, que são topologicamente e dinamicamente central para CGN, foram identificadas por análise de rede. Para este efeito, “grau”, ‘stress’ e a contraparte normalizada deste último, ‘betweenness’, foram utilizadas para a identificação de proteínas centrais de CGN. Nós achamos que os parâmetros selecionados mostram muito elevadas correlações positivas mútuos (Figura 5). As proteínas melhor classificados de cada um destes parâmetros foram compiladas, para vários limiares (Top25-Top200), para identificar proteínas designadas como “centros” (Set-A na Figura 2 e Tabela S1).

O heatmap de correlações de pares entre sete parâmetros que enumerar recursos de cluster topológicos, dinâmicos e locais da rede: intermediação, de estresse, de graduação, de conectividade vizinhança (neigh_conn), coeficiente de agrupamento (clust_coeff), comprimento médio caminho mais curto (avg_short_paths) e coeficiente de topológica ( topo_coeff). O heatmap destaca três parâmetros com correlações muito altas mútua positiva (r = 0,8989, 0.9930 e 0.9210): grau, intermediação e estresse. O triângulo superior da heatmap retrata correlações de pares como gráficos de pizza. O triângulo inferior representa correlações positivas e negativas em tons de azul e vermelho, respectivamente; mais escura a cor mais forte a correlação. correlações positivas e negativas também são representadas com linhas diagonais destros e canhotos

Nós achamos que os “centros” (Figura 3; limiar Top75)., assim identificados, incluem genes envolvidos na regulação da os processos conhecidos para ser genericamente presente na maioria dos cancros [1]. Proteínas conhecidas para ser envolvido em sinais de crescimento, levando assim a auto-suficiência em células cancerosas, tais como TGFBR1, EGFR, IGFR1R, GRB2, estão nos “centros” de CGN [2]. Os cubos também incluem RB1, BCL2, AKT1, CDK2, CASP8 que estão envolvidos em mecanismos de apoptose, em que as células são conhecidos para adquirir resistência em todos os tipos de cancros [1], [58]. A proteína supressora de tumor TP53, conhecida por estar envolvida na perda de ocorrência mais comum de regulação e pró-apoptótica que afecta o efector cascata apoptótica [59], [60], também está presente nos cubos CGN. Uma das proteínas do cubo, SMAD4, é conhecido por estar envolvido na diferenciação, apoptose e ciclo celular [61]. MYC, conhecido por upregulate ciclinas e regular negativamente CDKN1A (P21), é também um dos centros de CGN.

Além disso, nós fizemos o check quão bem os pólos identificados correlacionam com KEGG-PIC [62], uma coleção de genes de caminhos genéricos envolvidos em cancros (Tabela S2). A Figura 6 mostra a sobreposição dos genes do cubo (Top25 para Top200) com genes KEGG-PIC. Descobrimos que de fato os centros Top25, compreendendo as proteínas mais promiscuamente interagindo e mediando um grande número de interações em genes do cancro interactome, tem uma sobreposição de 74% com KEGG-PIC. A precisão da identificação de proteínas cancerígenas genéricos cai à medida que a definição de “centros” é relaxado mais (57% para o Top50 e 52% para Top75). Como controlo negativo, para a capacidade de classificação de rede-métricas baseadas em identificar proteínas genéricos, usamos genes classificados pior de acordo com os parâmetros selecionados. Nós achamos que esses genes têm um muito pobre sobreposição com genes KEGG-PIC, mesmo quando comparado com o esperado a partir correspondente amostragens aleatórias (Figura 6). Tratamos Top25, Top50 e Top75 CGN centros como representantes dos genes do cancro genéricos e usá-los, ainda, para identificar alvos específicos-SBC.

Os centros de CGN, identificados por meio de parâmetros de centralidade rede escolhida, correlacionam-se com o conjunto dos genes do cancro genéricos (KEGG-PIC). Para definições de cubo que variam entre Top25-Top200, os cubos CGN (top classificados genes do câncer) mostram boa sobreposição com genes KEGG-PIC (círculos cheios). A correspondência de centralidade de rede e papel genérico em cancros, expectedly, cai como o rigor do critério utilizado para a identificação de centros é solta. Para as amostras aleatórias correspondentes, a sobreposição com KEGG-PIC é como esperado (estrelas; barras de erro indicam erros padrão de 1000 amostras). Os genes de câncer com piores rankings de centralidade (círculos abertos), mostram quase nenhuma sobreposição com genes do cancro genéricos; pior do que o esperado a partir de amostras aleatórias. Top75, Top50 e Top25 hubs, com 52%, 57% e 74% de sobreposição com genes do cancro genéricos, respectivamente, foram utilizadas para a identificação de genes de câncer específicos-SBC.

GO Enriquecimento de CGN Hub genes

Foram realizadas análises de enriquecimento de GO de CGN ‘hub’ genes identificados. Esperamos que os “centros” para representar processos cancerígenos genéricos que são compartilhados pela maioria, e talvez, todos os tipos de cânceres humanos. A maquinaria molecular que regula a proliferação, diferenciação e morte de todas as células de mamífero é muito semelhante [1]. A transformação genética de células normais do corpo resulta em defeitos de circuitos regulamentares que regem a proliferação celular normal e homeostase, e coletivamente determinam o crescimento maligno.

As células cancerosas mostrar auto-suficiência dos sinais de crescimento que envolvem alteração de transcelular ou mecanismos intracelulares [ ,,,0],2]. As vias de crescimento sinalização são suspeitos de sofrer desregulamentação em todos os tumores humanos [2]. Isto reflectiu-se nos seguintes termos GO significativamente sobre-representadas de cubos CGN: resposta celular à hormona do crescimento estímulo (GO: 0.071.378), a regulação do receptor do factor de crescimento epidérmico via de sinalização (GO: 0.042.058), transformando o receptor do factor de crescimento beta via de sinalização (GO: 0007179), sinalizar montagem complexa (GO:. 0.007.172)

Em contraste com as células normais, que respondem a sinais anticrescimento, as células cancerosas são insensíveis aos sinais anticrescimento devido ao rompimento de vias relacionadas com o relógio do ciclo celular. Nós achamos que a nossa lista de termos GO significativamente enriquecido para concentradores CGN tinha muitos termos associados com os processos do ciclo celular: ciclo celular G1 /checkpoint transição mitótico S (GO: 0.031.575), a regulação do G1 /S de transição de ciclo celular mitótico (GO: 2000045 ), DNA danos resposta, transdução de sinal por p53 mediador classe (GO: 0.030.330), a regulação do ativada por estresse MAPK cascata (GO:. 0.007.173)

Na carcinogênese humana, todos os tipos de cânceres são conhecidos para adquirir resistência a apoptose [58]. Os termos GO super-representados de cubos CGN sublinhar esta observação: libertação de citocromo c das mitocôndrias (GO: 0.001.836), a ativação de produtos de genes pró-apoptóticos (GO: 0.008.633), processo de apoptose específica do tipo celular (GO: 0.097.285), componente celular desmontagem envolvido no processo de apoptose (GO: 0.006.921), a regulação positiva de anti-apoptose (GO: 0.045.768)

Além disso, encontramos seguinte significativamente enriquecida ‘função molecular “termos:. transformando receptor beta do fator de crescimento, caminho espec�ico actividade mediadora citoplasmática (GO: 0.030.618), receptor sinalização actividade da proteína tirosina quinase (GO: 0.004.716), ligação ao receptor ephrin (GO: 0.046.875), atividade da MAP quinase (GO: 0.004.707), a ligação beta-catenina (GO: 0008013) , ligação ao receptor de citocina (GO: 0.005.126), andrógenos ligação ao receptor (GO: 0.050.681).

Todos os Go-termos mencionados acima são amplamente compatíveis com processos de câncer genéricos. Os valores de p para estes “termos GO significativamente enriquecidas de CGN Top75 centros” estão na faixa de 10e-4 e 10e-13. A Figura 7 descreve estes termos e as estatísticas de sua prevalência GO sobre-representadas.

Os estudos sobre-representação de centros Top75 CGN reflectir o seu papel nos processos de câncer genéricas e funções. Entre os termos GO significativamente enriquecidos, 17 representam circuitos auto-proliferação (cinza claro), 20 representam citóstase e circuitos de diferenciação (cinza escuro) e 4 representam circuitos de viabilidade (preto).

Genes Topologicamente Central de CGN correlacionam com biológica Essentiality

Fizemos o check ainda mais a importância biológica dos genes centrais da CGN. Dividimos CGN em dois conjuntos, essenciais e não essenciais, utilizando Mammalian Fenótipo ontologias [63] para classificar genes como essencial quando causada embrionário, perinatal, pós-natal ou letalidade neonatal em modelos de ratos [64] utilizando dados fenotípicos de rato Genome Informática ( MGI) [65]. A percentagem de genes essenciais foram computados no ‘pólos’ e sua não-pólos para diferentes definições de cubo correspondente. A figura 8 mostra as estatísticas de porcentagem de genes de hub e não-hub anotados como essencial. Entre os sete parâmetros calculados, os centros identificados utilizando grau, intermediação e estresse têm uma percentagem significativa de genes essenciais (entre 82% a 92%) (Figura 8a). Aliás, nenhum dos quatro parâmetros de rede restantes mostram boa correlação com a essencialidade biológica. O não-cubos, como esperado a partir das estatísticas de amostragens aleatórias, tem cerca de 50% dos genes essenciais associados, independentemente da métrica usado para a classificação (Figura 8B). Para cubos de genes compreendendo Top75, os parâmetros escolhidos têm uma proporção muito elevada de genes essenciais (entre 88% e 89%), em comparação com o resto dos parâmetros. A Figura 3 ilustra a natureza central do cubo de genes Top75 de CGN e destaca os genes essenciais e não essenciais entre eles. Isso enfatiza a importância das métricas de rede escolhida na codificação de relevância biológica. Isto é consistente com relatórios anteriores sobre cubos sendo mais essencial [64] e centralidade rede de genes de câncer [37].

A. Para definições de cubo que variam entre Top25 para Top200, os centros identificados utilizando grau (1, ‘vermelho’), betweenness (2, “verde”) e estresse (3, ‘blue’) têm significativamente elevada percentagem (82% -92% ) de genes essenciais, classificados usando dados fenotípicos para mouse Genome Informática. Entre o resto da conectividade quatro parâmetros bairro (4) e coeficiente de topológica (5) mostram nem correlação significativa nem consistente com genes essenciais. Devido à natureza de “coeficiente de agrupamento” e os parâmetros “médio mais curto comprimento de caminho ‘, os dados não puderam ser finalmente resolvido nos mesmos intervalos. Para coeficiente de agrupamento, a percentagem de genes essenciais entre os nós que têm até classificações Top200 está na gama de 27% e 62%. Para comprimento médio caminho mais curto, a percentagem de genes essenciais para nós ter escalão até Top200 é de 26%, pior do que o esperado por amostragem aleatória. B. No correspondentes não-hubs, a percentagem de genes essenciais é como esperado a partir de amostragem aleatória, independentemente da medida de centralidade ou de corte utilizado para a definição hub.

SBCGs e seus Termos GO característicos

Sabendo que a metástase em ossos é causada principalmente por disseminação de cancros da próstata e da mama primários [10] – [13], que visa compilar genes ligados a estes processos. Nós compilou uma lista de 391 Secundário Bone Cancer (SBC) genes suscetíveis de estudos experimentais de relatórios da literatura (Set-B na Figura 2 e Tabela S3). Para identificar a relevância destes genes no contexto de metástases em ossos, foi realizada uma análise sobre-representação utilizando CGN como universo. espera-se que os estudos de enriquecimento Gene ontologia da SBCGs para refletir categorias Go de processos biológicos e funções moleculares que são relevantes para a metástase em ossos, consistentes com os aspectos conhecidos de mecanismos reguladores da metástase óssea (Figura 1).

Foram identificados 93 enriqueceu significativamente termos de ir SBCGs para os processos biológicos, funções moleculares e componentes celulares. Nós identificamos genes CGN anotados com qualquer um destes 93 termos GO para construir set ‘Genes Enriquecido “(Set-C na Figura 2). Nós encontramos que, dos 93 termos GO significativamente enriquecidos, 31 estão associados a processos de metástase ou ósseas. Fora destes 31 termos GO, 21 são mais relevantes para os mecanismos de metástase e 10 para processos relacionados com osso (Figura 9).

A partir dos estudos de enriquecimento de ir SBCGs, com curadoria da literatura, 21 termos GO relevantes para a metástase ( “luz cinza ‘) e 10 GO termos relevantes para o osso (‘ cinza escuro ‘) foram identificados processos

O seguinte termos GO, que foram significativamente enriquecidas, estão relacionados com processos de osso:. diferenciação dos osteoblastos (GO: 0.001.649), a regulação da remodelação óssea (GO: 0.046.850), ossificação endocondral (GO: 0.001.958), ossificação de substituição (GO: 0.036.075), mineralização óssea (GO: 0.030.282), ossificação (GO: 0.001.503), o desenvolvimento da cartilagem ( GO: 0051216), a resposta à vitamina D (GO: 0.033.280), processo metabólico colágeno (GO: 0.032.963), colágeno organização fibrilas (GO:. 0.030.199)

Os seguintes processos biológicos GO termos, que foram significativamente enriquecida , estão relacionados com mecanismos de metástase: a migração de leucócitos (GO: 0.050.900), a adesão célula-célula (GO: 0.016.337), a angiogênese (GO: 0.001.525), a regulação positiva de adesão celular (GO: 0.045.785), a regulação negativa de adesão celular ( GO: 0007162), a regulação positiva da migração de leucócitos (GO: 0.002.687), a regulação da quimiotaxia dos leucócitos (GO: 0.002.688), a regulação positiva da quimiotaxia de leucócitos (GO: 0.002.690), a regulação positiva de importação catenina para o núcleo (GO: 0.035.413).

Na sequência de funções moleculares GO termos que foram significativamente enriquecidas, estão relacionados com mecanismos de metástase: a ligação a laminina (GO: 0.043.236), a ligação de fibronectina (GO: 0.001.968), de crescimento de fibroblastos fator de ligação ao receptor (GO: 0.005.104), derivado de plaquetas fator de crescimento de ligação (GO: 0.048.407), extracelular de ligação matriz (GO: 0.050.840), a ligação do colágeno (GO: 0.005.518), integrina de ligação (GO: 0.005.178), glicosaminoglicanos ligação (GO: 0.005.539), a atividade de citocinas (GO: 0005125), hidrato de carbono de ligação (GO: 0.030.246)

Previsto metas SBC-específica

Para prever metas específicas-SBC de valor terapêutico potencial, nós logicamente justapostos os três conjuntos de genes obtidos:. CGN genes cubo (Top75), SBCGs e os genes do cancro anotados com termos GO super-representados para SBCGs (Figura 2 e Figura 10). Com base na especificidade para o cancro do osso secundária, como representado na Figura 10A, o diagrama de Venn correspondente a estes conjuntos de genes foi dividido em sete regiões distintas: Definir-um, Set-b, Set-C, Set-AB, Set-bc , Set-ac e Set-abc. Em geral, os conjuntos de genes pertencentes a centrais de CGN (Set-um, Set-AB, AC e Set-Set-ABC) contêm genes que estão envolvidos em mecanismos de cancro genéricos (Figura 6) e são também essenciais (Figura 8). Assim, enquanto a obtenção de metas SBC-específico, nós não consideramos esses conjuntos de genes. Fora do descanso de conjuntos de três, Set-b compreende genes que já são relatados para ser associada com os mecanismos de SBC, portanto, não podem revelar novos genes.

Deixe uma resposta