PLOS ONE: Anomalias no Bridges rede envolvida na Bile metabolismo ácido prever resultados de Colorectal Cancer Patients

Abstract

Os biomarcadores de prognóstico para câncer colorretal (CRC) seria altamente desejável na prática clínica. Proteínas que regulam a homeostase ácido (BA) bile, ligando sensores metabólicos e enzimas metabólicas, também chamadas proteínas ponte, pode ser biomarcadores prognósticos fiáveis ​​para CRC. Com base em uma métrica, inventei “bridgeness”, identificamos proteínas ponte envolvidas na regulação da homeostase BA e identificou suas potencialidades prognósticos. Os padrões de expressão destas proteínas de ponte poderia distinguir entre tecidos normais e doentes, sugerindo que estas proteínas estão associadas a patogénese de CRC. Utilizando um sistema de classificação supervisionada, descobrimos que estas proteínas ponte foram reproducibly prognóstico, com elevada capacidade de prognóstico em comparação com outros marcadores conhecidos

Citation:. Lee S, Lee K, Yoon S, Lee JW, Lee D (2014 ) Anomalias em Pontes rede envolvida na Bile metabolismo ácido prever resultados de colorretais pacientes com câncer. PLoS ONE 9 (9): e107925. doi: 10.1371 /journal.pone.0107925

Autor: Antonio Moschetta, IRCCS Instituto Oncológico Giovanni Paolo II, Itália |

Recebido: 27 Março, 2014; Aceito: 18 de agosto de 2014; Publicação: 26 de setembro de 2014

Direitos de autor: © 2014 Lee et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Data Availability:. O autores confirmam que todos os dados subjacentes às conclusões estão totalmente disponíveis sem restrições. Conjuntos de dados sobre perfis de expressão gênica utilizados estão disponíveis a partir de GEO (Marisa et al., A adesão = GSE39582, Sheffer et al., A adesão = GSE41258, Calon et al., A adesão = GSE39397). Um conjunto de dados sobre enzimas metabólicas humanos está disponível a partir do arquivo suplementar de Hao et al, papel:.. Hao et al, “A compartimentalização do Edinburgh Humano rede metabólica”, BMC Bioinformatics, 2010, 11: 393. Um conjunto de dados sobre os perfis de expressão gênica do tecido humano inteiro está disponível a partir do banco de dados BioGPS (URL: https://biogps.org/downloads/). Um conjunto de dados sobre as interacções proteína-proteína humana está disponível a partir de HPRD (URL: https://www.hprd.org/download). interações proteína-ADN (interações gene TF-alvo) a partir do banco de dados TRANSFAC deve ser aprovado pelo BIOBASE GmbH

Financiamento:. Este trabalho foi financiado por doações do NIH (DK064678 para J.W.L.). K. L. foi apoiado pelo Programa de Pesquisa em Ciência Básica através da Fundação Nacional de Pesquisa da Coreia (NRF), financiado pelo Ministério da Educação, Ciência e Tecnologia (NRF-2013R1A2A2A04013317). D. L. foi apoiado por subsídios da Coreia Saúde Tecnologia R D Project, Ministério da Saúde e Bem-Estar, República da Coreia (A112022); e também pelo Projeto Bio-Synergy Research (NRF- 2012M3A9C4048758) do Ministério da Ciência, TIC e Planejamento Futuro através da Fundação Nacional de Pesquisa. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

o câncer colorretal (CCR) é a terceira principal causa de mortes por câncer em todo o mundo, com 746.000 pessoas morrem desta doença em 2012 [1]. biomarcadores de prognóstico iria melhorar as estratégias de tratamento através de estratificações de risco [2]. Até à data, no entanto, alguns indicadores de prognóstico do paciente foram identificados, impedindo a seleção e tempo de terapia adjuvante para pacientes em risco.

biomarcadores prognósticos deve ser mecanicamente relevantes para patogênese da doença. Embora atuais expressão assinaturas controladas por dados, onde os padrões de expressão de genes são altamente correlacionadas com o prognóstico do paciente, têm demonstrado capacidade de prognóstico substancial, eles não revelaram mecanismo subjacente e intervenções terapêuticas adequadas, assim obscurecidas [3]. hipóteses biológicas têm proporcionado uma evidência priori de relevância mecanicista [4], mas abordagens baseadas na hipótese direcionados existentes são susceptíveis de perder vários genes relacionados com as hipóteses biológicas, exigindo novas abordagens alternativas para encontrar genes de hipóteses relevantes.

Os ácidos biliares (BAS) são cancerígenos [5], [6], com dietas ricas em gordura modulação da homeostase BA e os níveis alterados de BAs que levam a CRC patogênese. Por exemplo, uma dieta suplementada com BA em ratos foi demonstrado induzir CRCs directamente, sugerindo que os BA são cancerígenos [7]. No entanto, embora BAs levar a CRC patogênese, BAs não foram utilizados como marcadores práticos. Em níveis in vivo, eles eram fracos e indistinto entre pacientes com CRC e controles pareados entre os estudos [8] uma vez que os níveis BA alterados por ingestão de alimentos são temporários e fraco, portanto, difíceis de detectar. Anomalias em genes que regulam a homeostase BA celular são mais de fatores determinados para desenvolver CRCs.

As proteínas envolvidas na regulação da homeostase não só BAs, mas todos os metabolitos incluem sensores metabólicos e enzimas metabólicas. sensores metabólicas reconhecer a informação metabólica durante a regulação da homeostase, detectando os níveis de metabolitos intracelulares [9] – [11]. Por exemplo, o receptor farnesoid X (FXR, também conhecido como NR1H4) detectar o nível do BAS intracelulares, com esta informação utilizada durante a regulação da homeostase celular BA. enzimas metabólicas catalisar as reações dos metabólitos, alterando seus níveis intracelulares. Anomalias nestes sensores e enzimas, portanto, alterar a homeostase BA [12], [13] e, finalmente, afetar CRC patogênese. Por exemplo, defeitos genéticos na regulação BA enzimas ou proteínas sensoras foram encontrados para levar a CRC patogénese [14], [15]. No entanto, estes genes também não eram marcadores de prognóstico, devido à baixa incidência de mutações em CRCs.

Curiosamente, os fatores adicionais que não são nem sensores, nem enzimas metabólicas foram mostrados para modular BA homeostase [16]. Como um método alternativo de identificar marcadores prognósticos fiáveis, a hipótese de que esses fatores podem transmitir informações sobre o estado metabólico entre os sensores metabólicos e enzimas, ligando funcionalmente essas duas classes de moléculas. Esses fatores, chamadas proteínas ponte, pode servir como marcadores prognósticos confiáveis ​​em pacientes com CCR, por causa anomalias nestas proteínas iria perturbar a entrega de informação metabólica ea regulação da homeostase BA. abordagens direcionadas atuais seria ineficaz na sondagem proteínas relé especificamente entre os sensores e enzimas metabólicas, devido em grande parte à falta de um método para quantificar o grau de retransmissão de proteínas. abordagens sistemáticas, utilizando informações sobre as interações moleculares conhecidas e as proteínas que ligam sensores e enzimas podem identificar e distinguir as proteínas ponte implicados em redes de sinalização celular.

Aqui, propomos uma abordagem baseada em rede que identifica marcadores prognósticos entre proteínas que desempenham um papel crítico possivelmente ligando sensores e enzimas do metabolismo BA, relativa à hipótese biológica conhecida. Estas proteínas, denominadas proteínas ponte, pode ser avaliada de forma sistemática com base em informações sobre as interações moleculares registrados em diversas bases de dados. Para este fim, nós definimos uma métrica “bridgeness”, representando os graus de conexão entre sensores e enzimas, proteínas e propor Key Bridge como marcadores de rede para o prognóstico em pacientes com CCR. Usando essa abordagem “iniciada pelo hipótese”, identificamos um conjunto de marcadores que podem prever melhor os resultados em pacientes com CRC de marcadores prognósticos previamente identificados. Uma investigação baseada em rede de biomarcadores com base em sua propriedade bridgeness pode identificar biomarcadores de prognóstico implicados em redes celulares.

Resultados

redes Ponte e proteínas ponte para o metabolismo de ácidos biliares

A nossa abordagem baseada em rede identificaram 50 proteínas ponte marcadores prognósticos como confiáveis ​​(Tabela S1). proteínas ponte-classificados Top incluídos gamma peroxissoma proliferador-ativado receptor, coativador 1 alfa (PPARGC1A), hepatócitos nuclear factor 4 alfa (HNF4A), glicogênio sintase quinase 3 beta (GSK3B), retinóide receptor gama X (RXRG), caspase 8, a apoptose -relacionados peptidase cisteína (CASP8), a ligação da proteína CREB (CBP), peroxisoma alfa do receptor activado por proliferador (PPARa), p53 (também conhecido como TP53), p300 E1A ligação às proteínas (EP300) e receptor alfa do retinóide X (RXRA). Notavelmente, RXRA, a formação de um heterodímero com um sensor de BA, FXR, participa na regulação da homeostase BA [17]. Além disso, p53 regula a homeostase BA, ligando entre um sensor BA e enzimas BA, levando ao acúmulo anormal BA por seu defeito [16], [18]. Da mesma forma, algumas proteínas ponte que funcionam na regulação BA homeostase estão resumidos na Tabela S2, mostrando evidências de que as proteínas da ponte, embora sejam computacionalmente selecionado, pode participar na regulação da homeostase BA.

Para investigar essas proteínas ponte, construiu-se uma rede de referência para o metabolismo BA (Figura 1), uma rede de sensores composto metabólicas, enzimas metabólicas e proteínas que ligam sensores e enzimas. proteínas ponte central que regulam certas vias metabólicas foram investigados pela primeira integração de dados de conhecimento e interactome anteriores. Até à data, 53 enzimas, incluindo os transportadores, têm sido referida como estando envolvida no metabolismo de BA e registadas na base de dados EHMN (Tabela S3) [19]. Como os BA detectar e regular os seus níveis, alterando a jusante para vias de bas, FXR foi encontrado in vivo e in vitro para ser um sensor ao BAS [11]. Com base no conhecimento prévio e o banco de dados, o sensor e as enzimas foram incluídos em uma rede de ponte BA. interactoma de dados em grande escala, a partir de bancos de dados, incluindo HPRD [20] e TRANSFAC [21], foram integrados para identificar proteínas que se ligam sensores e enzimas (Figura 1B). Descobrimos que 10,805 genes ou produtos de genes foram responsáveis ​​por 110,741 interações; destes produtos de genes, foram extraídas somente os sensores, enzimas e proteínas intermediários relacionados. Todas as proteínas responsáveis ​​pela interacções directas e indirectas entre os sensores e enzimas foram considerados, com qualquer proteína intermediária sendo uma possível proteína ponte.

O processo global da construção da rede é descrito em (B-E). (A) A estrutura de uma ponte de rede, constituído por um sensor metabólica (vermelho), uma enzima metabólica (azul) e uma proteína de ponte (cinzento). enzimas metabólicas catalisar as reações dos metabolitos. sensores metabólicas detectar os níveis de metabolitos intracelulares. proteínas ponte ligar sensores metabólicas e enzimas metabólicas. (B) Integração de possíveis interacções entre os sensores e enzimas que utilizam as interacções proteína-proteína (PPI) e interacções proteína-ADN (PDI). Informações sobre sensores e enzimas foram recolhidos a partir de estudos e bases de dados publicados. (C) A imposição de restrições sobre nós e arestas de uma rede integrada. (D) uma rede de referência definitiva para identificar proteínas ponte. (E) Seleção de proteínas ponte da rede de referência por suas pontuações bridgeness

As restrições foram posteriormente impostas a ambas as proteínas e suas interações, considerando o contexto específico do tecido do metabolismo (Figura 1C;. Materiais e Métodos). Apesar abundante informação sobre dados interactoma de grande escala, pode haver desvios e variações de selecção específicos de tecidos. Como resultado da imposição de restrições, obteve-se uma rede de referência final de 63,070 bordas e 7.011 nós, com sensores e enzimas que constituem 23 nós (Figura 1D, veja a Figura S1 para a rede de referência final).

A partir da referência rede, selecionamos proteínas ponte, entre as proteínas intermediárias, que os sensores BA melhor ligação e enzimas BA, usando uma métrica “bridgeness”, assumindo que as proteínas altamente ligando regulam criticamente BA homeostase através da entrega de informações metabólica (Figura 1E; Métodos). Em comparação com outras centralidades existentes, incluindo grau, proximidade e centralidades intermediação (ver S1 texto), o nosso método era mais capaz de se concentrar em ligações de um determinado proteína em caminhos específicos entre os sensores e enzimas, independentemente das conexões em outros caminhos independentes na rede . Como esperado, as proteínas localmente densas entre os caminhos entre sensores BA e enzimas BA contribuir significativamente para a regulação do metabolismo BA; Assim, estas proteínas podem ser associados com CRC carcinogénese. Nós, portanto, focada no potencial de prognóstico de proteínas ponte com altas pontuações bridgeness.

características biológicas das proteínas ponte

Antes de investigar seus potenciais prognósticos, examinamos as características biológicas das proteínas de pontes que foram computacionalmente selecionadas por dezenas bridgeness em CRCs. Primeiro, identificamos padrões de proteínas ponte embutidos em CRCs de expressão; examinámos discriminativos padrões de proteínas de ponte ao nível do transcriptoma, usando perfis de pacientes de CRC de expressão genética, tal como descrito anteriormente [22]. Usando Estudante uni

t

-Testes, verificamos a capacidade de proteínas ponte individuais para distinguir entre cólon normal (

N

= 54) e amostras primárias de tecido CRC (

N

= 186) ao nível do transcriptoma. Dos 50 principais proteínas, 42 (84%) foram significativamente discriminativo (frente e verso

P Art 0,01). Gene análise enriquecimento ontologia destes 42 proteínas revelou que a maioria foi enriquecida em termos tais como “regulação da transcrição a partir do promotor da polimerase de ARN II” e “actividade reguladora da transcrição”, que estão relacionados com funções reguladoras em processos celulares (Tabela S4). Eles também foram enriquecidos em termos CRC relacionadas às vias patogênicas, como “caminho do receptor do Wnt canônica de sinalização” e “axina-APC-beta-catenin-GSK3B complexa”, sugerindo a relevância destas proteínas ponte para CRC patogênese.

em seguida, foram comparadas as distribuições p-valor de i) proteínas ponte, ii) um sensor e uma enzima, e iii) um grupo combinado de i) e ii) (Figura 2). Comparado com o fundo de distribuição de valores de p a partir de produtos de genes totais detectadas num microarray (

N

= 12752), a distribuição de p-valor do grupo combinado foi um pouco deslocado da direita (de Kolmogorov-Smirnov (KS) teste, unilateral

P

= 7,89 × 10

-2). No entanto, quando nós nos concentramos apenas nas proteínas ponte, eles mostraram alta significância estatística no teste KS (

P

= 2,93 × 10

-3), indicando que o poder discriminativo de proteínas ponte, na transcriptoma nível, foi significativamente maior do que a de produtos de genes totais no microarray. Curiosamente, as proteínas de sensores e de enzimas mostrou distribuições semelhantes em relação ao fundo (

P

= 0,812), indicando que o sensor e proteínas enzimáticas são menos informativos do que as proteínas de ponte na distinção entre tecidos normais e doentes do cólon.

distribuições (A) p-valor de proteínas (i) do sensor, de enzimas e de ponte (S + e + B), (II) e proteínas de sensores enzimáticos (S + e) ​​e (iii) proteínas ponte (B). (B) Comparações de essas distribuições P-valor com distribuição de fundo p-valor. Os níveis de significância estatística das distribuições p-valor desviado foram determinadas por um lado Kolmogorov Smirnov testa.

Nós também investigou se as proteínas ponte top-50 é um número viável de seleções com elevada significância estatística. Portanto, em comparação das distribuições p-valor de selecções com vários números de proteínas em ponte, utilizando o KS-teste. As proteínas ponte topo-50 apresentaram o menor valor de p nesta comparação (Figura S2), com a significância estatística das proteínas ponte seleccionado a ser inferior. Assim, nós nos concentramos no top-50 proteínas de ponte em uma análise mais aprofundada. Também incluímos outros constrangimentos utilizados na construção da rede de forma semelhante (Figura S3).

A seguir, comparou o poder discriminativo de proteínas ponte selecionados de diferentes redes, por meio da classificação multivariada (Figura 3A) (Ver processo detalhado no Materiais e métodos). As redes gerados para comparações foram: (i) uma rede ponte desenvolvido a partir de metabolismo BA, (ii) uma rede ponte desenvolvido a partir do metabolismo da glicose (isto é, via da glicólise) e (iii) uma rede de proteína inteira sem se limitar por sensores e enzimas em certa vias metabólicas. Também comparamos proteínas selecionadas aleatoriamente, independentemente de suas interações. Glicólise foi escolhido para comparação com o metabolismo BA devido à sua relevância para o cancro comum progressão [23], [24]. Como esperado, o poder discriminativo de uma rede ponte BA no nível transcriptoma superou o de uma rede ponte glicólise porque a glicólise não é especificamente envolvidos em CRCs. A capacidade dos componentes da rede de ponte BA para classificar uma amostra de cólon normal ou tecido CRC primário (Figura 3B) excedeu em larga medida que os produtos dos genes seleccionados de forma aleatória. Em contraste, os componentes de outras redes, incluindo envolvidos na glicólise que, eram iguais ou quase não excedeu os produtos dos genes seleccionados aleatoriamente em capacidade discriminativa. Ou seja, apenas os níveis de expressão de genes de proteínas ponte selecionados a partir de uma rede de ponte de BA de acordo com bridgeness foram informada na distinção entre cólon normal e CRC.

(A) Processo geral de classificações multivariados usando recursos a partir de proteínas ponte de diferente redes. Após a triagem proteínas ponte por sua bridgeness (), os recursos foram extraídos cumulativamente a partir de proteínas ponte topo do ranking (). As amostras foram posteriormente classificadas por características cumulativamente selecionados e precisões de classificação calculados (). (B) As precisões das classificações entre cólon normal e tecidos CRC primários. Para obter as classificações, proteínas ponte foram obtidos a partir de (i) uma rede de ponte de ácidos biliares (vermelho), (ii) uma rede ponte glicólise (amarelo) e (iii) uma rede de proteína inteira (roxo). precisões de classificação também foram calculados utilizando proteínas selecionadas aleatoriamente (preto) com intervalos de confiança de 95% (cinzento) no precisões de classificação médios de seleções aleatórias repetidos (C) As precisões das classificações entre os tecidos do cólon e pólipos normais. (D) As precisões das classificações entre pólipo e tecidos CRC primários.

Em seguida, examinou CRC padrões de expressão específica em estágio de proteínas ponte selecionados. A maioria dos CRCs esporádicos desenvolver a partir de cólon normal, por meio de pólipos adenomatosos, com a sequência envolvendo anomalias genéticas acumuladas numa forma passo a passo [25]. Para identificar variações específicas do estágio em proteínas ponte, realizamos classificações multivariadas entre dois pontos normais e pólipos adenomatosos e entre pólipos e CRCs primários. Encontramos variações substanciais na expressão dos genes de proteínas ponte entre dois pontos normais e pólipos (Figura 3C e D). Nomeadamente, as proteínas da ponte associados com o metabolismo BA variar substancialmente durante os estágios iniciais de CRC patogénese, o que sugere que estas proteínas podem ser iniciadores de ponte de CRC tumorigénese. Nós também descobrimos que as proteínas ponte de metabolismo BA e padrões inversos glicólise exibiu entre pólipos e CRCs primários, mostrando mais fraco, mas substancial, variações durante a fase posterior da CRC patogênese, como se estas mudanças eram seguidores de desenvolvimento CRC (Figura 3C e D). Juntos, estes resultados mostraram que as proteínas ponte de metabolismo BA e glicólise comportado commutatively durante a progressão CRC.

Além disso, por meio de testes de enriquecimento percurso, observamos outras características biológicas significativas de proteínas ponte. proteínas ponte envolvidos no metabolismo BA foram enriquecidos em vias relacionadas-CRC, incluindo a Wnt (KEGG ID: hsa04310; falsa taxa ajustada descoberta, hypergeometric

P

= 4,47 × 10

-5), CRC ( KEGG ID: hsa05210;

P

= 2.80 × 10

-5) e câncer comum (KEGG ID: hsa05200;

P

= 6.94 × 10

-10) vias ( tabela S5). Esta descoberta indica que a maioria das proteínas da ponte estão envolvidos no CRC vias relacionadas com patogénese e têm o potencial para promover CRCs por estas vias. Assim, características determinadas a partir de padrões discriminatórios e testes de enriquecimento indicam que as proteínas ponte selecionados pelo bridgeness estão associados com CRC patogênese.

Potencial de proteínas ponte como marcadores prognósticos

Para avaliar a capacidade prognóstica de computationally- proteínas ponte selecionados, foram avaliados os seus padrões de expressão em pacientes classificados como tendo um bom ou mau prognóstico. Primeiro, temos agrupado pacientes de forma não supervisionada, com base em semelhanças de padrões de expressão, e os resultados de sobrevivência em comparação entre os pacientes em clusters. Total de 178 pacientes de conjunto de dados anterior [26] foram agrupados em três subgrupos usando um algoritmo de agrupamento hierárquico: BA-M1 (

N

= 106), BA-m2 (

N

= 28) e BA-m3 (

N

= 44) (Figura 4A). O método de Kaplan-Meier com o teste log-rank mostrou que entre os três subgrupos de pacientes, a sobrevida livre de recidiva foi significativamente diferente, indicando o seu potencial prognóstico substancial (

P

= 2,37 × 10

-3 ) (Figura 4B). Em seguida, avaliamos o potencial prognóstico de outros marcadores conhecidos expressão de assinatura da mesma forma. Usando padrões de genes selecionados em Wang expressão et al [27] e ColoPrint [28], classificamos os pacientes em três subgrupos e sobrevivência comparou os resultados entre os seus subgrupos (subgrupos de ColoPrint: col-M1 (

N

= 20) , col-m2 (

N

= 1) e col-m3 (

N

= 157); subgrupos de Wang: wang-M1 (

N

= 19), wang -m2 (

N

= 3) e Wang-m3 (

N

= 156)). Como resultado, os subgrupos de pacientes agrupados por genes de ColoPrint pode distinguir entre bons e maus prognósticos (

P

= 2.75 × 10

-8), embora apenas um único paciente encontrado no grupo de pior prognóstico (col -m2), mas genes de Wang não eram de prognóstico (

P

= 0,258) (Figura 4C e D). Além disso, conhecida marcadores moleculares, incluindo mutações do gene p53 (

P

= 0,233), o status do gene de reparo incompatível (

P

= 9,8 × 10

-2), as mutações KRAS (

P

= 5.75 × 10

-2), e mutações BRAF (

P

= 0,338), não eram também substancialmente prognóstico neste conjunto de dados (Figura 4E-H).

a sua capacidade de prognóstico foi examinado utilizando um conjunto de dados de amostras de tecido de pacientes com CRC [26]. (A) Heatmap de amostras tumorais de CRC com subgrupos classificados pelos padrões de expressão de proteínas ponte: BA-m1 (azul), BA-m2 (amarelo) e BA-m3 (vermelho). capacidade de prognóstico foi avaliada por análises de sobrevida de Kaplan-Meier. O grupo BA-m2 mostrou a pior prognóstico. (B) a capacidade prognóstica das nossas proteínas ponte. (C) a capacidade prognóstico do conjunto de genes ColoPrint [28], com subgrupos classificados como col-m1 (azul), col-m2 (amarelo) e col-m3 (vermelho). (D) capacidade prognóstico do Wang et al. conjunto de genes assinatura [27], com subgrupos classificados como wang-m1 (azul), wang-m2 (amarelo) e Wang-m3 (vermelho). (E) a capacidade prognóstico do estado de mutação p53, mutante e de tipo selvagem. (F) a capacidade prognóstico do estado de incompatibilidade gene de reparo (MMR), deficiente (dMMR) e proficiente (pMMR). (G) a capacidade prognóstico do estado de mutação KRAS mutante e de tipo selvagem. (H) capacidade prognóstico do estado de mutação BRAF, mutante e de tipo selvagem.

Para avaliar a reprodutibilidade prognóstico destas proteínas de pontes e outros marcadores de expressão de assinatura, nós, os pacientes, em seguida, classificados em um conjunto de dados independente [ ,,,0],22] como tendo bons ou maus prognósticos, através de um sistema de classificação supervisionada, usando conjunto de dados anterior [26], como o conjunto de dados de treinamento (Figura 5). Os pacientes nos dados de teste foram classificados, utilizando os seus níveis de expressão, com base em coeficientes de correlação para os níveis médios de pacientes pobre-prognóstico do grupo expressão nos dados de treino, como realizado anteriormente [29]; atribuímos pacientes em um grupo pobre-prognóstico se seus coeficientes de correlação foram elevados. Obtivemos limiares de coeficientes de correlação para decidir pacientes pobre-prognóstico com maior significância estatística, através de procedimentos de validação cruzada sobre os dados de treinamento (ver Materiais e Métodos). Notável, pacientes nos dados de teste pode ser significativamente distinção entre bons e maus prognósticos quando usamos níveis de expressão de proteínas ponte como recursos para os coeficientes de correlação; os resultados de sobrevivência, sobreviventes ou seja, específicos do CRC, de grupos classificados pelo proteínas ponte foram significativamente diferentes quando foi utilizado o método de Kaplan-Meier com o teste log-rank (P = 2,70 × 10

-2) (Figura 5A) . Outros assinaturas de expressão, incluindo ColoPrint (P = 0,210) e Wang (P = 0,558) (Figura 5B e C), não eram de prognóstico no conjunto de dados de teste independente, sugerindo que apenas proteínas ponte foram reproducibly prognóstico. Estes resultados sublinham o potencial e fiabilidade das proteínas ponte como marcadores prognósticos.

A sua capacidade de prognóstico foi examinado em um conjunto de dados de testes independentes [22] por classificações supervisionadas e, assim, confirmaram a sua reprodutibilidade prognóstico. (A) a capacidade de prognóstico nossas proteínas de ponte (B) capacidade prognóstico determinada pelo gene ColoPrint definido na referência [28] (C) capacidade prognóstico determinado por Wang et ai. gene definido em referência [27].

Discussão

Ao investigar genes envolvidos na regulação da homeostase BA, este estudo identificou numerosos genes para biomarcadores de prognóstico da CRC, com mostrar mecanicista relevância para CRC patogênese. Embora vários biomarcadores de prognóstico foram propostas com base em hipóteses biológicas [4], estes biomarcadores têm mostrado utilidade clínica limitada. A hipótese, que BAs têm um papel central no CRC, fornece pistas para a compreensão da patogênese da doença. No entanto, ao invés de focar BAs si mesmos, nós nos concentramos em genes envolvidos na regulação do metabolismo BA ligando sensores metabólicos e enzimas metabólicas. Com base em uma métrica, “bridgeness” concebido, numerosas proteínas ponte foram seleccionados a partir de uma referência, ou ponte, rede, e as suas capacidades de prognóstico foram analisadas. proteínas ponte podia distinguir entre tecidos normais e doentes e são, portanto, relevantes para a patogênese da CRC. Estas proteínas ponte teve maior ea capacidade de prognóstico reprodutível, como mostra a significância estatística, de marcadores prognósticos previamente identificados, sugerindo que eles são marcadores prognósticos confiáveis ​​em pacientes com CCR.

Curiosamente, no entanto, nem sensores nem de enzimas proteínas poderiam distinguem significativamente entre o tecido do cólon normal e CRC, uma descoberta que pode resultar de os papéis de limpeza destas proteínas de sensores e de enzimas para a sobrevivência da célula. As células carecem de proteínas com funções moleculares semelhantes às da maior parte destas proteínas e dos sensores enzimáticos; Assim, defeitos em sua expressão teria efeitos prejudiciais sobre as funções celulares. Assim, evolutivamente, anomalias genéticas em proteínas ponte pode ter vantagens de sobrevivência mais de anomalias em proteínas sensoras e de enzimas. De facto, algumas proteínas de ponte, incluindo a caspase 8, peptidase de cistea relacionadas com a apoptose (CASP8), p53 e catenina (proteína associada a caderina) beta 1, 88 kDa (CTNNB1, também conhecido como β-catenina), mostrou altas frequências mutacionais no CRC amostras, enquanto sensores e enzimas proteínas para o metabolismo BA não [30]. Esta pressão evolutiva, inclusive durante CRC tumorigênese, iria acelerar a aquisição de anomalias por proteínas ponte.

Em estudos anteriores, nomeadamente, uma proteína ponte, STK11, mostrou ter um potencial especial mecanicista para promover tumorigênese colorretal [31 ] – [33]. STK11 tem sido associada com a síndrome de Peutz-Jeghers (PJS), uma condição que aumenta a formação de pólipos adenomatosos gástricas e carcinoma hepatocelular [31]. Na maioria dos pacientes PJS, um alelo de STK11 está mutado, causando múltiplos pólipos adenomatosos gástricas ou carcinoma hepatocelular [32], [33]. Da mesma forma, STK11 pode ter o potencial para promover a tumorigénese mecanicista colorrectal. Outras proteínas de ponte pode também ter valor prognóstico em CRC patogénese.

STK11 também está relacionado com o metabolismo da energia, quer isoladamente ou interagindo com a AMPK, tornando-o um potencial proteína ponte envolvido na regulação do metabolismo da energia [34] , [35]. Entre as outras proteínas ponte envolvidas no metabolismo energético são PPARGC1A, GSK3B, PPARa, gama PPAR (PPARg), soluto família transportadora 2 (transportador de glucose facilitado) membro 4 (SLC2A4, também conhecido como GLUT4), gliceraldeído-3- fosfato desidrogenase (GAPDH), e desidrogenase de lactato a (LDHA), todos os reguladores importantes da ou das enzimas envolvidas no metabolismo de energia. Assim, suas funções moleculares podem explicar as atividades de BAs que aumentam o gasto de energia [36]. Avaliações das funções moleculares de proteínas ponte pode fornecer novas percepções sobre seus papéis ainda não identificados na homeostase BA.

Apesar de proteínas ponte mostrando potencial prognóstico, redes ponte BA mostrar capacidade limitada para identificar outros genes CRC-susceptibilidade conhecidos. Por exemplo, descobrimos que uma rede ponte BA não foi capaz de identificar vários genes CRC-susceptibilidade bem conhecidas, tais como APC, KRAS e BRAF. Imprecisões originários a partir de dados interactome grande escala poderia impedir uma análise em profundidade das redes de pontes. Além disso, as inter-relações das vias metabólicas, tais como lípidos, colesterol e o metabolismo da glucose, seria alargar a capacidade para investigar todos os factores de risco para CRC patogénese. Esta abordagem também pode ser aplicada a outras doenças vulneráveis ​​a anomalias metabólicas, incluindo a obesidade, diabetes tipo-2 e doença de Alzheimer, uma vez sensores metabólicas, enzimas e dados interactome adequados são gerados para estas doenças. A determinação de redes de pontes adequadas e precisas para vias metabólicas podem permitir a identificação de genes de doenças susceptibilidade e seu uso clínico como marcadores prognósticos.

Em resumo, descobrimos que as proteínas ponte, que estão envolvidos na regulação da metabolismo BA, têm potencial de prognóstico em pacientes com CCR. Apesar de seu potencial para promover CRC patogênese, proteínas ponte não tinha sido sistematicamente investigado em estudos anteriores. Com base em uma métrica concebido para “bridgeness”, nós computacionalmente selecionado proteínas ponte a partir de uma rede de referência e examinou seu potencial prognóstico no CRC. Nós também testamos se as diferenças em seus padrões de expressão discriminativos em cólon normal e CRC fez-los relevantes para CRC patogênese. Os resultados indicam que as proteínas ponte envolvidos na regulação do metabolismo da BA podem ser marcadores prognósticos confiáveis ​​para pacientes com CCR.

Materiais e Métodos

rede Construção de ponte

A rede de referência para metabolismo BA consistiu de sensores metabólicas, enzimas metabólicas e proteínas que interagem com ambos. O sensor de BA foi seleccionado FXR e as enzimas BA foram aqueles designados na base de dados de rede metabólico humano EHMN como enzimas envolvidas no “ácido biliar biossíntese” via de [19].

Deixe uma resposta