PLOS ONE: Conjunto de Gene Assinaturas Identifica novos biomarcadores em câncer colorretal ativado através de PPARy e TNFa Sinalização

Abstract

Nós descrevemos um romance bioinformática e abordagem patologia translacional, Assinatura gene do Finder Algorithm (GSFA) para identificar biomarcadores associados com câncer de sobrevivência colorretal (CRC). Aqui um conjunto robusto de marcadores CRC é selecionada por um método ensemble. Usando um conjunto de dados de 232 perfis de expressão gênica, GSFA descobre 16 assinaturas altamente significativos de genes pequenos. Análise das dicotomias geradas pelas assinaturas resulta em um conjunto de 133 amostras classificadas de forma estável em grupo bom prognóstico e 56 amostras do grupo de prognóstico pobre, enquanto 43 permanecem unreliably classificado.

AKAP12

,

DCBLD2

,

NT5E

e

SPON1

são particularmente representadas nas assinaturas e selecionados para validação

in vivo

em duas coortes de pacientes independentes, compreendendo 140 tecidos tumorais e 60 tecidos normais correspondido. Sua expressão e programas reguladores são investigados

in vitro

. Nós mostramos que a expressão combinada de

NT5E

e

DCBLD2

estratifica robustamente nossos pacientes em dois grupos (um dos quais com a sobrevivência de 100% em cinco anos). Mostramos que

NT5E

é um alvo do TNF-α sinalização

in vitro

; o supressor de tumor PPAR atua como um romance

NT5E

antagonista que positivamente e concomitantemente regula

DCBLD2

de uma forma dependente do contexto da célula cancerosa

Citation:. Pagnotta SM, Laudanna C , pancione H, L Sabatino, Votino C, Remo A, et al. (2013) Ensemble de Gene Assinaturas Identifica novos biomarcadores em câncer colorretal ativado através de PPARy e TNFa Sinalização. PLoS ONE 8 (8): e72638. doi: 10.1371 /journal.pone.0072638

editor: Anthony Federação das Índias Ocidentais Lo, da Universidade Chinesa de Hong Kong, Hong Kong

Recebido: 18 de abril de 2013; Aceito: 11 de julho de 2013; Publicação: 19 de agosto de 2013

Direitos de autor: © 2013 Pagnotta et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este trabalho foi apoiado por Ministero dell’Università e della Ricerca sob concessão (PRIN2008-20085CH22F) e pela Associazione Italiana per la lotta ai linfomi e leucemie. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

Cancro colorectal (CRC) é uma das neoplasias mais comuns em todo o mundo e uma causa comum de morbidade e mortalidade. sobrevivência CRC está intimamente relacionado com o estágio clínico e patológico da doença no momento do diagnóstico; mais de um terço dos pacientes com CCR morrem dentro de cinco anos a partir do diagnóstico inicial e mais de desfechos fatais resultam de metástases hepáticas [1].

Apesar da recente introdução de agentes terapêuticos mais eficazes, existem apenas alguns biomarcadores prognósticos validados para avaliar a agressividade da doença e a probabilidade de recorrência ou morte após a cirurgia. Estudos recentes propõem pequenas assinaturas genéticas como imagem de marca do estágio do tumor [1,2]. Até à data estudos integrativos descoberto amplificações de

ERBB2

e

IGF2 Comprar e genes significativamente mutantes no CRC, tais como

APC, TP53, SMAD4, PIK3CA

e

KRAS

como potenciais alvos terapêuticos [3]. Assim, a identificação de marcadores preditivos e prognósticos precisos combinadas com a crescente arsenal de agentes terapêuticos irá fornecer tratamentos mais eficazes relacionados ao perfil minimizar toxicidades potencialmente fatais moleculares do paciente [4].

Nós desenvolvemos uma abordagem computacional romance , gene assinatura do Finder Algorithm (GSFA) para gerar vários conjuntos de genes pequenos que estratificar os pacientes em termos de sobrevivência. A nossa estratégia faz uso da disponibilidade de grandes conjuntos de dados de expressão de genes para seleccionar candidatos que podem ser então validados em bibliotecas independentes de tecidos. Nós abordado o problema da extração de características adequadas de expressão gênica global que melhor se correlacionam com a informação clínica para criar assinaturas de prognóstico. A maioria dos procedimentos actuais baseiam-se no conhecimento especializado para seleccionar, entre os milhares de genes, marcadores moleculares que podem ser associados com o prognóstico [5]. Recentemente, novos métodos, fundamentadas na mineração de dados, aprendizagem de máquina [6] e [7] para a “aprendizagem Assinatura ” têm sido propostos regressão estatística. Este é um tema interessante em Biologia Computacional e pode ser modelado como um problema de seleção ótima recurso [8]. Aqui, adotamos como critério de otimização a importância do teste de log-rank entre as curvas de sobrevivência dos grupos induzidos pelos recursos selecionados e usou um novo procedimento que integra várias assinaturas geradas por um algoritmo guloso básica. genes assinatura são então classificadas com base em algumas métricas de pontuação que medem a contribuição do gene para as assinaturas pertence.

A partir de um conjunto de dados pública de duzentos e trinta e dois perfis de expressão gênica CRC, nosso algoritmo selecionado, entre outros, os biomarcadores relacionados à sobrevivência, tais como

AKAP12, DCBLD2, NT5E

e novos marcadores CRC-específicas, tais como

SPON1

. Nós selecionados os genes candidatos em dois grupos independentes de 140 pacientes com CCR esporádico principal usando imuno-histoquímica em Tissue microarrays (TMAs). As variações na expressão gênica foram posteriormente testado em um

in vitro sistema de célula

que confirmou os

In vivo

dados. Coletivamente, nossos dados fornecem um novo método para identificar novas e biomarcadores robustos como um passo importante para uma estratificação melhor prognóstico e tratamento de pacientes.

Material e Métodos

Microarray conjuntos de dados

Nós aplicamos

GSFA

(descrita abaixo) para conjuntos de dados públicos para identificar um conjunto de biomarcadores. Os dados tomados em consideração são os das coleções relatados em [9] e disponível como GSE17536 e GSE17537 conjunto de dados no Expression Gene Omnibus (GEO) (www.ncbi.nlm.nih.gov/geo). Ambos os conjuntos de dados são gene perfil de expressão obtido usando o Affymetrix GeneChip Human Genome U133 mais 2,0 Matriz. GSE17536 conta 177 amostras em 54613 Gene-sondas, enquanto GSE17537 tem 55 amostras nas mesmas sondas. Os 232 arquivos celulares brutos foram baixados de ambas as coleções, em seguida, correção de fundo, normalização quantil e sumarização foram aplicadas.

amostras de tumores

Foram analisadas amostras de CRC de coortes ‘dois pacientes independentes que compreendem uma série de testes e uma série de validação (I e II), respectivamente. Coorte I compreende noventa e oito casos CRC e 60 emparelhado mucosa aparentemente normal removido durante a mesma cirurgia. Este conjunto de dados inclui ambas as amostras congeladas de azoto líquido e embebidas em parafina, como relatado [10,11]. Coorte II consiste em 42 casos de CRC esporádica coletados no Departamento de Patologia e Oncologia, Legnago Hospital Verona, Itália, durante o período 2005-2007. Os tumores foram classificados e classificados de acordo com os critérios dos TNM e tumorais fases sistemas de classificação I-IV; a média de idade dos pacientes foi de 71,2 ± 18,21. Nenhum dos pacientes tinha um histórico familiar de disfunção intestinal ou CRC, tinham recebido quimioterapia ou radioterapia antes da ressecção nem tinha tomado não-esteróides anti-inflamatórios em uma base regular. tratamentos pós-operatórios convencionais foram fornecidos para todos os pacientes, dependendo da gravidade da doença. comprimento total de sobrevivência foi calculada a partir da primeira cirurgia. Os pacientes foram acompanhados por uma média de 55 meses ou até a morte.

A análise imunohistoquímica e avaliação de coloração

Para a análise imuno-histoquímica, cortes de tecido foram desparafinados, hidratadas em álcool graduado e microondas tratado para 20 min a recuperação de epítopo induzida por calor de 750 W. foi realizada por aquecimento das lâminas TMA imersas em tampão citrato de recuperação (pH 6,0). As secções foram incubadas com peróxido de hidrogénio a 3% durante 20 minutos à temperatura ambiente e, subsequentemente, com os anticorpos específicos: AKAP12 (diluição 1: 500; WH0009590M1, monoclonal de ratinho, da Sigma-Aldrich, St. Louis, MO), Spondin1 (diluição 1: 250; AB40797; policlonal de coelho, Abcam, Cambridge, Reino Unido)); NT5E (diluição 1:50; AB115289; policlonal de coelho, Abcam, Cambridge, Reino Unido); e DCBLD2 (diluição 1: 100; AB115451; policlonal de coelho, Abcam, Cambridge, Reino Unido) Todos os anticorpos foram incubados durante a noite a 4 ° C. Os anticorpos secundário, seguidos pelo sistema de estreptavidina de rábano foram incubadas durante 30 minutos, cada um, utilizando o kit de coloração de peroxidase de estreptavidina-biotina (LSAB + System-HRP, Dako Cytomation, Glostrup, Dinamarca). A imunorreactividade foi revelada através de incubação em 3,3-substrato diaminobenzidina (DAB) durante 5 minutos. Posteriormente, as secções foram contrastadas com hematoxilina, de-hidratado, e colocou-cover. Os anticorpos primários foram omitidos nos controlos negativos.

Uma abordagem semi-quantitativa foi usada para avaliar a imunorreactividade, tendo em conta o número de células positivas e distribuição de coloração da coloração no compartimento subcelular (citosólica e /ou membrana). Para cada amostra, toda a peça de micro tecido foi examinada através de microscopia de luz com ampliação de 20x. A percentagem de células cancerosas, identificada por imuno-reactividade para cada marcador, foi estimado para todas as amostras do TMA. áreas representativas (5 campo de elevada resolução) que contêm a maior proporção de células cancerosas foram utilizados para contar as células tumorais por seção. A fracção (percentagem de células de tumor imuno-reactivos, em amostras em triplicado) expressa como o número de células positivas para Campos (PCFs), foi então calculada.

Ética Declaração

Este estudo foi realizado de acordo com os princípios da Declaração de Helsinki e aprovado pelo Institutional Review Board do Hospital “Fatebenefratelli” em Benevento e Hospital Legnago, Verona, Itália. Todos os pacientes fornecidos consentimento informado por escrito para a recolha de amostras e análise posterior

Análise estatística:. Assinatura gene do Finder Algorithm (GSFA)

O nosso processo de selecção gene emprega um método de embalagem eficiente [8] com base em agrupamento não supervisionado, com um esquema de perturbação gerando vários genes-conjuntos com diferentes condições iniciais para começar a seleção de genes. As condições iniciais correspondem a semente genes que apresentam algumas propriedades tais como ser uma boa hipótese inicial. O algoritmo resultante é definido

geneSignatureFinder

(GSFA) implementado em um pacote-R e disponível em CRAN (https://cran.r-project.org/web/packages/geneSignatureFinder/index.html) em um open source para download. GSFA, que é uma generalização do mais íngreme descida modificado proposto por Boutros et al. [6], consiste em quatro etapas principais (Figura 1):

O

Assinatura gene do Finder Algoritmo

consiste em 4 etapas distintas: (1) encontrar genes de sementes candidato; (2) gerar uma assinatura a partir de cada gene de sementes; (3) podar as assinaturas por inferência estatística; (4) integrar assinaturas pelo ranking do gene

Passo 1:.

Sementes do Finder

O primeiro passo do nosso algoritmo tem como objetivo selecionar um conjunto de genes que podem ser um semente de partida confiável para expandir a assinatura. Utilizou-se um conjunto de genes de acordo com duas condições principais: (a) uma distribuição bimodal dos níveis de expressão, (b) capacidade de separar o conjunto de dados em dois grupos com base do teste de análise de sobrevivência. Em particular, para cada gene

i

considera a seqüência g

i

= {

x

ij

,

i

= 1 …,

M

}, onde

x

ij

é o nível de expressão gênica

i

na sample

j

. O Critério de Bayesian Informação (BIC) [12] é então usado para verificar a hipótese de bimodal para a seqüência g

i

. A sequência g

i

está agrupado em dois subconjuntos S

1 e S

2 usando um

k

algoritmo -median (

k

= 2) e a distância entre as curvas de sobrevivência das amostras em S

1 e S

2 é, então, calculado. genes de sementes são aqueles manifestando bimodal e separação entre as curvas sob um limite de significância escolhido (em todas as nossas experiências 0,05)

Passo 2:.

propagação Assinatura

Dado um conjunto de

K

genes de sementes selecionadas como na etapa anterior, nós expandimos aa pequena gene assinatura a partir de cada gene de sementes. Uma estratégia ávido é adoptada, ao seleccionar como gene seguinte assinatura do gene maximizar o aumento da distância entre as curvas de sobrevivência dos dois conjuntos S

1 e S

2 obtida agrupando o conjunto de dados de duas dimensões (contendo do gene da semente e da próxima gene assinatura candidato). O algoritmo continue adicionando genes para cada assinatura desta forma até que nenhuma melhoria da distância entre as curvas de sobrevida é obtido

Passo 3:.

Análise de Assinatura e poda

Um

índice de importância

é calculado para cada gene de

K

assinaturas, é uma medida da quantidade de um único gene contribui para melhorar a distância entre as curvas de sobrevivência em relação à distância com base em todos os genes uma assinatura. É definido como 1 menos a razão entre as distâncias das curvas de sobrevivência obtidos quando o gene seleccionado é removido a partir da assinatura (detalhes no procedimento GSFA suplementar ficheiro de acompanhamento). Em seguida, cada assinatura é podada pelos genes que não contribuem de forma significativa para a separação da dicotomia gerado pela assinatura

Passo 4:.

Gene Ranking

A partir do conjunto de genes em

K

assinaturas, podemos obter várias pontuações para selecionar genes candidatos que estão potencialmente associadas com os grupos prognósticos. Nós marcar os genes com base no número de assinaturas em que eles ocorrem e seu índice de média importância

Os materiais que o acompanham Métodos S1 (procedimento GSFA Suplementar) contém todos os detalhes do algoritmo e os comandos para replicar a análise inteiro com R utilizando o pacote GSFA.

Resultados

Assinatura gene do Finder Algorithm (GSFA) revela muitas assinaturas associados com adesão celular e organização da matriz extracelular

Aplicamos o GSFA a um conjunto de dados de duzentos e trinta e duas amostras de CRC e identificou 16-semente genes que mostram um aumento significativo (

p

0,05, após a correção) separação univariada das curvas de sobrevida entre bons e maus grupos de prognóstico, e são bi-modal, ao mesmo tempo (cerca de 1/3 das sondas mostrar bimodal). A partir de cada uma das sementes-genes foram obtidas as assinaturas que estão listados na Tabela 1; as correspondentes curvas de sobrevivência são ilustrados na Figura S1. Na maioria dos casos, o

p

-valor não é computável dado que o

t

-valor está além da precisão da máquina. Embora os subconjuntos de genes selecionados podem ser diferentes, as curvas de sobrevivência, muitas vezes parecem semelhantes (Figura S1), por isso pedimos a diferença entre a separação induzida por cada assinatura. Calculamos a distância entre o agrupamento obtido por cada uma das 16 assinaturas e obter o dendrograma relatado na Figura 2a: observa-se que a assinatura gene diferente pode, eventualmente, gerar dicotomias semelhantes. Este dendrograma permite obter uma classificação robusta das amostras em dois grupos de acordo com o número de vezes que uma determinada amostra cai em um dos grupos. Em particular, o

bom grupo prognóstico estável

compreende amostras que, em pelo menos 80% das dicotomias se enquadram no grupo bom prognóstico, analogamente para o

estável pobres grupo prognóstico

. Assim, 133 e 56 amostras foram classificadas na boa ou má grupo prognóstico estável, respectivamente, enquanto que a 43 permaneceu unreliably classificadas e definidas amostras incertos. As curvas de sobrevivência correspondentes são apresentados na Figura 2b, teste log-rank entre as três curvas dá um

p

-valor 10

-16. 1609 genes diferencialmente expressos (dobra mudar 1.5 e corrigidos

p

-valor 0,05) entre os dois grupos prognósticos estáveis ​​gerou o heatmap cluster da Figura 2c. As amostras foram divididas em dois grupos principais: o primeiro composto 113 de 133 (85%) do classificadas de forma estável como bom grupo prognóstico; a segunda 55 fora de 56 (98%) do grupo de prognóstico pobre. As curvas de sobrevivência correspondentes são apresentados na Figura 2d, o teste de log-rank entre as duas curvas dá

p

= 6,6 · 10

-6. A silhueta da separação de cluster também é relatado no procedimento GSFA Suplementar arquivo anexo. Gene

Semente

t

-valor

log (

p

-valor)

Assinatura

PCSK5 (205560_at) 76,572 -16PCSK5, AKAP12, NPR3, AGPAT5, GMFB, C6orf141, 1569202_x_at, KCNH8FST (226847_at) 75,757 -16FST, AKAP12, ULBP2, SLC25A43, EI24, 1563467_at, CLDN8POSTN ( 214981_at) 74,023 -16POSTN, AKAP12, AGPAT5, ATL3, SLC44A2SUSD5 (214954_at) 71,842 -16AKAP12, 241867_at, ADAMTS5, APLP2, PITPNC1, 1556983_a_atKIAA1462 (231841_s_at) 67.624-15.654KIAA1462, DCBLD2, ADIPOQ, FAM217B, C17orf48DCBLD2 (230175_s_at ) 66.71-15.477DCBLD2, AKAP12, GUSBP11, CDR2L, MGC16703, METTL4NPR3 (219054_at) 66.457-15.477NPR3, DZIP1, 243820_at, 238109_at, 236795_at, DNAJC4, FOXA1, EMID2AKAP12 (227530_at) 65.522-15.256AKAP12, ISM1, C11orf9, 244026_at, ARHGAP9, NOL3, AP2A1PAPPA (201981_at) 65.024-15.109PAPPA, NT5E, DUSP7, 230711_at, CD96, ABI2ETV1 (221911_at) 61.631-14.386ETV1, LONRF3, NGEF, RAB2A, U2AF2, CPOKIAA1462 (213316_at) 60.733-14.184KIAA1462, AKAP12, UGGT2 , 231989_s_atSRGAP2P1 (1568955_at) 58.417-13.674SRGAP2P1, AKAP12, SNX16, NT5ELOC100132891 (228438_at) 58.037-13.589LOC100132891, DCBLD2, ADIPOQ, SLFN5DCBLD2 (224911_s_at) 50.106-11.837DCBLD2, ADCY7, EHD2CTGF (209101_at) 46.099-10.949CTGF, FERMT1, AKAP12 , CDK1EFHA2 (238458_at) 42.166-10.076EFHA2, ST18, ACACBTable 1. Assinaturas desenvolvidos a partir de 16-semente genes.

CSV Baixar CSV

a. Dendrograma das dicotomias gerados por cada uma das 16 assinaturas GSFA (Tabela 1 e Figura S1); b. Survival trama das 133 amostras classificadas de forma estável no grupo de bom prognóstico, 56 amostras do grupo de mau prognóstico e 43 amostras incertos (teste log-rank dá

p Art 10

– 16); c. heatmap de degs entre os dois grupos estáveis, vermelho indica genes sobre-expressos (níveis de expressão através da mediana) e verde indica genes underexpressed (níveis de expressão sob a mediana); d. amostras de curvas de sobrevivência nos dois cachos da heatmap como no c. (

p

= 6,6 · 10

-6).

Para elucidar os processos biológicos e funções associadas com os estes dois grupos, foram identificados 1394 sondas diferencialmente expressos correspondentes a 1024 genes diferentes (degs), 87% dos quais estão contidos na lista de degs entre os grupos prognósticos estáveis. A lista degs enriquecido várias categorias Gene Ontology (GO). O nosso procedimento GSFA seleccionado, tal como relacionado com o grupo de prognóstico pobre, um conjunto de amostras com características associadas com mesenquimais por genes envolvidos na proliferação e adesão celular. Em particular, GO análise dos genes regulados positivamente no grupo pobre mostrou que

A adesão celular

foi enriquecida com 123 degs (

p Art 10

-28),

extracelular Organização Matrix

com 34 genes (

p Art 10

-15),

resposta a ferimentos

com 95 degs (

p Art 10

-22),

Imune

resposta com 91 genes (

p Art 10

-14). Além disso, estes degs enriqueceu os Caminhos KEGG

interacção-receptor ECM

(

p Art 10

-10) e

Focal aderência

(

p

10

-8). Quando carregado na Análise Caminho Ingenuity, nossa lista de degs produziu um conjunto de categorias de enriquecimento cuja

p

-valor é relatado na Figura S2a. Em particular, outras categorias relacionadas com o desenvolvimento do tecido e câncer foram significativamente enriquecida; especificamente aqueles relacionados ao câncer colorretal foram enriquecidos em

p Art 10

-14.

A fim de compreender os principais reguladores envolvidos na separação entre os dois grupos de prognóstico, foi realizada uma análise de enriquecimento de reguladores a montante. Curiosamente, o crescimento fator transformador beta 1 (TGF-p1) foi regulada no cluster de mau prognóstico [13]. Além disso, a rede dos reguladores 20 representadas na Figura S2B poderia explicar o comportamento de 177 dos genes seleccionados. Os reguladores de topo da rede também compreendida outros factores de crescimento solúveis, tais como membros do factor de crescimento de fibroblastos (FGF) e factor de famílias necrose tumoral (TNF). Os genes selecionados estão envolvidos principalmente na sinalização TGF-p1, como 109 moléculas (

p Art 10

-51) são os seus alvos anotados na base de conhecimento IPA. Sinalização mediada pelo receptor em resposta a estes ligandos desencadeia a activação de moléculas efectoras intracelulares, tais como, as pequenas RAS GTPase da família, os membros da família dos factores de transcrição ou de tirosina-quinase, incluindo SRC, SMAD, RUNX2, STAT3, NFkB, p53 e β- catenina. Estes efectores têm um papel central na progressão da CRC e invasão metastática promovendo a formação de um microambiente associado a um tumor.

TMA validação dos biomarcadores identificados pelas assinaturas do conjunto

Para identificar biomarcadores associados com robustos CRC prognóstico que possam ser validadas em nossas duas bibliotecas de tecidos, foi utilizado o ranking relatado na terceira etapa do GSFA e os genes resultantes são apresentados na Tabela S1, onde

AKAP12, DCBLD2, NT5E

foram os mais comuns genes seleccionados pelo algoritmo nas várias assinaturas. Nós também validada SPON1 como, inesperadamente, que estava entre os genes mais diferencialmente expressos entre os dois grupos; no entanto, o seu papel na CRC ainda não foi abordado. Nós rastreados por imuno-histoquímica (IHQ) TMA da nossa série de 140 CRCs e um subconjunto de 60 amostras do cólon combinados normais para determinar o potencial prognóstico dos genes selecionados. padrão de expressão dos marcadores foi registada como percentagem de células positivas: uma coloração positiva acima de 25% de células tumorais foi definido expressão elevada. Figura 3a relata lâminas de tecidos representativos da TMA marcadas com anticorpos contra AKAP12, DCBLD2, NTE5 e SPON1. Figura 3b relata as percentagens globais de detecção entre o tumor e amostras normais. Na Figura S3 ainda mais a coloração de DCBLD2 e NT5E em uma resolução maior é ilustrada.

a. “As colunas da esquerda para a direita” indicam padrão de marcação imunohistoquímica em amostras de cólon normal e núcleos de CRC positivos e negativos para cada AKAP12 marcador, DCBLD2, NT5E, SPON1. Setas pretas indicam padrão de coloração imuno-histoquímica em células do cólon normais ou malignas. As setas brancas indicam a distribuição imunocoloração no compartimento estromal (endoteliais, células-T e macrófagos reguladoras) característico do padrão de expressão NT5E. Ampliação de 10X; b. Número de casos positivos detectados na série de validação TMA compreendendo amostras tumorais (TUM) e um subgrupo de mucosa do cólon normal, combinado (NM). As barras de erro indicam o desvio padrão da média (

P

0,05); c. Quatro espécimes congelados representativos CRC (T) e de mucosa normal combinado (N) foram identificados no mesmo grupo de pacientes e analisados ​​por imunotransf erência. Marcadores de peso molecular são indicados em kilodaltons. β-tubulina foi utilizada como controlo de carga para normalizar as intensidades de banda.

Na mucosa de cólon normal, AKAP12 imunocoloração era sempre positiva, localizada no citosol e distribuídas principalmente na cripta compartimento apical, isto é, em mais diferenciada células. Em amostras de CRC, AKAP12 imunorreactividade foi mantida em 55% e ausente em cerca de 45% dos casos.

DCBLD2 era sempre positiva em células de cólon normal e uniformemente localizada nas membranas do plasma baso-lateral. Em amostras de CRC, a imunocoloração foi detectada em aproximadamente 52% dos casos. Em algumas secções de tumor, DCBLD2 imunopositividade também foi localizado no compartimento citosólico.

NT5E imunopositividade foi encontrada principalmente nas células do estroma (células T reguladoras) ou endoteliais da mucosa de cólon normal, ao mesmo tempo que era fracamente positivo ou negativo em células do cólon epiteliais. Em conformidade com esta constatação, NT5E imunopositividade marcou o estroma associado a um tumor e estava ausente em células malignas em cerca de 40% de amostras de tumores. Curiosamente, em que os restantes 60%, NT5E coloração marcada também células epiteliais malignas, em adição aos do estroma.

SPON1 imunorreactividade foi positiva em apenas cerca de 20% das amostras de cólon normal. Notavelmente, SPON1 foi detectada em aproximadamente 70% das amostras de CRC, com uma membrana ou localização citossólica. Positividade nos tumores foi significativamente correlacionada com colágeno IV e expressão vimentina, sugerindo um papel da SPON1 na reorganização e remodelação de tumor matriz extracelular (ECM) (dados não mostrados).

Western Blot Analysis Em primária CRC

para corroborar o perfil de expressão IHC e de ter dados mais quantitativos, vinte amostras de CRC selecionados aleatoriamente e mucosas normais pareados do mesmo grupo de pacientes foram analisadas por western blot, utilizando os mesmos anticorpos utilizados no IHC. Esta análise também verificada a especificidade dos anticorpos. As bandas obtidas foram quantificadas por densitometria após a normalização para a p-tubulina de carga de proteína. AKAP12 e DCBLD2 eram frequentemente detectados em níveis inferiores em tumor (T) do que tecidos normais pareados (N). Em contraste, NT5E e expressão SPON1 mostraram níveis significativamente mais elevados em tumores do que os controlos. Figura 3c relata as bandas correspondentes a quatro amostras representativas, a quantização da qual é relatada na Figura S4a. Embora os dados se referia apenas a 20 casos, eles confirmaram a especificidade dos resultados e reforçou as diferenças entre as amostras normais e tumorais detectadas por IHC no TMA.

Biomarkers perfis de expressão e parâmetros clínico-patológicas

Foi realizado um teste de comparação múltipla avaliar a frequência de expressão IHC de cada biomarcador e os parâmetros clínico-patológicos. Nós não encontramos nenhuma associação entre AKAP12 ou gene SPON1 perfil de expressão ea idade do paciente, sexo, estágio do tumor, diferenciação ou histologia, presença de metástases ganglionares e do fígado. Em contraste, a perda de DCBLD2 foi correlacionada com os estágios avançados da doença (

p

= 0,021). Na verdade, 37,4% das amostras testadas baixo para a expressão DCBLD2 foi mais frequentemente estágio IV-tumores, em comparação com 15% dos DCBLD2 mais alta que expressam. Assim, mesmo os casos associados com metástases distantes tinham níveis significativamente mais baixos de expressão DCBLD2 do que aqueles sem metástases hepáticas (

p

= 5,71 · 10

-5). Notavelmente, também tumores que expressam elevados níveis de NT5E mostrou uma susceptibilidade semelhante a tumores metastáticos (

p

= 6,62 · 10

-4). A associação entre biomarcadores e os parâmetros clínico-patológicos em nosso conjunto de dados CRC é ilustrada na Tabela S2.

Para explorar qual dos genes selecionados também foi um preditor independente de sobrevida do paciente em nossa série de validação CRC, classificamos tumores como baixa ou alta expressando cada um dos biomarcadores sob investigação. análise de sobrevivência de Kaplan-Meier revelou que a perda de AKAP12 foi marginalmente associada à pior sobrevida global (OS) (

p

= 0,0758, Figura 4a). Notavelmente, baixa expressão associada à membrana de DCBLD2 e superexpressão de NT5E em células tumorais foi fortemente associado com menor sobrevida (

p

= 5,97 · 10

-7and

p

= 1,01 · 10

-5, respectivamente, Figura 4c e 4d). Nenhuma associação significativa com o OS foi encontrado tendo em conta apenas o imunopositividade NT5E no tumor-associados estroma (Figura S5). SPON1 sobre-expressão não se correlacionou com o prognóstico dos pacientes (dados não mostrados).

a. As curvas de sobrevida em nossa série de validação CRC, classificados como tendo elevada (curva vermelha) e baixa (curva verde) expressão AKAP12, DCBLD2 e NT5E.

p

-valor para a hipótese nula de curvas de sobrevivência igual população é fornecido pelo teste de log-rank em cada gráfico; b. As curvas de sobrevivência estimadas combinando a expressão (

alta

e

baixo

) de todos os 3 marcadores (AKAP12, DLBLC2, NTE5). curva vermelha representa a combinação

alta /alta

; a curva azul representa a combinação

alto /baixo

; a curva de preto representa a combinação

baixa /alta

; a curva verde representa a combinação

baixa /baixa

.

Finalmente, avaliamos se todos os três marcadores preditivos (AKAP12, DCBLD2, NT5E) poderia exercer efeitos recíprocos e melhorar a precisão do prognóstico. Os casos foram classificados em 4 grupos de acordo com seus níveis de expressão (Figura 4d, 4e, 4f). Notavelmente, 100% dos pacientes, mostrando a combinação DCBLD2

alta /NT5E

baixo estavam vivos em 5 anos após o diagnóstico. Em contraste apenas 30% dos pacientes cujos tumores expressam a combinação DCBLD2

baixo /NT5E

alta estavam vivos. Esta diferença de sobrevivência era independente da quimioterapia adjuvante ou estágio da doença.

A expressão de biomarcadores selecionados em linhas celulares de CRC

Para obter mais insights sobre os genes candidatos, avaliamos o perfil de expressão de proteínas em seis linhas representativas CRC humanos derivados de células (Figura S3B). AKAP12 proteína foi detectada apenas em células HCT116 e DLD1 de acordo com estudos anteriores [14]. DCBLD2 foi expresso em níveis muito baixos na maior parte das linhas de células, enquanto NT5E foi altamente expressa em HT29 e HCT116, em comparação com as outras linhas celulares. Finalmente SPON1 foi detectado na maioria das linhas celulares, com os níveis mais altos em DLD1.

Cross-talk entre TNF-α e sinalização PPAR regula NT5E e DCBLD2

O

em in vivo

resultados sugeriram que NT5E DCBLD2 e estão envolvidas na invasão tumoral e metástase provavelmente através de um mecanismo imunossupressor induzida por tumor. Assim, a nossa atenção focada no TNF-α, uma citocina que regula uma rede de sinalização implicada em doenças inflamatórias e tumorigénese [15]. Ingenuity Pathway Analysis foi consultado para destacar os efeitos do TNF-α e citocinas que interagem. NFkB emergiu como o eixo principal da rede de reguladores a montante do DEGS seleccionados e, por sua vez, como um modulador importante de genes implicados na resposta imune e inflamatória (Figura S6A) [16]. Com base nestas observações, que procurou actuam em cis elementos de DNA regulatório no

NT5E

e

DCBLD2

promotores (Figura S6B) e identificaram vários NFkB putativo elementos do site-like. Para verificar se

NT5E

e, possivelmente,

DCBLD2

, poderia ser regulada pela cascata inflamatória, que trataram células 293T HEK com LPS, um poderoso indutor pró-inflamatória NFkB, e obteve um tempo significativo indução dependente de

NT5E

; Do mesmo modo, a expressão ectópica da subunidade p65 /RelA de NFkB causou uma indução significativa ainda reforçada pelo tratamento com LPS. Em contraste, a transfecção de super supressor IκBα S32 /36 aboliu completamente o efeito estimulador LPS em

NT5E

(Figuras S6c e S6d). b. de três experiências independentes. b. uma. b. c.

Deixe uma resposta