PLOS ONE: Descoberta de um 29-Gene Painel em células mononucleares do sangue periférico para a detecção de câncer colorretal e adenomas Usando High Throughput Real-Time PCR

Abstract

O câncer colorretal (CCR) é a segunda principal causa de cancro relacionados com a morte nos países desenvolvidos. A detecção precoce do CRC leva à diminuição da mortalidade CRC. Um teste de rastreio CRC-base do sangue é altamente desejável, devido à invasão limitada e alta taxa de aceitação entre os pacientes em comparação com o teste de sangue usado atualmente oculto nas fezes e colonoscopia. Aqui, descrevemos a descoberta e validação de um painel de 29 genes em células mononucleares do sangue periférico (PBMC) para a detecção de CRC e pólipos adenomatosos (AP). Amostras de sangue foram coletados prospectivamente a partir de um, caso-controle estudo clínico multicêntrico. Primeiro, nós perfilado 93 amostras com genes 667 candidatos e 3 de referência de alto rendimento PCR em tempo real (sistema OpenArray). Após a análise, 160 genes foram retidos e testado novamente em 51 amostras adicionais. genes expressos e instáveis ​​baixas foram descartados, resultando em um conjunto de dados final das 144 amostras perfilado com 140 genes. Para definir quais os genes, isolados ou em combinações teve o maior potencial para discriminar AP e /ou CRC de controlos, os dados foram analisados ​​por uma combinação de métodos univariada e multivariada. Uma lista de 29 genes potencialmente discriminantes foi compilado e avaliado quanto à sua precisão da previsão por regressão logística penalizada e de inicialização. Este método discriminados AP 1 centímetro e de CRC dos controlos com uma sensibilidade de 59% e 75%, respectivamente, com 91% de especificidade. O comportamento do painel de 29-gene foi validado com um 480 em tempo real plataforma LightCycler PCR, comumente adotada por laboratórios clínicos. Neste trabalho foram identificados um painel de 29 genes expressos em PBMC que pode ser utilizado para o desenvolvimento de um novo teste minimamente invasivo para a detecção precisa de AP e CRC utilizando uma plataforma padrão PCR em tempo real

citação:. Ciarloni G, Hosseinian S, S-Benoit Monnier, Imaizumi N, Dorta G, Ruegg C, et ai. (2015) descoberta de um-29 Gene Painel em células mononucleares do sangue periférico para a detecção de câncer colorretal e adenomas Usando High Throughput Real-Time PCR. PLoS ONE 10 (4): e0123904. doi: 10.1371 /journal.pone.0123904

Editor do Academic: Antonio Moschetta, IRCCS Instituto Oncológico Giovanni Paolo II, ITALY

Recebido: 08 de dezembro de 2014; Aceito: 27 de fevereiro de 2015; Publicação: 13 de abril de 2015

Direitos de autor: © 2015 Ciarloni et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Disponibilidade de dados: Todos os dados relevantes estão dentro do papel e seus arquivos de suporte de informação

Financiamento:. Este estudo foi apoiado por Diagnoplex SA. O financiador forneceu apoio sob a forma de salários para os autores LC, NI, SMB, SH, mas não tinha nenhum papel adicional na recolha de dados e análise, decisão de publicar ou preparação do manuscrito. Os papéis específicos destes autores são articuladas na seção autor contribuições ‘

Conflito de interesses:. LC SH SMB NI eram empregados da Diagnoplex SA no momento do estudo. Além disso, eles possuem opções de ações em Diagnoplex SA. CR é um co-fundador, membro do conselho consultivo e possui ações e ações de Diagnoplex SA. GD serviu como palestrante, consultor e membro do conselho consultivo para Diagnoplex SA, e tem recebido financiamento para pesquisa da Diagnoplex SA. Isto não altera a nossa adesão a PLOS ONE políticas em dados e materiais de compartilhamento.

Introdução

O câncer colorretal (CRC) é o terceiro câncer mais comum e segunda principal causa de morte relacionada ao câncer entre homens e mulheres na Europa [1]. Importante, CRC é curável, quando diagnosticado em fases iniciais. Além disso, a detecção e remoção de pólipos adenomatosos (AP) evita a formação de CRC e diminui a mortalidade por CRC. Vários países já adotaram modalidades de rastreamento para CRC e diretrizes clínicas recomendam que os indivíduos de risco médio começar a fazer exames regulares aos 50 anos de idade [2, 3]

A colonoscopia é o “padrão ouro” para a AP e diagnóstico CRC, no entanto, não é o método preferido para triagem em massa devido ao seu custo, capacidade de invasão, a baixa adesão e acessibilidade limitada. Atualmente recomendados métodos não-invasivos para triagem em massa incluem imunoquímico e guaiac fecal teste de sangue oculto (iFOBT, gFOBT). No entanto, o cumprimento testes fecais ainda está abaixo do ideal em países com um programa de triagem FOBT [4, 5, 6]. Portanto, ainda há uma grande necessidade não atendida chamando para um AP não-invasivas ou minimamente invasivas, complacente, rentável e teste de rastreio precisas para detectar e CRC em estágios iniciais. Um teste de rastreio baseado em sangue é altamente atraente devido à sua capacidade de invasão mínima e alta aceitação entre os pacientes. Em particular, e outros relataram assinaturas derivados a partir de células mononucleares do sangue periférico perfis (PBMC) de expressão de genes associados com digestivo [7, 8, 9, 10], da mama [11], renal [12, 13], pulmonar [14] e cancros da bexiga [15]. Estes testes são conceptualmente diferente a partir de testes de biomarcadores tumorais clássicas, como se baseiam na detecção da resposta do hospedeiro aos sinais derivados de tumores [16, 17] em vez de sobre os marcadores originários do próprio tumor.

Ao pesquisar as diferenças na expressão genética e identificação dos transcritos de ARN a ser posteriormente utilizada como biomarcadores potenciais, métodos vulgarmente utilizados incluem plataformas de hibridação de ADN à base de microarray ou técnicas de sequenciação de ARN baseada em [18, 19]. Embora poderoso, estes métodos são complexos, demorados e caros, e gerar um elevado volume de dados que requerem ferramentas da bioinformática e competências especializada para a sua análise. Além disso, os genes de interesse identificados requerem validação adicional por métodos mais precisos e sensíveis, tais-qPCR em tempo real, antes de poderem ser traduzidos em testes clinicamente úteis [20]. Em alternativa a estas técnicas, de alto rendimento em tempo real plataformas qPCR demonstrou ter um bom desempenho quando a selecção do gene candidato foi conduzido por provas científicas sólido, apesar do facto de que eles permitem a análise de apenas uma fracção do transcriptoma [21]. Importante, as descobertas de biomarcadores baseados em plataformas qPCR têm a vantagem importante de que um passo de validação, tendo em vista a sua utilização clínica não é necessária. Além disso, eles são substancialmente menos dispendiosas do que as abordagens do genoma completo, permitindo a análise de um conjunto de amostras maiores e, assim, aumentar o poder estatístico do estudo.

Aqui relatamos a descoberta e caracterização de um painel de 29 genes em PBMC para a detecção de adenomas e carcinomas utilizando um nanolitros alto rendimento plataforma de qPCR (OpenArray) [22]. Para este fim foram utilizadas amostras coletados prospectivamente a partir de um estudo multicêntrico, caso-controle no qual os pacientes foram encaminhados para colonoscopia ou programado para a cirurgia para a remoção do CRC. Também demonstramos que o painel de gene poderia ser facilmente transferidos e implementado em um ensaio ideal para laboratórios médicos, o que é um passo fundamental no desenvolvimento de um novo, simples teste de rastreio do cancro colo-base do sangue rentável.

material e Métodos

Os pacientes

Um estudo de caso-controle (DGNP-COL-0310), incluindo três centros sul-coreanos e seis suíços que matriculadas 1665 indivíduos com idade superior a 50 anos que foram encaminhados para colonoscopia pelo clínico geral ou foram programado para a cirurgia, foi realizado a partir de junho de 2010 a abril de 2013. o estudo foi especificamente concebido e desenhado para o desenvolvimento e validação de um novo teste para triagem CRC. A fase de descoberta de biomarcadores teve lugar durante o primeiro semestre de recrutamento de pacientes. Para este efeito, um subconjunto de 144 sujeitos, alocados para controlar, grupos CRC e AP (Tabela 1), foi selecionada aleatoriamente, e utilizada para criação de perfis de expressão gênica por alto rendimento qPCR.

Os indivíduos não tinham história familiar de primeiro grau de CRC ou de uma predisposição CRC conhecido, história prévia de cancro ou pólipos incluindo CRC, não hepatobiliar, genito-urinário, distúrbios auto-imunes e inflamatórias, incluindo doenças inflamatória do intestino, doenças infecciosas e febre dentro de 4 semanas antes da colonoscopia. As doenças crônicas comuns na população de idade, como diabetes, hipertensão, hipercolesterolemia, insuficiência cardíaca, não foram considerados como critérios de exclusão. Um assunto de controle foi definido como um indivíduo sem qualquer história passada e presente de lesões colorretais ou doenças (por exemplo, pequenos adenomas, pólipos hiperplásicos, câncer). O grupo AP incluídos indivíduos diagnosticados com um adenoma maior do que 1 cm, com base na medição endoscópica. O grupo CRC incluiu pacientes com carcinoma em todas as quatro fases TNM. O diagnóstico final foi baseada na avaliação colonoscopia e histopatológico.

A aprovação ética

O protocolo do estudo (DGNP-COL-0310) foi aprovado pelos conselhos de revisão e comitês de ética competentes para pesquisa em seres humanos de Canton Bern, Suíça (Kantonale Etikkommission Berne, No KEK 139/10), Canton St. Gallen, Suíça (Ethikkommission des Kantons St. Gallen, No. EKSG 10/091 /1B), Canton de Vaud, Suíça (Comissão Cantonale d’éthique de la recherche sur l’être humana, No. VD 77/10), Canton Basel, Suíça (Ethikkommission beider Basileia, No. EKBB 242/10), do Hospital Severance, Yonsei University College of Medicine, Coreia do Sul (No. 4-2010-0128) e pelo Institutional Review Board Bioética do Hospital Universidade Nacional de Seul, Coreia do Sul (IRB No. H-1004-020-315). consentimento informado por escrito foi obtido de todos os participantes do estudo que aderem às diretrizes éticas locais.

coleta e processamento de sangue

O sangue periférico de todos os sujeitos foi elaborado quer até 30 dias antes ou até 12 semanas depois de colonoscopia e antes de qualquer pólipo ou ressecção do cancro ou quimioterapia pré-operatória. Amostras de sangue foram coletadas em tubos ml 4×4 BD Vacutainer CPT (Becton Dickinson, Franklin Lakes, NJ). tubos CPT cheios foram mantidos à temperatura ambiente e separação de PBMC realizada no prazo de 6 horas de acordo com as instruções do fabricante. PBMC peletes foram ressuspensas em ARN

mais tarde

Solução (Life Technologies, Carlsbad, CA), e armazenados a -80 ° C.

preparação de RNA

purificação automatizada de ARN total foi realizada em QIAcube por RNeasy Mini kit (Qiagen, Venlo, Holanda) e incluiu um tratamento DNase. A concentração de RNA foi medida por Nanodrop espectrofotómetro (Thermo Scientific, Waltham, MA) e a integridade de ARN foi analisada por Agilent Bioanalyzer 2100 (Agilent Technologies, Santa Clara, CA). As amostras com um RIN 7 foram considerados de má qualidade e descartado. Em média ARN mostrou um RIN de 9 ± 0,5. ARN total isolado foi aliquotado e armazenado a -80 ° C. A fim de atender à alta concentração de RNA exigido pelo protocolo RT, amostras de RNA foram sistematicamente precipitado seguinte a /3M método de acetato de sódio 100% de etanol padrão.

projeto Triagem e geração de conjunto de dados

A fim para encontrar biomarcadores sanguíneos relevantes para CRC, foi realizada triagem expressão do gene em 144 amostras provenientes de pacientes com AP ou CRC e indivíduos controle. O rastreio foi concebido em 2 fases (figura 1). Primeiro, nós perfilado 93 amostras com um painel gene grande. O painel incluía 667 candidato, dos quais 42 biomarcadores previamente identificado pelo nosso laboratório [8] e 625 novo candidato seleccionado a partir da literatura (Tabela S1). Três genes de referência para a normalização de dados qPCR também foram adicionados. A pesquisa bibliográfica focada em genes, vias moleculares e processos biológicos considerados relevantes na resposta tumor-hospedeiro, como inflamação e resposta imune, invasão tumoral e metástase, hematopoiese, vias de transdução de sinal (em particular via de NF-kB), quimiocinas e citoquinas (em especial de IL-1, IL-2), proteínas de matriz extracelulares, moléculas de adesão e os marcadores da superfície celular. Para cada gene candidato, um ensaio TaqMan foi seleccionado a partir de um repositório comercial (Life Technologies, Carlsbad, CA) (S1 Tabela) e distribuídas em três placas de 224-ensaio aberto do painel, cada uma medindo 12 amostras em paralelo. Assim, para totalmente perfil 12 amostras, três placas de 224-ensaio, termociclado em paralelo, foram usadas. Para verificar a variabilidade inter-chapa e reprodutibilidade, o gene de referência RPLP0 foi ensaiada para cada amostra em todos os 3 pratos. análise RPLP0 desvio padrão (SD) das 3 repetições de amostra mostrou uma SD mediana de 0,21 Ct, com um intervalo inter-quartil de 0,14-,34, indicando que a medição da amostra foi preciso e altamente reprodutível em toda a série de 3 prato. Nesta fase estamos focados em pegar o mais ampla variabilidade biológica sujeita ao invés de minimizar a técnica, portanto repetições sistemáticas de amostra não foram realizados, para permitir que o perfil de um número máximo de amostras.

Em uma primeira fase de rastreio efectuados no sistema OpenArray, 670 genes foram perfilado em 93 amostras. Destes, 163 foram seleccionados genes e posteriormente testadas na fase 2 em 51 amostras adicionais. O conjunto de dados final incluiu 144 amostras perfiladas com 163 genes. Um painel de 29 genes foi compilado com base em maior poder de discriminar AP /CRC de controles por meio de análise uni e multivariada. Finalmente, o painel de 29-gene foi validado com uma plataforma LightCycler480, comumente usados ​​em laboratórios clínicos.

Fora de 670 genes analisados, 133 não mostrou nenhuma expressão ou uma amplificação por PCR pobres. Os restantes 534 genes candidatos e 3 genes de referência foram em geral bem expresso com um Ct mediana de 22,94 (intervalo inter-quartil: 21,28-25,24) e um SD mediana de 0,7 (intervalo inter-quartil: 0,59-1,04) (S2 Tabela). perfis de genes passou por uma etapa de luz de filtragem em que eles tinham que satisfazer, pelo menos, um dos seguintes critérios para pelo menos uma das análises a discriminação (

i

.

e

. controle versus CRC ou controle versus AP): um valor de p inferior a 0,1 ou uma dobra de mudança de maior do que 1,5 (escala linear). Além disso, os biomarcadores identificados anteriormente em nosso laboratório [8] foram retidos nessa fase independentemente do seu valor-p ou dobrar a mudança, a fim de ser avaliada em um conjunto de amostras maiores e utilizando uma abordagem estatística multivariada. No total, foram seleccionados 160 genes, juntamente com os três genes de referência, para a segunda fase da análise. Desta vez, os 163 genes, medidos por 168 ensaios (5 genes com expressão muito baixa teve um segundo ensaio para validar a medida obtida), foram alocados em uma única placa (S3 Tabela). Adicionais 51 amostras foram perfilado em duplicado com este painel reduzida do gene para aumentar o tamanho da amostra e o poder estatístico em análises subsequentes. Além disso, 40 amostras já perfilado na fase 1, foram re-analisados ​​para assegurar a reprodutibilidade das medições entre a fase 1 e fase 2 e a placa de formato diferente (224-

vs

. Formato 168-ensaio). Os níveis de expressão obtidos em ambas as fases para estes 40 amostras foram altamente correlacionados (R

2 = 0,993) (S1 Fig), alertando-nos para combinar os 93 e 51 amostras, perfiladas para os 163 genes, em um único conjunto de dados final ( Figura 1). Para compilar o conjunto de dados, foram utilizados os valores médios das 40 amostras medidas em duplicata.

nanolitros alto rendimento qPCR

novecentos ng de RNA total foi transcrito de forma inversa num volume de 20 ul usando a alta -capacidade de cDNA kit de transcrição reversa (Life Technologies, Carlsbad, CA) com os iniciadores aleatórios, de acordo com as instruções do fabricante.

a expressão de genes de perfis foi realizada utilizando o sistema OpenArray [22] (Life Technologies, Carlsbad, CA) , um elevado rendimento em tempo real plataforma de PCR nanolitros, permitindo 3,072 reacções de uma única placa. As reacções de PCR foram realizadas de acordo com o protocolo de placas em tempo real TaqMan OpenArray. Resumidamente, as misturas reaccionais de PCR contendo 2,5 uL GeneAmp mistura rápida PCR Master (Applied Biosystems, Carlsbad, CA), 1 ul TaqMan OpenArray Remix (Applied Biosystems, Carlsbad, CA), 0,3 ul de água livre de RNase, e 1.2 ADNc ul, foram carregados automaticamente na reacção única ou em duplicado das placas utilizando um instrumento de OpenArray OpenArray AccuFill de acordo com os protocolos do fabricante. O protocolo de ciclos térmicos consistiram em 40 ciclos a 95 ° C durante 15 segundos e 60 ° C durante 1 minuto. No final de cada corrida, as imagens, coletadas antes e durante a execução de PCR, foram inspeccionadas visualmente para verificar se há misloading amostra ou placas de problemas de leitura. Os valores Ct foram computados pelo software de análise OpenArray com limite automático com a confiança Ct set sinal mínimo em 300. Valores abaixo a configuração mínima do sinal indicada uma reação falhou ou nenhuma amplificação e os valores em falta apareceu nos dados exportados. A maior parte do tempo de uma reacção não foi devido a níveis de expressão para além do limite de detecção. Uma vez que o máximo Ct detectado era inferior a 36, ​​estes valores foram substituídos por o valor de Ct arbitrário de 36. Os valores em falta julgadas para ser causado por razões técnicas foram substituídos por os valores medianos Ct do gene em causa em todas as amostras. Um RNA de referência (Ref Xpress Humano Universal de RNA total) (Qiagen, Venlo, Holanda) estava presente como controle positivo, pelo menos uma vez em cada corrida PCR, a fim de garantir um processo e estabilidade do reagente, bem como a reprodutibilidade em diferentes PCR é executado. Os controlos negativos, contendo água em vez de cDNA foram usadas para descartar a possibilidade de contaminação de DNA.

em tempo real qPCR em 384 poços placas

Duzentos ng de RNA total foi transcrito reversamente em cDNA usando SuperScript VILO cDNA Synthesis Kit (Invitrogen, Carlsbad, CA) de acordo com as instruções do fabricante.

RealTime prontos ensaios personalizado RT-qPCR (Roche, Basileia, Suíça) com base na tecnologia Universal ProbeLibrary (UPL) (S4 Table), foram pré-carregadas em placas de 384 pos realizada pelo fabricante. Em tempo real A análise de PCR em placas de 384 poços foi realizada no instrumento LightCycler 480 (Roche, Basileia, Suíça) em 144 amostras. As reacções de PCR foram realizadas em duplicado em placas de 384 poços, num volume total de 10 ul. Cada poço foi carregado por um pipetador automático (Microlab estrela, Hamilton Robotics, Reno, NV) com 5 ul de ADN em Tempo Real Ready Mix Sondas mestre (Roche, Basileia, Suíça) e o equivalente de ADNc de 2,5 ng de ARN total. O programa consistia de qPCR de 2 segundos a 95 ° C e 30 segundos a 60 ° C durante 40 ciclos. Os controlos positivos e negativos foram gerados com cada lote retrotranscri�o e foram incluídos em cada qPCR funcionamento para cada ensaio alvo. O controlo negativo não continha nem RNA nem cDNA para confirmar nenhuma contaminação ocorreu. O controlo positivo foi feita com uma quantidade padronizada de ARN humano universal Referência (Clontech, Mountain View, CA), dividido em alíquotas e armazenado a -80 ° C. Para executar qPCR validação, o controlo negativo não resultou em amplificação ou um ponto de cruzamento do valor (Cp) para cima ou igual a 35, e o controlo positivo de um valor Cp, para cada gene alvo, que caiu dentro de um intervalo pré-determinado. valores Cp foram calculados automaticamente com o software de análise de LightCycler 480 de acordo com o

nd método de máxima derivado de 2 [23].

A análise estatística

dados de PCR derivados do OpenArray e as plataformas LC480 foram normalizados pelo método ΔCT utilizando a média de três genes de manutenção RPLP0, NACA e TPT1. Estes foram seleccionados genes porque são mais estáveis ​​em 3 conjunto de dados de microarray relacionados com PBMC disponível a partir da base de dados GEO [24] e também em análise qPCR realizados por nós (dados não mostrados).

mudança Gene expressão dobra, foi definida como com, onde está os dados normalizados.

rank de Wilcoxon [25] foi aplicada aos dados de expressão gênica normalizados a fim de definir genes diferencialmente expressos de forma significativa entre os grupos. Além disso, na fase 2 de triagem, Wilcoxon rank foi aplicado a 500 conjuntos de dados selecionados aleatoriamente (de bootstrap) e significância foi definido como genes que aparecem significativa (p 0,05) em pelo menos 250 bootstraps de 500.

A análise multivariada utilizados para seleção de recursos na fase 2 rastreio incluiu os seguintes métodos:. K-top pair de pontuação, um algoritmo de seleção de recurso livre de parâmetro [26], e método de regressão logística penalizada com algoritmos diferentes [27, 28]

Para avaliar a precisão da previsão do painel de 29 genes, modelos de regressão logística penalizados foram montados no conjunto de dados e validado pelo método bootstrap não sobreposta [29]. Quinhentos conjuntos de dados aleatórios foram desenhados com a substituição de conjunto de dados; cada inicialização tinha o mesmo tamanho do conjunto de treinamento. O modelo foi re-adaptado em cada inicialização e validado em amostras fora do saco. A especificidade e sensibilidade valores médios obtidos durante 500 bootstraps foram calculados e as características do receptor operacionais (ROC) foram gerados através da representação gráfica da sensibilidade contra a taxa de falsos positivos (1-especificidade). foi calculada a área sob a curva (AUC).

O coeficiente de correlação de Pearson foi utilizado para avaliar correlação linear entre as medidas “genes por dois instrumentos.

O ambiente de estatísticas de I foi utilizado para análises estatísticas.

Resultados

Definição de um painel de 29 genes para câncer colorretal e adenoma de detecção

O conjunto de dados gerados a partir de fase 2 de triagem (163 genes e 144 amostras) foram analisadas e filtradas para baixo e a expressão de genes instáveis ​​através das duas fases, e 20 genes foram mais descartados, reduzindo o número de genes candidatos para 140. os dados foram exploradas de modo a definir quais os genes, sozinho ou em combinações, teve o maior poder de discriminar CRC , AP e AP juntamente com CRC fase inicial (AP + CRC I-II) do grupo controle (S3 Tabela). Além disso, o grupo CRC foi comparado com o grupo AP, para identificar genes específicos capazes de diferenciar entre CRC e AP. Em geral, a maioria dos genes pareciam ser regulados positivamente nos grupos de CRC e de AP quando comparado com o grupo de controlo. A expressão do gene observada dobre mudanças foram relativamente modesto, não excedendo um fator de 2,3 (log2 = 1,22) (Figura 2). Quando um filtro baseado em um FC 1,3 e valor de p 0,05 foi aplicado a todas as comparações entre os grupos (CRC /Con, AP /Con, AP + CRCI-II /Con, CRC /AP), encontramos 28 genes que satisfizeram ambos os critérios (S3 tabela). Entre estes, 14 discriminar CRC e 8 AP do grupo controle (Fig 2), dois dos quais eram comuns a ambas as condições (CES1 e IL1B). Sete eram específico apenas para a separação de AP da CRC e 1 para discriminar AP + CRC I-II. Os genes foram confirmadas como sendo significativa quando o teste estatístico foi aplicado a 500 conjuntos de dados gerados aleatoriamente (de bootstrap, dados não mostrados).

As parcelas vulcão resumir a expressão do gene dobra-mudanças (FC) (

X-eixo

) e os valores de p (

eixo y

) para as comparações: a, CRC versus controle ou, B, AP versus controle. P-valor de corte foi fixado em 0,05 (linha horizontal) e dobre-a mudança do limiar em ± 0,38 (equivalente a ± 1,3 na escala linear, linha vertical). Um Fc igual a 1 significa que o gene é expresso no grupo de interesse, em média, de duas vezes mais do que no grupo de controlo.

A análise multivariada foi aplicado ao conjunto de dados para discriminar CRC, PA , AP + CRC do grupo de controle. Ele incluiu KTS-pair [26] e cinco algoritmos diferentes com base no método penalizado regressão logística [27, 28, 30] para as seleções e montagem modelo de variáveis. Genes foram classificados de acordo com a frequência de selecção através do método utilizado, que é resumido pela pontuação multivariada. Trinta e oito genes com uma pontuação de pelo menos dois foram retidos para compilar a lista gene final (S3 Tabela).

O gene uni e multivariada listas foram então fundidas, resultando em uma lista final de 29 genes (Tabela 2). Curiosamente, a maioria dos genes com maior pontuação univariadas parecia ser também os genes com maior pontuação na análise multivariada. Quatro genes (MAP2K3, MAPK6, CD63, ITGB5), excluídas pelo filtro da análise univariada, porque FC 1,3, mas estatisticamente significativa (p valor 0,05), foram “resgatados” por meio da análise multivariada. Dos outros 10 genes não são estatisticamente significativos e integrados nas listas finais graças à abordagem multivariada (GATA2, LTF, MMP9, CXCL10, MSL1, RhoC, FXYD5), os três primeiros mostrou um FC . 1,3

análise funcional realizado com o pacote Ingenuity Pathway Analysis (IPA; www.qiagen.com/ingenuity), revelou que o painel foi enriquecido em genes envolvidos na migração de leucócitos e quimiotaxia (CCR1, CXCL10, CXCL11, CXCR3, IL1B, IL8, ITGA2, MMP9, S100A8) (Tabela 3). Estas funções celulares estão fortemente relacionados com o tráfico de células imunes e inflamação. Altamente representada também foram genes envolvidos na proliferação e diferenciação celular (BCl3, CD63, EGR1, GATA2, junho, LTF, MAPK6, MMP11, NME1, PPARG, TNFSF13b), refletindo um possível papel na hematopoiese.

Validação do painel de 29 genes

para avaliar a relevância clínica do nosso painel de 29 genes, em particular a sua acurácia preditiva, regressão logística penalizado foi aplicado ao conjunto de dados e modelos ajustados foram validados pela inicialização não-sobreposta Método. Modelos poderiam discriminar CRC ou AP 1 centímetro de controles com uma sensibilidade média de 75% e 59%, respectivamente. A especificidade média, definida como o número de controlos correctamente classificados sobre o número total dos controlos, foi de 91%. análise ROC determinada uma AUC de 0,88 (IC de 0,83-0,92, 95%) e de 0,85 (0,78-0,91, IC de 95%) de CRC ou a detecção AP, respectivamente (Figura 3). Quando a mesma abordagem foi aplicada aos 15 genes mais bem classificados para CRC ou AP discriminação por análise univariada única (Tabela 2), a precisão da previsão diminuiu drasticamente. Quando especificidade foi fixado em 91%, CRC foram detectados com uma sensibilidade de 65% e AP, com uma sensibilidade de 37%, com uma AUC de 0,86 (0,77-0,84, IC de 95%) e 0,77 (0,70-0,82, 95% IC ), respectivamente. Este resultado apoiado a nossa escolha de integrar abordagem uni e multivariada para a seleção de genes: genes que de outra forma teriam sido descartados, porque não cumprir o valor-p fixa e critérios de FC, eram de fato valiosa para a detecção CRC e AP como julgado por métodos multivariados

A. Resumo das taxas de falsos positivos e verdadeiros do painel de 29-gene na classificação de casos de CRC. B. Resumo das taxas de falsos positivos e verdadeiros do painel de 29-gene na classificação de casos de AP. As análises foram realizadas 500 validações de bootstrap. Os boxplots representar a distribuição dos 500 autoinicializa. A linha preta representa os valores médios obtidos durante 500 bootstraps para especificidade clínica e sensibilidade.

migração Ensaio para uma plataforma qPCR 384 poços placa

A plataforma OpenArray demonstrou ser valiosa em alta rendimento perfil de expressão gênica e descoberta de biomarcadores. No entanto, esta plataforma não é adequada num ambiente de laboratório clínico de rotina, em que a facilidade de uso, flexibilidade e custos baixos são preferidos. Com o objectivo de desenvolver o painel de 29 genes em um teste amplamente utilizado CRC rastreio, avaliamos o comportamento do painel em uma plataforma qPCR que é comumente adotada por laboratórios clínicos. As 144 amostras foram perfilado com o painel de 29 genes utilizando um instrumento LightCycler 480 (LC480) e um conjunto de ensaios à base de sondas disponíveis comercialmente (Universal ProbeLibrary, Roche), pré-carregado em placas de 384 poços.

Correlação e a análise de regressão linear mostrou que os níveis de expressão de genes medidos nas duas plataformas foram altamente comparável (coeficiente de correlação: 0,933) (Fig 4A). Em geral, a expressão do gene mostraram variância semelhante entre as amostras (Fig 4B). No entanto, um grupo de genes expressos modesto exibida medições com menores desvios padrão na plataforma LC480 do que no OpenArray um, o que sugere que os ensaios sobre o instrumento LC480 são mais precisos. Quando repetiu a análise de expressão gênica diferencial entre controles e grupos de CRC com o conjunto de dados LC480, descobrimos que a abundância relativa e significância estatística para os 29 genes foram semelhantes ou com a tendência semelhante ao que observado no conjunto de dados OpenArray (Fig 4C e 4D) . No entanto, durante cinco genes (PTGES, MMP11, IL8, CCR1, S100A8) significância estatística foi perdido quando medido no LC480.

Gráficos de dispersão comparando análises realizadas para cada gene nos conjuntos de dados gerados sobre a LC480 e plataformas OpenArray . As seguintes variáveis ​​foram utilizadas: A. A média de valores de expressão normalizados (ΔCp e ΔCt) (R

2: 0,933), B. desvios-padrão relativo (SD) para cada gene alvo média medida, expressão C. Gene dobre mudanças entre o CRC eo grupo controle (valores absolutos lineares), D. p-valores de testes estatísticos entre o CRC eo grupo controle (log transformado). As linhas representam um valor de p 0,05. nomes de genes foram sobrepostos aos gráficos

Discussão e Conclusões

Neste trabalho identificámos um painel de 29 genes expressos em PBMC, capaz de discriminar indivíduos com AP 1 centímetro ou CRC de indivíduos saudáveis. análise de regressão logística penalizada classificou corretamente 75%, 59% (sensibilidade) e 91% (especificidade) do CRC, AP e controles, respectivamente.

A abordagem que usamos é diferente em comparação com testes de triagem existentes para CRC, como baseia-se em PBMC perfis de expressão de genes. Este conceito utiliza a bem estabelecida de interacção tumor-hospedeiro e contribuição de células de osso derivadas de medula para a progressão tumoral [16, 17]. É de interesse o facto de que a AP, lesões pré-malignas consideradas, também são detectados, embora com uma menor sensibilidade, por o painel de 29 genes. Com efeito, a inflamação está associada com a formação neoplásica do cólon pólipo [31] e doenças inflamatórias do intestino, colite ulcerosa, em particular, são um factor de risco para CRC [32]. Mais importante, não-esteróides anti-inflamatórios proteger contra o desenvolvimento de CRC [33], evitar a formação de adenoma em modelos experimentais de polipose coli adenomatosa familiar [34] e inverter as alterações de expressão de genes no cólon normal a sequência adenoma [35]. Isso reforça a noção de que a abordagem proposta pode ser desenvolvido para AP e detecção precoce CRC como alternativa mais eficaz para análises de sangue oculto nas fezes. O conjunto de 670 genes candidatos utilizados para o rastreio incluiu muitos genes do hospedeiro e vias envolvidas na inflamação, a resposta imune e a progressão do tumor. É importante ressaltar que esses genes não foram escolhidos com base em uma tela de todo o genoma anterior, mas com base no conhecimento existente (isto é literatura e os dados próprios) e hipóteses (isto é papel da inflamação na progressão do câncer). A maioria destes genes 29 do painel são mediadores de inflamação /reguladores, motilidade celular, sobrevivência celular, proliferação e sinalização celular (Tabela 2 e 3). Isto é consistente com a noção de que as células circulantes myelomoncytic derivadas de medula óssea mobilizou-tumoral se encontram num estado de activação em resposta aos factores libertados-tumorais.

Deixe uma resposta