PLOS ONE: Meta-Análise de Microarray conjuntos de dados Identifica ANO1 e FADD como prognósticos marcadores de Cabeça e Pescoço Cancer

Abstract

A cabeça e pescoço carcinoma de células escamosas transcriptoma (CECP) foi perfilado extensivamente, no entanto, identificando biomarcadores que são clinicamente relevantes e, assim, com o benefício de translação, tem sido um grande desafio. O objetivo deste estudo foi o de usar uma abordagem baseada em meta-análise para catalogar biomarcadores candidatos com alto potencial de aplicação clínica em CECP. Dados da série microarray publicamente disponíveis (N = 20) perfilado usando Agilent (4X44K G4112F) e Affymetrix (HGU133A, U133A_2, U133Plus 2) plataformas foi baixado e analisado de maneira plataforma /específicas do chip (GeneSpring v12.5 software, Agilent, EUA). análise de Análise de Componentes (PCA) e clustering principal foi realizada de forma iterativa para segregação de outliers; 140 amostras normais e tumorais 277 de série 15 foram incluídos na análise final. As análises identificou 181 genes diferencialmente expressos, concordantes e estatisticamente significativas; análise STRING revelou interações entre 122 deles, com dois grandes grupos de genes ligados por vários nós (MYC, FOS e HSPA4). Validação no banco de dados específico do CECP (N = 528) em The Cancer Genome Atlas (TCGA) identificou um painel (

ECT2

,

ANO1

,

TP63

,

FADD

,

EXT1

,

NCBP2

), que foi alterada em 30% das amostras. Validação em virgens de tratamento (Grupo I, n = 12) e pós-tratamento (Grupo II; n = 12) pacientes identificados 8 genes significativamente associados com a doença (área sob a curva de 0,6). Correlação com recorrência /re-recorrência mostrou

ANO1

teve a maior eficácia (sensibilidade: 0,8, especificidade: 0,6) para prever a falha no Grupo I.

UBE2V2

,

PLAC8

,

FADD

e

TTK

apresentou alta sensibilidade (1,00) no Grupo I, enquanto

UBE2V2

e

CRYM

foram altamente sensíveis ( 0,8) na previsão re-recorrência no Grupo II. Além disso, a análise mostrou que TCGA

ANO1

e

FADD

, localizado em 11q13, foram co-expressos a nível transcrição e significativamente associada à sobrevida global e livre de doença (

p

0,05). A abordagem meta-análise adotada neste estudo identificou marcadores candidatos correlacionadas com a evolução da doença em CECP; uma validação adicional em uma coorte maior de pacientes irá estabelecer sua relevância clínica

Citation:. Reddy RB, Bhat AR, James BL, Govindan SV, Mathew R, DR R, et al. (2016) Meta-Análise de Microarray conjuntos de dados Identifica

ANO1

e

FADD

como prognósticos Marcadores de Câncer de Cabeça e Pescoço. PLoS ONE 11 (1): e0147409. doi: 10.1371 /journal.pone.0147409

editor: Muy-Teck Teh, Queen Mary University of London, Reino Unido

Recebido: 08 de outubro de 2015; Aceito: 04 de janeiro de 2016; Publicação: 25 de janeiro de 2016

Direitos de autor: © 2016 Reddy et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Data Availability:. Todos relevante os dados estão dentro do papel e seus arquivos de informação de apoio

Financiamento:. o projeto foi financiado pelo Conselho indiano de Pesquisa médica, Índia (no: 5/8 /10-18 (Oto) /CFP /11-NCD -1). (https://www.icmr.nic.in/). AS recebeu o financiamento. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

Conflito de interesses:. Dois dos autores são filiados com a companhia comercial Strand Ciências da Vida. Isto não altera a adesão dos autores para PLOS ONE políticas em dados e materiais de compartilhamento.

Introdução

perfil molecular dos tumores, incluindo cabeça e pescoço carcinoma espinocelular (CECP), tem sido empregado compreender os mecanismos da carcinogênese, bem como as razões subjacentes para a resistência ao tratamento. A crescente incidência global da CECP junto com a falta de melhora significativa na sobrevida global durante as últimas quatro décadas, exigem novas abordagens para compreender os mecanismos moleculares da doença e identificar potenciais marcadores para a detecção precoce, prognóstico e como alvos para a terapia. perfil molecular em combinação com a validação do paciente em cancros da próstata, dos ovários e da mama conduziu a aplicação clínica de painéis de marcadores, tais como impressão e Mamma Oncotype Dx. [1, 2]. Tentativas semelhantes para estabelecer marcadores moleculares de diagnóstico ou prognóstico para CECP para aplicação clínica permaneceram indescritíveis.

alta capacidade molecular profiling usando técnicas que catalogar as diferenças em todo o genoma, transcriptoma [3] [4] [5] e proteoma [6] níveis foram realizadas em HNSCC. Estes estudos têm catalogado marcadores de progressão [7] [8] e a resposta ao tratamento [9]. No entanto, a tradução destes marcadores para benefício clínico não foi alcançado devido aos desafios associados com técnicas de alto rendimento em termos de marcador de selecção e a necessidade de validação paciente grande escala. Estes desafios são ainda confundidos devido a questões como a discordância significativa entre os diferentes estudos de alto rendimento, atribuídas a diferenças no processamento da amostra, tipo de plataformas utilizadas e os algoritmos de análise utilizados [10] [11]. Este problema é ainda mais agravado em estudos transcriptomic principalmente porque as mudanças de nível transcrição pode variar com base no palco, específico do tecido e as flutuações espaciais na expressão de vários genes.

Estratégias analíticas que podem utilizar bases de dados existentes e identificar marcadores concordantes entre os estudos pode ser uma abordagem benéfica para diminuir a marcadores de maior confiança e aplicabilidade clínica. Meta-análise, referindo-se a análise de conjuntos de dados publicamente disponíveis, poderia, portanto, potencialmente permitir a identificação da associação clinicamente relevante dos marcadores; Muitos desses estudos têm sido relatados em cânceres de diferentes sites. As abordagens baseadas em meta-análise em câncer pancreático levaram à identificação de novos alvos e biomarcadores candidatos [12]. Em cancros da próstata, marcadores causal com o processo cancerígeno foram identificados utilizando uma abordagem semelhante [13]. Além disso, os marcadores altamente associado com o prognóstico e tratamento previsão desfecho no câncer de mama [14] [15] Também foram identificados através de abordagens baseadas em meta-análise semelhante. O objetivo principal deste estudo foi realizar um cross-platform, cross-estudo de meta-análise de conjuntos de dados de microarranjos publicamente disponíveis em câncer de cabeça e pescoço, identificar marcadores de relevância biológica através de um gasoduto analítico comum e, posteriormente, validá-las em amostras clínicas.

Materiais e Métodos

critérios de pesquisa e Data Mining

a análise dos conjuntos de dados de microarranjos publicamente disponíveis foi realizada de acordo com as diretrizes PRISMA [16]. As bases de dados públicas, Gene Expression Omnibus (GEO) (NCBI-http: //www.ncbi.nlm.nih.gov/geo/) e matriz Express (EBI) [https://www.ebi.ac.uk/arrayexpress ] foram pesquisados ​​quanto à presença de dados brutos de microarrays experimentos realizados em câncer de cabeça e pescoço. A série selecionada para a análise incluiu dados de i) estudos realizados em pacientes com carcinoma de células escamosas de cabeça e pescoço ii) estudos incluindo pacientes virgens de tratamento e estudos iii) Realização de perfil global das transcriptomics usando matrizes de alta densidade. Estudos /amostras, incluindo tireóide, orofaringe e nasofaringe foram excluídos do estudo devido às suas variadas etiologias. As duas plataformas, incluídas nas análises foram Affymetrix [Affymetrix Inc., Califórnia, EUA] e Agilent [Agilent Technologies, Califórnia, EUA]. A sequência de dados em bruto perfilada por ambas as plataformas foram agrupados com base na tecnologia individual e cada tecnologia (de qualquer uma das plataformas) foi incluído na análise se, pelo menos, duas séries estavam disponíveis no banco de dados. O fluxo de trabalho geral seguiu o protocolo passo a passo sugerido por Ramasamy

et al

para a realização de meta-análise [17]. O algoritmo de trabalho básico é detalhado na Figura 1.

Os dados de microarranjos cru publicamente disponíveis de Cabeça e Pescoço série carcinoma espinocelular (CECP) foram baixados e agrupados e analisados ​​no software estatístico GeneSpring. A normalização foi realizada em amostras, as quais foram, em seguida, agrupadas em tumoral e normal antes de se efectuar a experiência nível do gene. Análise de Componentes Principais (PCA) foi realizada para remover as amostras discordantes. Dobre mudança e

p valor

foram calculados para obter as entidades genéticas significativas. Estas entidades estatisticamente significativos foram usadas para análise posterior; anotações de banco de dados (Gene Ontology, cordas e miRWALK) e validação paciente (validação experimental por Quantitative PCR em tempo real (qPCR) e The Cancer Genome Atlas (TCGA)).

Análise de Dados Usando Gene Primavera

os arquivos de dados brutos utilizados para as análises incluíram .CEL (plataforma Affymetrix) e .txt (Agilent). Meta-análise foi realizada utilizando software Primavera Gene (https://genespring-support.com) [v12.5, Agilent, Califórnia, EUA]. Os dados brutos referentes a cada chip foi carregado para o software em que as amostras foram de base transformados e normalizados por análise robusta Multi-array (RMA) em Affymetrix ou 75

percentil em plataformas Agilent (única cor). Os arquivos de amostras individuais foram então classificadas em ‘normal’ e ‘tumor’ e re-analisados ​​como um único experimento. nível Gene dados experimentais (média aritmética de todas as sondas de mapeamento para o mesmo ID de sonda) foi gerado e controle de qualidade foi realizado utilizando Análise de Componentes Principais (PCA) em GeneSpring. As amostras que eram discrepantes nas parcelas PCA foram removidos e agrupamento realizado posteriormente para garantir uma clara estratificação entre as duas categorias de amostras (normais e tumorais). O processo foi realizado com várias iterações para se obter uma separação refinado. Fold análise alteração foi então executado nas amostras após o que desemparelhado

t

-test (variância desigual) foi realizada para se obter entidades de genes significativos. O

p

computação -valor (assintótica) e correcção de testes múltiplos (Benjamini Hochberg FDR) foram ainda realizados para obter entidades de genes com

p

-valor 0,05 e dobre mudança (FC) de 2.0. análise via embutido foi realizado utilizando a lista gene identificado. A lista gene significativo e percursos entre as diferentes tecnologias de Affymetrix foram comparados usando os nomes símbolo gene /via como um identificador. A lista entidade gene indivíduo de cada tecnologia foram extraídos do software GeneSpring e exportados para o Excel arquivos. As entidades de genes concordantes, bem como vias comuns foram identificados através das tecnologias usando o Microsoft Access (Microsoft Inc. WA, EUA). abordagem semelhante foi adotado para identificar todos os genes e caminhos comuns entre as duas plataformas de Affymetrix e Agilent (Fig 1).

anotação funcional Usando vários recursos da Web

A lista gene concordantes nos diferentes plataformas foi analisada nos diferentes recursos da Internet para avaliar classes funcionais, as interacções proteína-proteína e miARN alvo os genes. Gene Análise Ontologia foi realizada utilizando (Anotação de proteínas através Evolutionary Relacionamento) PANTHER sistema de classificação (https://www.pantherdb.org/) [18] para avaliar as classes funcionais dos genes. O banco de dados (string v9.1) (http: //string-db.orgnewstring_cgi) [19] foi utilizado para prever e catalogar as interações proteína-proteína entre os genes concordantes. Os miRNAs que alvejam estes genes foram investigados utilizando o banco de dados miRWalk2.0 (https://www.umm.uni-heidelberg.de/apps/zmf/mirwalk/index.html) [20].

Paciente baseado Validação

a lista gene concordantes também foi cruz comparação com o banco de dados TCGA (https://www.cbioportal.org) [21] para a sua mutação, copiar número variação (CNV) e estado de expressão de mRNA. O painel gene significativa identificada também foi avaliada por seus dados de co-expressão, global e sobrevida livre de doença em correlação com os seus padrões de expressão nos estudos de câncer TCGA (cabeça e carcinoma de células Neck escamosas, provisória; N = 528 amostras)

A validação dos genes seleccionados foi também levada a cabo em pacientes com CECP utilizando PCR em tempo real quantitativa. O estudo foi aprovado pela revisão Narayana Hrudayalaya Hospitais Institucional bordo [NH /IRB-CL-2012-058]. amostras cirúrgicas de pacientes foram selecionados a partir do repositório bio da Cabeça e Pescoço Oncologia, Mazumdar Shaw Medical Center, Bangalore. Todas as amostras foram coletadas após consentimento informado por escrito. Anteriormente pacientes não tratados e recorrentes diagnosticado com CECP de todos os sites (excluindo tiróide, orofaringe e nasofaringe) e estágios durante o período de março de 2010 para 2014, com detalhes de acompanhamento, foram incluídos no estudo. As amostras de tecidos normais foram coletadas de voluntários saudáveis ​​durante a extração dentária, após consentimento informado por escrito. Os dados demográficos, clínicos e patológicos dos pacientes foram obtidas dos registros médicos eletrônicos e os pacientes foram acompanhados por um período de 2 anos

.

Os pacientes foram classificados com base em seus papilomavírus humano (HPV) status de identificada por imuno-histoquímica de p16 por meio de protocolos estabelecidos. seções embebidos em parafina fixados em formalina dos pacientes foram coletadas a partir do departamento de patologia no centro. Resumidamente, secções de tumor (5 micron) foram de-paraffinised e tratada com peróxido de hidrogénio a 3% para parar a actividade da peroxidase endógena. As secções foram incubadas com o anticorpo primário (anti-p16, BioGenex, Fremont, CA, EUA) e subsequente detecção foi levada a cabo utilizando o sistema de peroxidase de rábano (HRP), conforme as instruções do fabricante (Dako reais

™ EnVision

™ Detection System, Dinamarca). Secções processada de forma semelhante mas sem o anticorpo primário foram tomados como controles negativos. A pontuação das lâminas coradas foi como por estudos estabelecidos [22]. As lâminas foram avaliadas por meio de microscopia de luz e pontuados em uma escala de 0-3, tendo em conta percentual de positividade e intensidade de coloração; 0 (ausência completa de coloração do tumor), 1 (fraca coloração de células de tumor), 2 ( 50% de células tumorais coradas com intensidade moderada) e 3 ( coloração do tumor de 50% com intensa coloração moderada /)

.

marcador Profiling de validação por Quantitative PCR em tempo real (qPCR)

RNA foi extraído das amostras, arquivados no RNA Mais tarde (Ambion, Thermo Fisher Scientific, Massachusetts, EUA), utilizando o reagente TRIZOL (Sigma Aldrich , MO, EUA) e tratado com ADNase (Fermentas, Thermo Fisher Scientific, Massachusetts, EUA) e avaliados quanto à contaminação por Reacção em Cadeia da polimerase (PCR). A integridade e a qualidade do ARN foi verificada por electroforese em gel e a proporção 260/280. 1 ug de ARN (260/280: 1,8-2,0) foi convertido em ADN complementar pelo kit de ADNc de alta capacidade de conversão (Applied Biosystems, CA, EUA) de acordo com as instruções do fabricante. Os marcadores selecionados foram perfilado usando primers específicos enumerados no S1 mesa com todos os primers foram avaliados quanto à especificidade utilizando Básico Local Alignment Tool Search (BLAST) Análise (Centro Nacional de Informação Biológica, NLM, EUA). A eficiência qPCR foi avaliada utilizando o declive da regressão linear de acordo com protocolos padrão. O Cp foi medida através de múltiplas diluições em série de cada cDNA para obter a curva padrão e a inclinação correspondente. A eficiência é calculado por meio da fórmula, Eficiência = 10

(- 1 /inclinação). Todas as reacções de PCR em tempo real foram efectuadas em triplicado, utilizando o 480 tempo real do sistema Roche Luz ciclizador PCR (Roche Diagnostics, Alemanha) ou o Passo ABI Um Tempo real da máquina (Applied Biosystems, CA, EUA) utilizando o Kapa SYBR Green PCR Master Mix ( Kapa Biosystems, MA, EUA). As condições dos ciclos térmicos foram de 50 ° C durante 2 min, seguido por um passo de desnaturação inicial a 95 ° C durante 10 min, 45 ciclos a 95 ° C durante 30 s, 60 ° C durante 30s e 72 ° C durante 30s. Os experimentos foram realizados em triplicado para cada ponto de dados. O ponto de cruzamento (Cp) e a análise subsequente foi levada a cabo usando o segundo método max derivado no software (Roche Diagnostics, Basileia, Suíça). Todas as reacções foram confirmados pela sua especificidade por fusão análise da curva da amostra e do controlo não-alvo (NTC). Um conjunto (N = 4) dos genes de referência [(gliceraldeído-3-fosfato desidrogenase (

GAPDH

), 60S ácida P0 proteína ribossômica (

RPLP0

), 18S ribosomal ácido ribonucléico (

18SRNA

) e β-glucuronidase (

GUS

)] foram avaliados usando o RefFinder [23], em um subconjunto da amostra de pacientes (N = 26) e dois dos melhores genes de referência (RGs) foram selecionados para análise posterior. a mudança relativa na expressão foi avaliada usando a média geométrica dos genes de referência selecionados [24]. a expressão em amostras normais serviu como o calibrador.

Métodos estatísticos

a análise estatística foi realizada utilizando STATA11.1 (College Station, TX, EUA). Receptor Operando análise característica (ROC) foi utilizado para avaliar o poder preditivo de cada um dos biomarcadores, o ponto de corte ideal que rendeu a sensibilidade máxima e especificidade foi determinada para cada biomarcador. curvas ROC foram então representados graficamente em função do conjunto de valores de sensibilidade e especificidade óptimas. Área sob a curva (AUC) foi calculado através da integração numérica de Curvas ROC. O biomarcador que tem a maior área sob a curva ROC foi identificado como possuindo a maior associação com a presença de tumor da cabeça e pescoço. A sensibilidade e especificidade da associação dos marcadores com recidiva /re-recorrência foi analisada usando a calculadora clínica (https://vassarstats.net/clin1.html~~number=plural).

Resultados

Data Mining

com base nos critérios de pesquisa, mineração de dados das diferentes bases de dados identificou um total de 42 séries [plataforma Affymetrix: N = 32, Agilent: N = 10]. Após uma nova filtração dos dados com base nos critérios de inclusão e de exclusão, 18 séries de Affymetrix e dois do Agilent foram incluídos no estudo (Tabela 1). A tecnologia e os chips que eram incompatíveis com o pipeline analítico e em que apenas uma série estava disponível foram excluídos do estudo. O número total de amostras analisadas foram de 667 e 271 tumores normal. A plataforma Affymetrix incluído um total de 246 normal e 629 tumores (U133 mais 2,0: N = 207, T = 419; chip de U133A: N = 19, T = 147; U133A_2: N = 20, T = 63), enquanto a plataforma Agilent (4X44K G4112F) incluiu 25 normal (N) e 38 do tumor (T). Os sub locais investigados no séries selecionadas foram mucosa bucal, língua, laringe, faringe e alvéolos e trígono retro-molar. As amostras foram normais do local gingivobuccal em toda a série. A série de cada chip dentro de cada plataforma foram analisados ​​separadamente usando software de análise de primavera Gene e como por gasoduto analítica para identificar as listas de entidades genéticas concordantes.

Análise através de uma única plataforma.

na plataforma Affymetrix, foram analisados ​​18 de série, que incluiu estudos efectuados sobre U133 acrescido de 2 (N = 13), U133 A_2 (N = 2) e U133A (N = 4) fichas; em uma das séries, os dados foram analisados ​​utilizando dois chips diferentes (Tabela 1). Cinco série de U133 mais 2 foram excluídos uma vez que as amostras foram discrepantes durante PCA e cluster; um total de 373 amostras foram incluídos na análise final (n = 122, T = 251). A lista gene estatisticamente significativa com um FC 2,0 e

p

-valor de 0,05 foi utilizado para análise posterior. Um total de 12,079 genes foram identificados após as análises de U133 4134 mais 2,0 enquanto foram identificados a partir de U133A e 3438 do gene de genes U133A_2. acesso análise Microsoft através destas listas de genes revelou uma lista de 965 entidades de genes dos quais 64,46% (N = 622) entidades são concordantes entre os 3 fichas (585-se regulamentados e 37 para baixo regulamentada) (Arquivo S1A) e 35,54% (n = 343 ) dos genes mostraram tendências incompatíveis de regulação. Da mesma forma, uma avaliação da concordância e discordância na regulação realizada através das tecnologias apresentaram diferentes tendências (U133 Plus 2 Vs U133A Concordância = 76,53%; U133 Plus 2 Vs U133A_2 Concordância = 58,27%; U133A Vs U133A_2 Concordância = 86,11%).

as vias comuns entre as tecnologias foram identificadas por comparação de suas listas de percurso individual. A lista (N = 54) foi então ordenadas com base na percentagem de elementos emparelhados em relação ao número total de entidades pathway. Vinte e um caminhos foram identificados com 30% ou mais entidades compensadas em todos os 3 tecnologias, entre as quais a maioria deles são caminhos ciclo celular relacionados (S1B arquivo).

Na plataforma Agilent (G4112F 4x44k), 2 série, a partir da qual um total de 44 amostras (n = 18, T = 26) foram incluídos na análise final um total de 8493 genes (para cima e para baixo regulado) foram identificados a partir da análise (FC 2.0;

p

0,05); 338 deles sendo altamente significativa (

p Art 0,001), com diferenças de alterações alta dobragem (FC 25 vezes). Aplicando um corte de 50% das entidades correspondentes em o número total de entidades, foram identificadas 43 vias. Os caminhos mais significativos ( 65% das entidades combinadas) identificados foram a resposta inflamatória e organização da matriz extracelular (ECM) (S1C e Arquivo S1D) Análise

Cross-plataforma

A lista.. dos genes identificados em comum entre as duas plataformas revelaram um total de 402 genes (

p Art 0,05 e FC 2,0), dos quais 181 (45,03%; 13 para baixo regulado e 168 até regulamentada) foram concordantes e 221 (54,97%) discordante da tendência de regulamentação. A lista concordantes de 181 genes é fornecido no arquivo S2A. análise de ontologia gênica realizado para esta lista gene no banco de dados PANTHER para a classificação dos genes, indicou que nas funções moleculares, a categoria de ligação (GO: 0.005.488) mostrou representação máxima (28,5%; n = 49) com proteína e nucleico moléculas que são os principais componentes de ligação de ácido. Da mesma forma em processos biológicos, o celular (GO: 0.009.987; 20,10%; N = 75) e processo metabólico (GO: 0.008.152; 18,8%; n = 70) foram a maioria. 24,40% dos componentes celulares eram partes da célula (GO: 0.043.226) e regiões extracelulares (GO: 0.005.576). A maioria das classes de proteína foram identificados transportadores (PC00227) (9,30%; N = 21) e receptores (PC00197) (8,40%, N = 8) (Fig S1A)

As vias comuns (n. = 16) foram identificados através das duas plataformas com acesso à MS. Os caminhos mais significativos identificados foram aqueles associados com o comportamento do citoesqueleto, a biossíntese do colesterol e dos transportes IGF ( 70% de entidades combinadas em todas as plataformas). Oncostatina M de sinalização e de Adesão Focal foram as outras vias importantes que foram desregulados ( 25% de entidades combinadas em todas as plataformas). (S2B Arquivo)

banco de dados STRING análises identificaram uma rede de interações entre 122 genes da lista concordantes . A maior rede de interação consistiu de dois grandes grupos interligados com FBJ Murino osteossarcoma Viral Oncogene homólogo (FOS), Fibronectina 1 (FN1), Quinase Dependente de Ciclina 1 (CDK1), proteína de choque térmico 4 (HSPA4) 70 kDa e V-Myc Avian mielocitomatose (MYC) sendo os nodos de ligação (figura 2). A lista concordantes quando ainda analisadas para identificar os genes alvos experimentalmente validadas para a expressão de miRNA do banco de dados miRWalk2.0, duas grandes famílias de miRNA [

deixe

(N = 17) e

mir

( N = 47)] foram identificadas, que alvo mais do que 5 genes da lista (ficheiro S3).

Análise para interacção proteína-proteína através de rede STRING identificados dois grandes grupos de interligação com elevado grau interacções entre os genes ( N = 122). Estes 2 grupos principais eram interligadas pelos nós MYC, FN1, FOS e HSPA4. O número de linhas representam os níveis de prova, conforme indicado na legenda da cor. Os diferentes tamanhos do nó são baseados na medida de informação estrutural de proteína disponível para cada gene, enquanto as cores do nó são uma ajuda visual usado para uma melhor representação. Os marcadores desta análise selecionados para validação paciente são cercados.

TCGA Banco de Dados e Validação Experimental dos genes em CECP Pacientes

A lista de 181 gene foi cruzada comparação com o banco de dados TCGA ( https://www.cbioportal.org) para avaliar a mutação, número de cópias e mRNA status de expressão na coorte de cabeça e pescoço câncer (N = 300). Um total de 59 genes foram alterados em pelo menos 10% dos pacientes, enquanto um sub-conjunto de 6 genes [(gene celular Transformando epitelial 2 (

ECT2)

, Anoctamin 1

(ANO1)

, Tumor p63 Proteína

(TP63)

, Fas -Associated Via Morte Domínio

(FADD)

,

e Cap Nuclear Binding Protein Subunidade 2 Exostosin-1

(EXT1)

(NCBP2

)] foram alterados de, pelo menos, 30% das amostras nos níveis de mutação /CNV e ARNm (ficheiro S3 e S1B FIG). os 20 melhores genes com base nas alterações percentuais em TCGA estão listados em tabela 2.

validação experimental utilizando PCR em tempo real quantitativa (qPCR) foi levada a cabo num total de 34 amostras, incluindo tumores primários não tratados (Grupo I, n = 12), as amostras recorrentes (Grupo II; . N = 12) e controlos normais saudáveis ​​(n = 10) a maioria das amostras do grupo de pacientes (n = 24) eram do sexo masculino (75%; N = 18) e a partir do sub local da cavidade oral (83,3%; N = 20) com cancros avançados estágio IV (62,5%;. N = 15) a maioria dos pacientes estavam acima da idade de 40 anos (95,8%; N = 23) e 79,2% eram ou fumantes, chewers ou consumidores de álcool (N = 19). Os pacientes do grupo principal, quer de radiação foram submetidos após a cirurgia ou teve nenhum tratamento adjuvante. Cinco destes doentes desenvolveram recorrência durante o acompanhamento enquanto três ficaram livres da doença (Quatro pacientes foram perdidos para follow up) (S2 Tabela). Na coorte recorrente, os pacientes foram submetidos a quimioterapia e radioterapia antes do tratamento cirúrgico

Os genes para validação foram selecionados a partir da lista de 181 genes com base em vários critérios.; regulada negativamente mais de 5 vezes em 2 tecnologias [Placenta-Specific 8 (

PLAC8

) e Crystallin, Mu (

CRYM

)], nós dentro do banco de dados de string (

FOS

,

TTK

, ubiquitina conjugando enzima variante E2 2 (

UBE2V2) Comprar e Proteína Centrosomal 55 kDa (

CEP55

)] e subconjunto de genes com alterações em pelo menos 30% dos pacientes (mutação, CNV e de expressão) (

ECT2

,

ANO1

,

FADD

) em TCGA banco de dados. Todos os primers, quando validado mostrou uma eficiência que varia de 1,9 para 2,1 com sendo o percentual de eficiência de 93% a 110% (S2 Fig). a análise por RefFinder indicou que entre os genes de referência avaliados,

RPLP0

e

18SRNA

foram avaliadas como o mais estável ( média geométrica do ranking valores:

RPLP0

: 1,19,

18SRNA

: 1,41,

GAPDH

: 3.0 e

GUS

: 4,00) após a análise por múltiplos software (Delta CT, geNORM, Normfinder e Bestkeeper) (Fig S3). qPCR validação dos genes seleccionados (N = 9) foi, em seguida, levada a cabo utilizando o método de quantificação relativa usando a média geométrica dos dois genes de referência.

os marcadores mostraram tendências regulatórias em ambos os grupos eram semelhantes aos obtidos a partir da meta-análise (Fig 3A-3D). Seis dos genes mostrou validação mais de 70% nas amostras avaliadas;

PLAC8

(91,67),

UBE2V2

(87,5%),

ECT2

(72,2%),

FADD

(69,5%),

CEP55

(69,5%) e

TTK

(76,2%). A avaliação do estado de validação nas duas coortes indicaram que, embora todos os genes foram validados acima de 60% no Grupo I, apenas 4 genes mostrou uma validação semelhantes no Grupo II (

PLAC8

,

CRYM

,

ECT2

e

UBE2V2

). análise ROC dos marcadores na coorte 1 indicaram que

PLAC8

(AUC: 0,89),

FOS

(AUC 0,82),

ANO1

(AUC: 0,81) e

UBE2V2

(AUC: 0,82) tinha a maior associação com a doença (Figura 3E-3H)

quantitativa de perfil dos marcadores seleccionados a expressão do gene foi realizado no Grupo I (primário; a). e do Grupo II (recorrente; B) coorte.

PLAC8

e

UBE2V2

foram validados em todas as amostras (100%) do Grupo I no que diz respeito às tendências de regulação enquanto que outros genes mostrou tendência semelhante em 60% das amostras. No Grupo II, 60% dos pacientes apresentaram tendências de regulação concordantes por quatro genes. Com base no acompanhamento do paciente, o Grupo I foi sub-divididos em não-recorrente (C) e recorrente (D) e a expressão foi ainda avaliada. ROC análise da curva nos pacientes do Grupo I mostraram que

PLAC8

(E),

FOS

(F),

ANO1

(G) e

UBE2V2

(H) tinha maior associação com a doença (AUC 0,8). Bar representa a mudança vezes mediana de Normals.

Avaliação do estado HPV, utilizando p16 como marcador substituto, indicaram que entre os grupo de pacientes com amostras disponíveis (N = 20), 12 pacientes tiveram fraca ou sem coloração, enquanto o resto teve forte coloração moderada /de p16 (N = 8) (S4A-S4D Fig). Correlação dos genes com o status de HPV (com pontuação de HPV de 2-3 tomadas como positivo), indicou que o padrão de expressão global dos marcadores não mostraram qualquer associação com o estado HPV. análises individuais indica que entre os marcadores, apenas a

FADD

mostrou associação com a positividade de HPV; aumento da percentagem de doentes (83%) com fraca ou nenhuma coloração de HPV apresentaram alta expressão de

FADD

, em comparação com pacientes positivos para HPV. (57%, p = 0,03) (Fig S4E)

Correlação do perfil de marcador com resultado de tratamento

os marcadores foram correlacionados com o resultado do tratamento (recidiva no Grupo I e re-recorrência no Grupo II).

ANO1

apresentou a melhor eficácia (sensibilidade: 0,83, especificidade: 0,67) para a detecção de pacientes que não conseguem tratamento no grupo 1.

ANO1

também mostrou um aumento de 3 vezes na média de vezes da expressão no coorte recorrente (4/5) do Grupo I quando comparado ao grupo não-recorrente.

ECT2

(0,83),

FADD

e

UBE2V2

(1) também mostrou alta sensibilidade no Grupo I. No Grupo II 7/9 (

UBE2V2

,

CRYM

,

FADD

,

CEP55

,

PLAC8

,

TTK

e

FOS)

mostrou sensibilidade elevada (0,67 a 1) na detecção de falha do tratamento. Os outros marcadores mostrou baixa sensibilidade e especificidade (S3 Tabela) em ambos os grupos.

positividade HPV foi um bom prognosticador na coorte geral com 37% (3/8) que mostra a falha do tratamento, em comparação com 63% ( 7/11) em doentes negativos. No entanto, em combinação com FADD, o único marcador que mostraram associação significativa com o estado de HPV, FADD

altos pacientes /HPV-mostrou uma alta porcentagem de falha do tratamento (60%, 6/10), em comparação com FADD

baixo /HPV + pacientes (33%, 1/3).

Entre esses genes, apenas a

ANO1

e

FADD

mostrou associação significativa com a sobrevida global (OS) e livre de doença

Deixe uma resposta