PLOS ONE: Integrative Genomic Data Mining para a descoberta de Potencial Blood-Borne Biomarkers para Diagnóstico Precoce do Câncer

Abstract

Fundo

Com a chegada da era posgenômico, há um crescente interesse na descoberta de biomarcadores para o diagnóstico preciso, prognóstico e detecção precoce do câncer. marcadores de cancro transmitidas pelo sangue são favorecidos pelos clínicos, porque as amostras de sangue podem ser obtidas e analisadas com relativa facilidade. Temos usado uma estratégia de mineração combinado com base em uma plataforma integrada microarray câncer, Oncomine, eo módulo biomarcador do programa Ingenuity Pathways Analysis (IPA) para identificar potenciais marcadores à base de sangue por seis tipos comuns de câncer humano.

metodologia /Principais achados

na plataforma Oncomine, os genes sobre-expressos em tecidos de câncer em relação aos seus tecidos normais correspondentes foram filtrados por palavras-chave Gene ontologia, com o ambiente extracelular estipulado e um

Q

valor corrigido (taxa de detecção falsa) de corte implementada. Os genes identificados foram importados para o módulo biomarcador IPA para separar os genes que codificam as proteínas secretadas ou de superfície celular putativos como marcadores (sangue /soro /plasma) de câncer transmitidas pelo sangue. Os indicadores potenciais filtradas foram classificados e priorizados de acordo com normalizada Student absoluta

t

valores. A recuperação de numerosos genes marcadores que já estão clinicamente útil ou sob investigação ativa confirmaram a eficácia da nossa estratégia de mineração. Para identificar os biomarcadores que são únicos para cada tipo de cancro, os genes marcadores que são regulados positivamente em comum entre cada dois tipos de tumor nos seis tumores humanos, também foram analisados ​​por a função de comparação biomarcador IPA.

Conclusão /Significância

os genes marcadores upregulated partilhados entre os seis tipos de cancro podem servir como uma ferramenta molecular para complementar a exame histopatológico e a combinação dos biomarcadores comumente regulados positivamente e únicas podem servir como marcadores de diferenciação para um cancro específico. Esta abordagem será cada vez mais útil para descobrir assinaturas de diagnóstico como a massa de dados microarray continua a crescer na era como a genómica

Citation:. Yang Y, Iyer LK, Adelstein SJ, Kassis AI (2008) Integrative Genomic Mineração de dados para Descoberta de Potencial Blood-Borne Biomarkers para Diagnóstico precoce de Câncer. PLoS ONE 3 (11): e3661. doi: 10.1371 /journal.pone.0003661

editor: Oliver Hofmann, Harvard School of Public Health, Estados Unidos da América

Recebido: 04 de agosto de 2008; Aceite: 16 de outubro de 2008; Publicação: 06 de novembro de 2008

Direitos de autor: © 2008 Yang et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este trabalho foi apoiado em parte pelo Departamento de Defesa subsídios (para AIK) W81XWH-06-1-0043, imagens radiológicas e Radioterapia do câncer de próstata; W81XWH-04-1-0499, Radiodetection e Radioterapia do cancro da mama; e W81XWH-06-1-0204, Radiodiagnóstico e Radioterapia do cancro do ovário

Conflito de interesses:.. Os autores declararam que não existem interesses conflitantes

Introdução

Atualmente, há uma necessidade continuada para a descoberta de biomarcadores de sangue específicos para auxiliar na detecção não invasiva do câncer e o acompanhamento da eficácia da terapia de câncer [1] – [3]. Os biomarcadores são moléculas que são indicadores do estado fisiológico e características de mudança de um tecido ou de um fluido corporal, durante um processo de doença [3]. biomarcadores de câncer no sangue são produzidos por células tumorais e secretada ou liberados na corrente sanguínea dos pacientes [2]. A medição de biomarcadores no sangue é um procedimento não invasivo e relativamente simples de executar, sem requisitos para instrumentos especiais e pessoal.

Em ritmo com a era pós-genômica, tecnologias avançadas, incluindo análise genômica e proteômica facilitaram a descoberta de biomarcadores de câncer eficazes [4] – [7]. Uma vantagem das análises genómicas à base de microarranjos de alta produtividade é a capacidade para identificar um grupo ou agrupamento de genes sobre-expressos em tecidos ou fluidos corporais que codificam proteínas putativas segregadas ou de superfície celular [5], [6], [8]. No entanto, o processo de mineração na análise baseada em microarray normalmente exige em profundidade habilidades estatísticos e analíticos e representa um desafio para os pesquisadores que não possuem os conhecimentos necessários [9]. Este artigo propõe e apresenta um método de mineração biólogo amigável e eficaz à base de microarray que facilita essa descoberta de biomarcadores.

Recentemente, descrevemos uma estratégia de mineração rápida e sistemática para identificar genes que codificam overexpressed hidrolases putativos adequado para nossa in-house Enzyme-Mediated cancro de imagem e terapia tecnologia (EMCIT), uma abordagem que visa hidrolisar e precipitar pró-fármacos radioactivos, solúveis em água no interior do espaço extracelular de tumores humanos sólidos para terapia de diagnóstico não invasivo ou [10] – [12]. Aqui, nós aplicamos uma estratégia de mineração que permite a descoberta de potenciais marcadores de câncer transmissíveis pelo sangue em seres humanos com base na combinação de uma plataforma de microarray câncer integrado, Oncomine [13], e a capacidade de filtragem biomarcador romance de Análise Ingenuity Pathways (IPA) 5.0 programa [14]. Para identificar genes que codificam as proteínas da superfície celular putativos segregados ou no sangue /soro /plasma humano como marcadores de cancro potencial, todos os genes sobre-expressos no ambiente extracelular das células cancerosas em relação à de células normais correspondentes foram filtrados e recuperados a partir do banco de dados Oncomine e depois importado e analisados ​​pelo módulo biomarcador do programa de análise de IPA. A aplicação do presente método de mineração levou à identificação de centenas de biomarcadores em tumores humanos: próstata (224), da mama (176), pulmão (244), do cólon (57), dos ovários (292), e pâncreas (147). A abordagem também permitiu a classificação e priorização dos genes marcadores potenciais identificados para superexpressão de acordo com a Student absoluta normalizada

t

valores.

Observou-se já que a expressão de marcadores tumorais comuns relacionadas com universal processos oncogénicas é estável e pouco provável que seja afectado pela progressão natural do cancro [15]. Portanto, a identificação de marcadores tumorais comuns ubiquamente expressa por alguns tipos de cancro podem aumentar a sensibilidade e especificidade da avaliação histopatológica convencional e pode servir a prática geral de segregar maligna de condições benignas independentemente das taxionomias individuais [16]. Consequentemente, determinou-se os biomarcadores em comum entre cada dois tipos de câncer. A análise de comparação em seis diferentes tumores humanos conduziu à detecção de 20 a 134 batidas como biomarcadores comuns entre cada dois tipos de cancro, sugerindo que a inter-relação de múltiplas vias oncogénicos. Estes marcadores identificados podem ser utilizados como ferramentas de grandes patologia molecular após análise de validação. Finalmente, tendo em conta os biomarcadores comuns, fomos capazes de identificar entre 3 e 59 biomarcadores potencialmente únicos por tipo de câncer. Isto é sem precedentes desde uma das desvantagens chave para biomarcadores actuais é que a maioria deles não são específicas para um tipo de cancro, o que pode facilmente levar a falsos positivos na detecção precoce do cancro. Por exemplo, o nível de soro de antigénio específico da próstata (PSA), para o rastreio do cancro da próstata também foi encontrada em níveis elevados em pacientes com tumores da mama ou do pulmão, levando a falha de 70% de detecção precoce do cancro da próstata [17], [18]. A especificidade limitada e sensibilidade de biomarcadores de diagnóstico precoce atuais tem muito restrito a sua fiabilidade. Portanto, o nosso método de mineração poderia servir como uma estratégia geral para descobrir indivíduo mais eficaz ou marcadores específicos agrupados para o câncer, esperamos alcançar o objectivo clínica da triagem para a detecção precoce e específico. Para nosso conhecimento, este é o primeiro estudo a examinar com um

in silico

genes marcadores abordagem regulada genômicas exclusivo para um tipo de câncer.

A estratégia de mineração Materiais e Métodos

dados para a descoberta de biomarcadores de câncer é baseado em nossa metodologia recentemente publicado explorar a plataforma de microarray câncer, Oncomine, e empregando as bases de conhecimento avançados da Ingenuity Systems, Ingenuity Pathways Analysis, para identificar hidrolases extracelulares em vários tipos de câncer (resultados não publicados). Oncomine [13] foi escolhido porque é uma plataforma de microarray câncer pública incorporando 264 conjuntos de dados de microarranjos independentes, totalizando mais de 18.000 experiências microarray, que abrangem 35 tipos de câncer. Ele unifica um grande compêndio de outros dados de microarranjos câncer publicados, incluindo Gene Expression Omnibus (GEO) [19] e Stanford Microarray banco de dados (SMD) [20], e unicamente fornece análises de expressão diferencial comparando a maioria dos principais tipos de câncer com seus respectivos tecidos normais . Por exemplo, para identificar genes potencialmente importantes num cancro particular, os utilizadores podem efectuar um “cancro vs normal” de análise para um dado tipo de cancro e os genes que são regulados positivamente em cancro relativamente ao seu tecido normal pode ser recuperada como uma lista. Cada gene overexpressed na lista pode então ser avaliado pela Student

t

teste para calcular o

P

ou

Q

valores (taxa de detecção falsa) [21] – [ ,,,0],23], os valores médios de expressão (média de 1, significa 2), eo estudante normalizada

t

valor. Além disso, Oncomine é integrado com o filtro de anotações Gene Ontology (GO), que permite aos usuários identificar genes com certos processos biológicos, funções moleculares, ou localizações celulares.

Cada um dos seis tipos de tumores humanos (próstata, mama , pulmão, cólon, ovário, pâncreas e) foi utilizado na pesquisa de perfil função

> na base de dados para encontrar Oncomine os conjuntos de dados de microarray disponíveis relacionados com o tipo de cancro específico. O tipo de análise

> foi então aplicado para filtrar os conjuntos de dados de microarray explorando o cancro relativamente ao seu tecido normal. Em seguida, Gene Ontology (GO) palavras-chave de anotação implicando o ambiente extracelular foram usadas para remover esses genes não regulados no câncer. Especificamente, os genes regulados positivamente associados com os seguintes termos GO foram pesquisados:

>,

>,

>,

>, e

>. Cada GO prazo anotação foi concebido e consultados na base de dados GO [24], para distribuir o maior número de visitas relevantes susceptíveis de codificar proteínas secretadas ou de superfície celular. Em seguida, um corrigida taxa de descoberta false

Q

limiar -valor (

Q

≤0.05) foi usado para filtrar e recuperar os genes extracelularmente-sobre-expressos com um alto nível de confiança de regulação positiva. genes regulados positivamente com um

Q

valor menor que 0,05 só foram mantidos na lista, para posterior análise e filtragem (incluindo o redundante que foi removido na etapa de filtragem mais tarde).

Organização do Genoma Humano ( HUGO) identificadores de genes foram então usados ​​para exportar as listas de genes, no formato Microsoft Excel, no programa Ingenuity Pathways Analysis (IPA) [14], um aplicativo que foi construída sobre uma base de conhecimento ampla adquirida pela curadoria manual dos textos completos de publicações científicas com revisão por pares, abrangendo informações sobre mais de 500.000 genes de mamíferos ou proteínas, conceitos moleculares, e milhões de suas interações via. IPA biomarcador é um módulo dentro do novo programa Engenho Acesso Análise 5.0, que permite que o (i) a identificação e definição de prioridades dos candidatos de biomarcadores mais promissoras e importantes, de acordo com as características que o tornam um produto do gene de um biomarcador biologicamente plausível (um gene ou o seu produto de codificação tem para ser ligado intimamente com a patologia da doença ou é sobre uma via que está estreitamente relacionada com o efeito de um tratamento) (ii) determinação de se um gene ou proteína particular é detectável nos fluidos do corpo, e (iii) avaliar se o biomarcador candidato tem uma forte associação com processos de doenças como o câncer. Os genes sobre-expressos recuperados foram importados para o módulo biomarcador IPA, o redundante foi resolvida, e foram identificados os genes que codificam marcadores plausíveis associadas ao câncer. Estes biomarcadores foram ainda filtrada no módulo de filtro de biomarcador IPA com base nos seguintes critérios: fluido – doença

> sangue ou

>, –

> câncer, espécies –

> humana. Estes marcadores à base de sangue filtrado foram então classificados e priorizados pela abs (

t

) valor, onde

t

é o Student normalizada

t

valor de teste em Oncomine, a reflectir a alteração quantitativa do nível de expressão entre o cancro e o seu tecido normal, semelhante ao valor de dobragem de mudanças em experiências microarray. O conjunto final de marcadores à base de sangue foi exportado e armazenados em uma planilha do Microsoft Excel (veja S1 arquivo Suplementar) contendo o nome do produto do gene, sinônimos, abs (

t

) valor, descrição, HUGO símbolo gene, expressão em fluidos corporais, localizações subcelulares IPA-definidos, tipos de doença, e da família de proteínas.

a análise detalhada de visitas de proteína resultante foi realizada retrospectivamente usando iHOP (informação hiperlinks mais proteínas) [11], [25], um programa que encontra as ligações e artigos citados a genes /proteínas e identifica o produto gene particular se o nome do gene ou sinônimo nome é conhecido. Resultantes marcadores à base de sangue foram verificados e consultado, observando-se as referências da literatura associados ou publicações originais. Finalmente, a precisão dos resultados foi avaliada usando marcadores de câncer de controle seja escolhida como marcadores candidatos por outros estudos ou bem conhecido por ser clinicamente útil.

comparação IPA biomarcador é outra função dentro do módulo biomarcador IPA, que tem a capacidade de gerar uma lista de biomarcadores candidatos comuns em doenças diferentes [14]. O programa pode maximamente comparar os candidatos a biomarcadores para doenças em simultâneo três. Os biomarcadores filtradas para cada um dos seis tipos de tumor a partir do passo anterior foram assim importado e comparados entre cada dois tipos de tumor para determinar os biomarcadores comuns. Os biomarcadores comuns recuperadas nos seis tipos de tumores humanos foram então usados ​​para determinar os candidatos a biomarcadores únicos por tipo de câncer pelo método de exclusão.

Resultados e Discussão

A estratégia geral de mineração para a descoberta de biomarcadores relataram aqui é flexível na natureza. Pesquisadores podem variar os critérios de filtragem de dados de acordo com seus próprios interesses. Por exemplo, na primeira etapa do processo de mineração (veja a Figura 1), eles podem optar por filtrar um ou genes “upregulated” “reprimidos” para identificar marcadores para o diagnóstico ou o que escolher para filtrar “diferencialmente expressos” genes em vários graus tumorais ou estágios para descobrir marcadores prognósticos. Na segunda etapa, pode-se escolher para filtrar biomarcadores elegíveis, em diferentes fluidos biológicos (tais como saliva, lágrimas, e urina) e diferentes espécies (tais como ratinhos e ratos). Além disso, os pesquisadores podem variar o banco de dados de genômica e o programa de análise de caminho. Embora nosso principal interesse é identificar marcadores de câncer humano, acreditamos que esta estratégia de mineração podem ser amplamente aplicada para identificar marcadores para a maioria dos outros tipos de doenças.

placas Microarray no topo representam seis tipos de tecidos procurou na plataforma Oncomine , incluindo próstata, mama, pulmão, cólon, ovário, e pâncreas. Passo 1: overexpressed genes do câncer em relação ao seu tecido normal correspondente foram filtrados por termos ir e

Q

valor de corte. Passo 2: marcadores transmitidos pelo sangue foram filtrados por

>,

>,

> câncer e

> humana no módulo biomarcador de programa do IPA. forma trapezoidal no meio representa biomarcador capacidade de filtragem de programa de análise de IPA. Passo 3: marcadores comuns foram determinados entre cada dois tipos de tumor. Passo 4: Foram identificados marcadores únicos para cada tipo de câncer

Identificação de marcadores de câncer elegíveis

A mineração de dados, de 4 a 15 conjuntos de dados de microarranjos a partir da plataforma Oncomine de genes sobre-expressos em seis humano. cancros em comparação com a sua expressão nos tecidos normais levaram à identificação de uma lista de 3.064 a 19.645 perfis de expressão do gene regulado positivamente por tipo de cancro. Fomos mineração de genes regulados positivamente porque uma das hipóteses que prevalece é que os biomarcadores mais promissores serão genes overproduced ou seus produtos de proteína [26], [27] (isso pode não ser geralmente verdade, e outros pesquisadores podem optar por genes minas subregulado para a sua finalidade específica). Idealmente, os marcadores tumorais transmitidas pelo sangue iria ser secretada ou de outra forma derramado para o sistema circulatório durante a tumorigénese. Podiam ser segregada pelas células tumorais ou libertado a consequente fragmentação de células de tumor (Figura 2). Portanto, temos procurado por genes regulada por uma combinação de palavras-chave Gene Ontologia controlados para implicar o ambiente extracelular (veja

Materiais e Métodos

) em células cancerosas, incluindo as proteínas codificadas vinculados ou integrados nas membranas celulares, mas cujos domínios extracelulares pode ser encontrada através de derramamento na circulação. Quando os genes recuperados foram ainda filtrada pela taxa de detecção falsa corrigido

Q

(

Q

≤0.05), entre 211 e 2.782 genes por tipo de câncer foram overexpressed no meio extracelular de células cancerosas ( incluindo o redundante). Nós usamos um rigoroso corrigido taxa de detecção falsa do valor de corte para selecionar genes significativamente upregulated e evitar falsas predições decorrentes de variação experimental em diferentes estudos. Estes genes regulados positivamente foram importados para o módulo de análise de biomarcador IPA e entre 165 e 961 genes foram identificados como marcadores candidatos elegíveis por tipo de câncer (Tabela S1).

Identificação de marcadores de câncer transmitidas pelo sangue

os marcadores elegíveis que recuperados a partir da análise de biomarcadores IPA incluídos aqueles marcadores regulados positivamente nos tecidos ou fluidos biológicos de pacientes com cancro. Em seguida, nós filtrado os marcadores transmitidas pelo sangue, porque eles têm duas grandes vantagens sobre outros tipos de indicadores. Em primeiro lugar, as células de sangue comunicar com as células e matrizes extracelulares, em quase todos os tecidos e órgãos no corpo. Assim, os perfis de glóbulos de expressão de genes podem reflectir a presença da doença no corpo [2], [3]. Em segundo lugar, a coleta de amostras de sangue é menos invasiva e mais segura, permitindo um tamanho de amostra maior e amostragem repetida para monitorar a progressão da doença. A partir do módulo de filtro IPA biomarcador, entre 57 e 292 (sangue /plasma /soro) marcadores transmitidas pelo sangue foram identificados por tipo de câncer humano (ver genes identificados em Suplementar S1 Arquivo). Ao examinar IPA e IHop bases de conhecimento [11], [25], determinou-se que a maioria dos marcadores tumorais transmitidas pelo sangue são secretadas, ou de glicosilfosfatidilinositol (GPI) proteínas de membrana ancorada e integral. A detecção da sua regulação positiva em amostras de sangue do paciente pode desencadear o tratamento mais cedo, antes do crescimento do tumor [2] – [4]. Além disso, estas assinaturas regulada positivamente pode ser explorada para compreender as vias relacionadas com o cancro humano e desenredar as associações entre tumores diferentes. Embora o mecanismo funcional de condução dos diferentes perfis de expressão de genes no sangue de pacientes com ou sem cancro é claro, a potencial utilidade clínica destes genes ou os seus produtos de proteína está a emergir. Como controles, listamos abaixo alguns marcadores derivados do sangue, identificado por nosso trabalho, que também foram selecionados por outros estudos como marcadores tumorais candidato ou já estão sendo usadas clinicamente,

leucemia eritroblástica viral homólogo oncogene 2 (ErbB2).

ErbB2 é comumente referido como HER-2 /

neu

por clínicos [28]. É um receptor de tirosina-quinase da membrana celular-ligada à superfície que está normalmente envolvido na via de transdução do sinal que conduz ao crescimento celular e diferenciação [29]. No nosso estudo, identificaram-ErbB2 como um biomarcador transmitidas pelo sangue e universal para cinco cancros (da próstata, da mama, do pulmão, dos ovários, e pâncreas). Isto é consistente com as conclusões de que a amplificação deste gene ou a sobre-expressão do seu produto de proteína está associada com cancros, incluindo mama, pulmão, ovário, pâncreas e [28] – [31]. Em particular, a amplificação de

gene ErbB2

foi encontrado em 25% a 30% do cancro da mama, e foi formalmente aprovados pela FDA como um biomarcador de soro para o diagnóstico de cancro da mama [30]. Para o nosso conhecimento, a sobre-expressão de

gene ErbB2

não foi relatado para o câncer de próstata.

O cancro da mama 1/2, início precoce (BRCA1 /BRCA2).

BRCA1

e

BRCA2 Quais são genes diretamente envolvidos no crescimento celular, divisão e reparação de DNA danificado. As variações quer do gene ou seus produtos proteicos têm sido implicados na próstata, da mama, e cancro do ovário [32]. Existe também uma forte evidência para sugerir que ambos os genes podem ser utilizados como marcadores de previsão para o tratamento de cancro da mama e cancro do ovário [32] – [35]. Encontrámos ambos os genes como potenciais marcadores nestes três tipos de tumores, bem como cancro do pulmão. A sobre-expressão de dois genes em quatro cancros humanos pode sugerir que eles estão envolvidos em um fenômeno generalizado ou mecanismo funcional em pacientes com esses tipos de câncer.

antigénio específico da próstata (PSA).

PSA, também conhecido como calicreína III (KLK3), é uma proteína produzida pelas células da glândula da próstata e que muitas vezes é elevada na presença de cancro da próstata ou outros distúrbios da próstata [17], [18]. É um biomarcador soro bem conhecida e medição do nível de PSA do soro é o teste mais eficaz actualmente disponíveis para a detecção precoce do cancro da próstata [36]. Consistente com outros achados experimentais [37], foram identificados PSA como um marcador sérico para alguns tipos de tumores, incluindo próstata, mama e cancro do pulmão, o que indica que a PSA não é-câncer de próstata específico.

Ácido hialurônico de ligação proteína 2 (HABP2).

HABP2 é um membro da família de protease de serina que é encontrada no plasma /soro e demonstrou desempenhar um papel importante na invasão e metástase [38] do cancro. Um tempo real transcriptase reversa de reacção em cadeia da polimerase (RT-PCR) rastreio estudo demonstrou a sobre-expressão específica do

HABP2

gene no adenocarcinoma de pulmão, entre seis genes marcadores candidata para a detecção de cancro de pulmão de células não pequenas [ ,,,0],39]. Foram identificados dois destes genes marcadores de seis candidatos,

HABP2

e

CP

(ceruloplasmina), como potenciais genes marcadores de soro para o cancro do pulmão, demonstrando a utilidade da nossa estratégia de mineração na determinação novela, potencialmente , marcadores sanguíneos clínicos úteis para cancro humano.

insulin-like factor II (IGF-II).

IGF-II codifica para um membro da família da insulina de factores de crescimento de polipéptido que são crescimento implicado na patogénese da neoplasia em vários tecidos [40], [41]. Curiosamente, a nossa abordagem mineração identificado IGF-II, tal como um potencial marcador sérico para o peito, pulmão e cancro do ovário. Ele foi identificado por uma experiência recente microarray da proteína com base em um exame de sangue como um dos quatro marcadores séricos para discriminar entre os grupos saudáveis ​​e pacientes com câncer epitelial de ovário (EOC) [42]. Neste estudo proteômica, nível de proteína IGF-II é reduzida em pacientes com EOC comparados com controles saudáveis, ao passo que em nosso mineração microarray de genes é regulada no cancro do ovário. Estes resultados indicam que estudo microarray gene isolado pode ser insuficiente e um estudo mais rigoroso envolvendo experiências proteómica ou microarrays de anticorpos são necessários para validar os marcadores candidatos no nível de expressão da proteína. No entanto, nosso estudo é consistente com outros achados que a regulação positiva do nível de IGF-II pode ser usado para diagnosticar mama [43], [44] e pulmão [45] cânceres.

identificação de biomarcadores tumorais comum

os marcadores de tumor partilhados entre cada dois tipos de tumores entre os seis tumores humanos foram analisados ​​por análise da função de comparação biomarcador do programa de IPA e estão resumidos na forma de matriz (Figura 3; ver suplementar S2 do ficheiro). O câncer de ovário tem a maioria dos marcadores em comum com próstata (113), de mama (107), e câncer de pulmão (134) entre os 15 pares diferentes de câncer, possivelmente porque identificamos câncer de ovário como tendo o maior número de biomarcadores transmitidas pelo sangue (292) ( consulte a Tabela S1) entre os seis tipos de câncer. No entanto, estas sobreposições notável entre diferentes tipos de cancro indicam que a maioria dos genes marcadores candidatos podem ser, de facto, estreitamente relacionadas com múltiplas vias oncogénicos da metástase do cancro. Um dos gargalos na descoberta de marcadores de câncer apropriadas é uma compreensão pobre da fisiopatologia da doença [26], [27], [46]. Como tal, a sobre-expressão universal de marcadores comuns em diferentes cancros humanos pode ajudar na compreensão e descobrir os mecanismos funcionais generalizados de crescimento do tumor e invasão. Além disso, os genes marcadores comumente upregulated pode ajudar a relacionar os marcadores relevantes para a patogênese de um câncer em particular enquanto qualquer correlação com outros tipos de câncer podem sugerir novas estratégias de segmentação terapêuticas. Além disso, marcadores comuns pode ser útil para aumentar a sensibilidade e a especificidade da avaliação convencional. Por exemplo, os biomarcadores universal identificado poderia ser usado por patologistas para descobrir invasão câncer quando avaliação histológica abrangente é insuficiente [15]. Para testar a hipótese de que os marcadores comuns partilhadas por vários tipos de tumores pode ser usado para distinguir entre as condições benignas /malignas, foi determinado o conjunto comum de marcadores através da próstata, da mama e cancro do pulmão (ver “suplementar S3 Ficheiro – próstata, mama, e pulmonar markers.xls comum “). Surpreendentemente, após consulta manualmente o banco de dados iHOP e base de dados de conhecimento IPA, 13 marcadores dos 35 marcadores comuns (~ 1/3) foram-literatura confirmado para servir como marcadores de prognóstico para a progressão e invasão de tumores humanos (Tabela S2). Embora não haja evidências diretas de que o resto dos 22 marcadores comuns podem diferenciar entre condições benignas /malignos, acreditamos que todos eles podem estar envolvidos na metástase do câncer.

a

a comparação dos biomarcadores entre o mesmo tipo de tecido não está disponível.

b

A sobreposição por cento dos marcadores comuns entre cada dois tipos de câncer é fornecido entre parênteses.

identificação de biomarcadores tumorais únicas

Ao examinar a comum biomarcadores entre cada dois tipos de câncer, observou-se 3 a 59 biomarcadores exclusivos para cada tipo de câncer (Tabela S1, Figura 4, ver suplementar S2 arquivo). Com efeito, menos de vinte por cento do total de biomarcadores baseados no sangue identificados por tipo de cancro são únicos. Alguns dos biomarcadores aqui relatados foram sugeridos como biomarcadores putativos específicos por outros estudos. Por exemplo, a leptina (LEP), uma hormona proteica com efeitos importantes na regulação do metabolismo do corpo, tem sido relatado como um dos quatro marcadores específicos no soro para detecção precoce do cancro do ovário [42]. Nosso estudo confirma seu potencial como um marcador transmitidas pelo sangue exclusivo para câncer de ovário. Do mesmo modo, foram identificados metaloproteinase de matriz-2 (MMP-2) como um biomarcador específico para o cancro do pâncreas, consistente com os resultados experimentais que mostram que a sua regulação positiva, em comparação com a de outras metaloproteinases, parece particularmente importante no crescimento e disseminação do cancro pancreático [ ,,,0],47] – [49]. Acreditamos que estes biomarcadores únicos poderiam ser combinadas para produzir um painel de marcadores que poderiam melhorar a selectividade e sensibilidade para o diagnóstico precoce do câncer.

eixo Horizonal da trama é tipo de tumor, incluindo próstata, mama, pulmão, cólon, ovário e pâncreas cancros. eixo vertical à esquerda é o número de marcadores únicos identificados para cada um dos seis tipos de câncer, representada por colunas vermelhas na trama. eixo vertical à direita é a porcentagem marcador exclusivo do total de marcadores transmitidas pelo sangue identificados por tipo de câncer, representada por colunas verdes na trama.

Identificação de genes marcadores topo do ranking promissores

Outro aplicação da nossa estratégia de mineração é a priorização (de acordo com

t

valores) de genes marcadores overexpressed topo do ranking com evidência biológica implicando seu significativo papel no cancro. Anteriormente pouca atenção tem sido dada ao seu potencial como marcadores candidatos ou foram perdidas simplesmente por causa do desafio na validação de um grande conjunto de genes candidatos. Estes genes marcadores de topo do ranking são importantes porque eles são sobre-expresso quantitativamente mais do que os outros genes marcadores e, assim, aumentar a sensibilidade do diagnóstico do cancro. Aqueles cientistas interessados ​​em descobrir marcadores de câncer pode ainda analisar e validar esses marcadores candidatos para torná-los clinicamente útil [26], [27]. Como exemplos, temos listados abaixo quatro genes mais bem classificados identificados em nosso estudo.

Matrix metaloproteinase-1 (MMP-1) para o cancro da mama.

MMP-1 é uma zinco-ion peptidase liga�o ao secretado no espaço extracelular e envolvida na quebra da matriz extracelular. A sobre-regulação de ARNm de MMP-1 e os níveis elevados de sua proteína têm sido observadas em vários cancros [50]. No entanto, no passado, a maioria dos estudos têm-se centrado no seu significado de diagnóstico para o cancro do pulmão [51] ou o seu significado prognóstico para cancro colorrectal [52]. Notavelmente, o nosso estudo identificou MMP-1 como o gene marcador mais regulada positivamente para o cancro da mama, abrindo a possibilidade, depois de follow-up estudos de validação, para a sua utilização como um marcador preditivo putativa no rastreamento de câncer de mama.

CD44 para o cancro colorectal.

CD44

codifica uma glicoproteína de superfície celular envolvido em interações célula-célula, adesão celular e migração. Esta proteína participa numa grande variedade de funções celulares, incluindo a activação de linfócitos e a metástase do tumor [53]. Nas bases de conhecimento do IPA e do banco de dados iHOP, há provas que implicam a expressão desta proteína no cancro colorectal [53], [54]. Identificamos

CD44

como o gene marcador mais regulada positivamente para câncer de cólon entre 57 biomarcadores putativos. Assim, CD44 poderia ser outro marcador diagnóstico promissor para o rastreio do cancro colo-rectal.

ceruloplasmina (CP) para câncer de ovário.

CP

codifica uma metaloproteína extracelular que se liga a maior parte do de cobre no plasma e regula a homeostase de ião de ferro-celular na circulação [55]. No passado, pouca atenção foi dada ao seu papel na neoplasia humana, embora tenha sido suspeitado que a expressão da proteína ceruloplasmina está relacionada com o cancro do ovário [56].

Deixe uma resposta