PLOS ONE: Droga Reposicionamento para o cancro da terapia baseada em Grande Escala da droga Induzida transcricional Signatures

Abstract

O

in silico

abordagem genômica químicos é desenvolvido para prever drogas reposicionamento candidatos (DR) para três tipos de câncer: glioblastoma, cancro do pulmão e cancro da mama. Ele baseia-se num recente conjunto de dados em grande escala de ~ 20000 perfis de expressão induzida por drogas em várias linhas celulares de cancro, que fornece i) um impacto global da perturbação da transcrição de ambos os alvos conhecidos ou desconhecidos fora de alvos, e ii) as informações rico em droga de modo de ação. Em primeiro lugar, o perfil de expressão induzida por drogas é mostrado mais eficaz do que outra informação, tal como a estrutura de drogas ou de destino conhecida, utilizando vários conjuntos de dados de HTS como referência imparciais. Em particular, a utilidade do nosso método foi demonstrado de forma robusta na identificação de novos candidatos DR. Em segundo lugar, nós previmos 14-alta pontuação candidatos DR exclusivamente com base em assinaturas de expressão. Oito dos catorze drogas mostrou actividade anti-proliferativa significativa contra glioblastoma;

i

.

e

., Ivermectina, trifluridina, astemizole, amlodipina, maprotilina, apomorfina, mometasona, e nortriptilina. O nosso marcador DR fortemente correlacionada com a dos resultados experimentais de base celular; os sete primeiros candidatos DR foram positivas, que corresponde a um enriquecimento de aproximadamente 20 vezes em comparação com HTS convencionais. Apesar de diversas indicações originais e alvos conhecidos, as vias perturbados dos candidatos DR ativos apresentam cinco padrões distintos que formam grupos apertados em conjunto com um ou mais medicamentos contra o câncer conhecidos, sugerindo mecanismos de nível transcriptoma comum de atividade anti-proliferativa.

citação: Lee H, Kang S, Kim W (2016) drogas Reposicionamento para o cancro da terapia baseada em Grande Escala da droga Induzida transcricional Assinaturas. PLoS ONE 11 (3): e0150460. doi: 10.1371 /journal.pone.0150460

Autor: Enrique Hernandez-Lemus, Instituto Nacional de Medicina Genômica, México |

Recebido: 10 de novembro de 2015; Aceito: 15 de fevereiro de 2016; Publicação: 08 de março de 2016

Direitos de autor: © 2016 Lee et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Data Availability:. Todos relevante os dados estão dentro do papel e seus arquivos de suporte de informação

Financiamento:. WK foi apoiado pela Fundação Nacional de Pesquisa (NRF) concessão (NRF-2014R1A2A2A01007166) e do Programa de Inovação Tecnológica (10.050.154), financiado pelo Ministério do Comércio, indústria Energia da Coreia

Conflito de interesses:. Os autores declararam que não existem interesses conflitantes

Introdução

Droga reposicionamento (DR) refere-se à identificação de novos indicações para existente. drogas [1] e é considerada uma via eficaz para o desenvolvimento de drogas, pois reduz os custos e ignora as preocupações de segurança. No entanto, a descoberta de novas indicações com DR é altamente exigente, mesmo com o bem-estabelecida de alta Throughput Screening (HTS), por causa das numerosas combinações de ambos os ensaios e drogas [2]. Devido a estas limitações, drogas mais reposicionados foram desenvolvidos por acaso.

In silico

DR é considerada uma rota alternativa e eficiente de estabelecer novas conexões entre doenças e medicamentos existentes [3,4]. Avanços em sistemas de abordagens farmacologia e o crescimento de informações sobre drogas-alvo têm aumentado o sucesso do

in silico

DR [5,6]. Uma ampla gama de conjuntos de dados tem sido utilizada, tais como conjuntos relacionados com a estrutura química [7,8], a relação droga-alvo [9], e informações fenotípicas, incluindo efeitos colaterais dos medicamentos [10-14]. Por exemplo, Cheng

et al

. sinvastatina e cetoconazole como agentes anti-proliferativos potentes no cancro da mama identificado por análise de uma rede de droga-alvo [15]. Particularmente, em larga escala de dados genômicos químicos, tais como o mapa de conectividade ou CMAP [16], forneceram informações ricas sobre os modos-de-ação de drogas que são refletidas nas respostas transcriptomic devido à perturbação química. No entanto, os utilitários relativos de diferentes conjuntos de dados não foram rigorosamente avaliados porque o conjunto composto de CMAP não era grande o suficiente para a análise estatística integrativa.

A última versão do CMAP consiste em perfis de expressão gênica de cinco linhas de células tratadas com ~ 1.300 compostos, a partir do qual muitos

in silico

métodos DR foram desenvolvidas utilizando este conjunto de dados, quer isoladamente ou em combinação com outras informações [17-25]. A correlação negativa da expressão do gene com uma doença levou à identificação de topiramato para o tratamento da doença inflamatória do intestino (IBD) e cimetidina para o tratamento de adenocarcinoma do pulmão [19,20]. Iskar

et al

. revelaram ainda mais os modos de acção para múltiplas drogas usando módulos de expressão induzida por drogas conservados entre humanos e ratos. Recentemente, uma versão semelhante, mas altamente expandida de um conjunto de dados genômica química foi liberada ao público pelo programa LINCS NIH (Biblioteca de assinaturas celulares baseados em Rede Integrada). Este conjunto de dados consiste de assinaturas de gene de expressão e ligação às proteínas, fenotípica celular e perfis phosphoproteomic devido à perturbação químico ou genético. Especificamente, ele produziu os perfis de ~ 1.000 genes marco (L1000) de expressão gênica em resposta a 20.000 perturbações químicos em muitas linhas celulares. Além disso, eles inferir perfis de expressão de nível transcriptoma de ~ 20.000 genes computacionalmente usando os 1.000 genes marco [26].

Neste estudo, adotamos uma abordagem integrativa para

in silico

DR usando o assinatura de expressão (e) derivada da recente de grande escala, genómica químicos conjunto de dados (LINCS) bem como a estrutura química (S) e assinaturas de alvo (T). Em seguida, aplicamos nosso método para inferir DR candidatos drogas anti-câncer para glioblastoma, cancro do pulmão e cancro da mama. Nós focado sobre a capacidade de identificar novos candidatos DR que não estão estruturalmente relacionados com medicamentos anti-cancro conhecidos, porque análogos estruturais podem ser facilmente inferido por outros métodos baseados na estrutura [27,28]. O conjunto de dados LINCS abrange um número suficientemente grande de compostos que permitiram a avaliação imparcial do poder preditivo de cada assinatura. Nós, então, previu novos candidatos DR para glioblastoma. As drogas alta pontuação candidatos foram validadas experimentalmente utilizando linhas celulares de cancro e as células primárias derivadas de pacientes. O conjunto de dados LINCS também nos permitiu interpretar o modo de ação dos candidatos DR validados.

Materiais e Métodos

informações sobre drogas definido e composto alvo conhecido

A droga conhecida set (conjunto KD ou

padrão ouro

) foi extraído a partir de várias bases de dados públicas de drugbank [29], CTD [30], PubChem [7], e KEGG de drogas [31] para glioblastoma, cancro do pulmão e da mama Câncer. Além disso, com curadoria manualmente compostos ativos e drogas de PubMed, pesquisando resumos que descrevem explicitamente a actividade anti-câncer para estes três tipos de câncer (S1 tabela). Uma consulta típica incluiu vários termos, tais como “apoptose”, “proliferação”, “crescimento celular ‘,’ citotoxicidade ‘,’ anti-câncer”, “citotoxicidade” e “aumento da sobrevida” após o tratamento. A informação composto alvo foi recolhido a partir de 10 fontes de dados públicos: drugbank [32], KEGG [31], MATADOR [33], TTD [34], KiDB [35], BindingDB [36], ChEMBL [37], WOMBAT [ ,,,0],38], CTD [30], e DCDB [39]. Foram incluídos apenas as interações composto alvo apoiados em provas dirigidas, tais como compostos à meta vinculativa, a ativação, a inibição e de reacção a uma razoavelmente alta afinidade (

e

.

g

., Ki 10 nM). Ao longo da análise, compostos e proteínas alvo foram mapeados para identificadores NCBI PubChem composto (CID) e Entrez Gene ID como identificadores padrão, respectivamente.

assinaturas de expressão para as doenças-alvo

Os perfis de expressão para as doenças alvo foram transferidos a partir quer do portal de dados TCGA (https://tcga-data.nci.nih.gov) ou NCBI GEO [40], que incluiu ambas as condições normais e de doença. Os conjuntos de dados de glioblastoma de 200 pacientes foi obtido a partir TCGA que foram divididos em quatro subtipos-clássico canônicas, mesenquimal, proneural e neural. Quatro assinaturas de expressão distintos foram extraídos para os subtipos correspondentes. Para o câncer de pulmão e mama, foram obtidos 11 e 16 de microarray conjuntos de dados, respectivamente. Os 11 conjuntos de dados de câncer de pulmão consistiu em GDS1761, GDS1312, GDS2771, GSE5364, GSE7670, GSE10072, GSE10799, GSE1987, GSE2088, GSE1037 e GSE11969. Os 16 conjuntos de dados de câncer de mama consistiu em GDS817, GDS820, GDS823, GDS1761, GDS1925, GDS2250, GDS2617, GDS2618, GDS2635, GDS2739, GSE5364, GSE10780, GSE15852, GSE16443, GSE17072 e GSE20266. Todos os conjuntos de dados de microarray foram processados ​​e normalizados utilizando o pacote de SAM [41]. Os degs foram extraídos como assinaturas de expressão usando FDR. 0,05 como ponto de corte

assinaturas expressão a partir do conjunto de dados LINCS

O conjunto de dados LINCS incluído um extenso catálogo de perfis de expressão genética gerada pela Biblioteca do baseados em Rede integrada assinaturas celulares (LINCS) projeto de 59 células cancerosas humanas em resposta a perturbações ~ 20.000 químicos. A equipe LINCS produziu os perfis de 1.000 genes marco de expressão utilizando um alto throughput ensaio baseado em Luminex [42]. inteiros Os perfis transcriptomic para ~ 20.000 genes foram deduzidos a partir dos valores de expressão medidos dos 1.000 genes marco. As assinaturas de expressão para os compostos foram baixados da página do projeto LINCS (www.lincsproject.org), que consistiu dos 100 genes mais cima e para baixo-regulados em resposta a cada composto.

Viabilidade Celular Ensaio

os compostos utilizados para o ensaio de viabilidade celular foram adquiridos de Sigma-Aldrich e Enzo Life Science. Ambas as linhas celulares de glioblastoma (A172, T98G, U251 e U87) e células primárias (células GBL) foram cultivadas em meio DMEM alta concentração de glicose cultura celular (HyClone; SH30243.01) suplementado com 10% de soro fetal bovino, 1% de penicilina solução /estreptomicina, e 30 ug /ml Plasmocure (Invivogen, formiga-PC) de reagentes para evitar a contaminação por micoplasma.

para medir a actividade citotóxica das drogas candidatas, a actividade metabólica das células viáveis ​​foi mensurada utilizando WST reagente (EZ-Cytox, dogen) em placas de 96 poços. O número de células semeadas foi ajustada de acordo com a taxa de crescimento de cada tipo de células (100-500 células /poço). Vinte e quatro horas após a sementeira, as células foram tratadas com fármacos, a uma concentração de 10 uM e a cultura prosseguiu durante 72 horas a 37 ° C. Um décimo do volume médio de reagente WST foi adicionado às células, e a absorvância foi medida a 450 nm após 2 h, usando um leitor de microplacas SpectraMax 190 (Molecular Devices). Os experimentos foram repetidos cinco vezes.

enriquecimento Pathway análise

caminhos KEGG foram transferidos do banco de dados MSigDB (https://www.broadinstitute.org/gsea/msigdb), que consistem em 186 conjuntos de genes que representam vários processos biológicos. Uma vez que muitas vias relacionadas com a doença são redundantes com outras vias de sinalização (por exemplo,

KO05200

:

Pathways no cancro

incluem

KO04310

:

Wnt

,

KO04210

:

a apoptose

,

KO04115

:

p53 sinalização

, etc.), foram excluídos esses 28 caminhos e os restantes 158 vias foram utilizadas. O significado de enriquecimento foi calculado utilizando o teste hipergeométrico. O conjunto de dados LINCS contém várias assinaturas para o mesmo medicamento de diferentes células e condições, onde a média harmônica dos valores p correspondentes foi tomada como seu p-valor representativo. O q-valor ajustado foi então calculada pelo método Benjamini-Hochberg. As distâncias entre as drogas foram calculados conforme o valor-p distância cosseno de-log.

Resultados

coleta de dados e processamento de

Em primeiro lugar, nós compilamos uma lista de medicamentos conhecidos ( conjunto KD) como o ponto de referência para os três tipos de câncer (glioblastoma, cancro do pulmão e cancro da mama) de quatro bases de dados públicas, bem como por curadoria manualmente 243 publicações (S1 tabela). Foram considerados apenas os compostos que foram explicitamente declarados como sendo activo contra o alvo doença-

e

.

g

., Droga X induz a apoptose, inibe a proliferação, ou apresenta atividade citotóxica. O conjunto consistia de 132 KD, 216, 256 e compostos para o tratamento do glioblastoma, cancro do pulmão, e cancro da mama, respectivamente (Figura A no ficheiro S1). Além disso, coletamos uma extensa lista de 1.155 compostos (câncer de drogas definir ou CD set) que foram relatados para mostrar a atividade anti-proliferativa contra qualquer outro tipo de câncer, incluindo todas as drogas no conjunto KD.

A seguir , a assinatura estrutural foi extraído como 1.024 pedaços de impressões digitais químicas FP2 implementadas em Abrir Babel [43] para os compostos (S

CPD) ou medicamentos conhecidos (S

KD). As informações alvo foi recolhido a partir de 10 bases de dados públicas, compreendendo 342,311 interações composto alvo entre 205,570 compostos únicos (Figura A no arquivo S1). Os conjuntos de genes associados com cada composto ou droga foram então gerado e serviu como as assinaturas de alvo (T

DPC, t

KD). A assinatura de expressão (E

CPD, E

KD) foi descarregado a partir LINCS e consistiu dos genes diferencialmente expressos (degs) por perturbação química [26]. Várias assinaturas para um único composto eram comuns porque as assinaturas de expressão foram gerados em várias linhas celulares de diferentes origens. Além disso, o conjunto de dados LINCS incluiu uma fracção significativa de IDs redundantes compostos e alguns nomes dos compostos genéricos, estruturas 2D, e /ou os estereoisómeros dos mesmos fórmulas moleculares não eram distinguíveis entre diferentes fontes de dados. Portanto, as assinaturas destes compostos semelhantes foram fundidos juntos depois convertê-los para o formato SMILES canônica, embora estereoisómeros podem mostrar diferentes atividades farmacológicas e alguns foram inicialmente atribuídas diferentes IDs compostos por LINCS. Notamos que o mapeamento de ID de um estereoisómero era muito raro entre dois estereoisômeros distintas, mas foi feito principalmente com nome genérico ou sorrisos, sem informações 3D. O número resultante de compostos originais foi reduzida para 8,860. Foi definido um

conjunto central

de 2.250 compostos para os quais todos os três tipos de assinaturas (S, T e E) estavam disponíveis. A intersecção do núcleo definido e CD set foi 304 drogas (Figura A no arquivo S1). Da mesma forma, nós também geradas assinaturas expressão da doença (E

DIS) para o glioblastoma (4 conjuntos), o câncer de pulmão (11 conjuntos) e câncer de mama (16 conjuntos) de TCGA [44] ou conjuntos de dados de microarranjos públicas do GEO. O procedimento detalhado é descrita na secção Materiais e Métodos.

Resumo da análise

Nós desenvolvemos uma série de classificadores de prever drogas candidatas DR para o tratamento do glioblastoma, cancro do pulmão, da mama e Câncer. O nosso método utiliza três tipos de assinaturas que são derivados de estrutura química (s), da relação de droga-alvo (T), e os dados de expressão de genes (E). candidatos DR foram previstas com base na similaridade das referidas assinaturas entre os compostos e as doenças (ou suas drogas conhecidas). O desempenho de previsão foi minuciosamente inspecionado de forma usando i imparcial) um esquema de validação cruzada convencional que utiliza medicamentos conhecidos (conjunto KD) como referência, ii) a 29 anti-câncer HTS conjuntos de dados para 11,000-41,000 compostos, e iii) ensaios . baseado em linhas celulares de cancro glioblastoma e as células primárias derivadas de pacientes

o trabalho aqui descrito consistiu em três etapas: 1) as assinaturas de associação edifício, 2) construção de uma série de classificadores e 3) que avaliam o desempenho de previsão. O objectivo da primeira fase foi associar compostos e uma doença alvo (ou as suas conhecidas drogas anti-cancro) com base na semelhança dos três tipos de assinatura (Fig 1A). No total, foram estabelecidas sete tipos distintos de associações que eram independentes uns dos outros. Em primeiro lugar, um composto foi previsto como um candidato DR com base na sua semelhança estrutural com os fármacos conhecidos (S

DPC-S

KD). A expressão (E) e assinaturas alvo (T) são essencialmente uma lista de genes que poderiam estar associados por qualquer método para análise de conjunto de enriquecimento de gene. Por isso, poderia gerar seis tipos adicionais de associações entre os compostos (T

CPD, E

CPD) e doença (T

KD, E

KD, E

DIS). Foi utilizado o coeficiente de

Tanimoto como uma medida de similaridade assinatura porque todas as assinaturas pode ser representado como um vetor binário de 0s e 1S-

i

.

e

., O presença ou ausência de genes estruturais ou impressões digitais. Como várias assinaturas são permitidos para um único composto e da doença, calculou-se a média dos valores de coeficiente de Tanimoto para um dado par composto de doença.

(A) A estrutural (S), alvo (T), e expressão (e) assinaturas para cada composto (círculos à esquerda) e doenças (quadrados à direita) foram comparados. As associações estão indicadas por linhas a tracejado em três categorias: (S amarelo, T: verde, E: vermelho), dependendo do tipo de composto de assinatura. (B) No total, sete diferentes classificadores foram construídas com base na semelhança entre o composto e o assinatura-alvo ou as suas combinações (S, T, E, ST, Se, Te, e STE). As pontuações DR foram calculados utilizando uma série de classificadores com base em uma regressão logística com o conhecido conjunto de drogas (conjunto KD) utilizado como referência. (C) O desempenho foi avaliado por meio de três conjuntos de dados independentes: comparação com os 29 conjuntos de linha de células de tumor humano NCI-60 DTP I) a AUC média de 100 rodadas de validação cruzada de 3 vezes, II) HTS dados e III) experimental validação de atividades anti-proliferativas utilizando linhas celulares de cancro e células primárias. Uma interpretação de nível via do modo de drogas de ação foi realizada para os candidatos DR ativos para glioblastoma (IV).

A segunda etapa envolveu a construção de uma série de classificadores para prever candidatos DR (Fig 1B ). Para comparar o desempenho de cada assinatura, sete classificadores foram construídos utilizando uma regressão logística. Os classificadores resultante foi utilizada uma única (S, T, E), a combinação de duas (ST, Se, Te), ou todos os três tipos (STE) de assinaturas compostos. Finalmente, o desempenho de previsão foi minuciosamente inspecionado de forma usando i imparcial) um esquema de validação cruzada convencional que utiliza medicamentos conhecidos como o

padrão ouro

, ii) a grande escala 29 HTS conjuntos de dados para a actividade anti-proliferativa e iii) ensaios que usam ambas as linhas celulares de glioblastoma e as células de glioblastoma estabelecida primários derivados de doentes. Interpretamos ainda mais os potenciais modos de ação de drogas por meio de análise de enriquecimento caminho seguido por comparações com outros medicamentos contra o câncer.

Avaliação de desempenho usando a droga conhecida (KD) dataset

Para assegurar uma avaliação imparcial, nós limitamos nossa análise para o conjunto central de 2.250 compostos de modo que diferentes classificadores podem ser comparados usando exatamente a mesma referência. O conjunto básico incluiu 79, 100 e 132 conhecidas drogas anti-câncer (KD set) como pontos de referência para glioblastoma, cancro do pulmão e cancro da mama, respectivamente. O conjunto negativo (1.946 compostos) foi preparado por excluindo o CD definido a partir do conjunto principal.

Tal como referido na secção anterior, construímos sete classificadores diferentes com base em uma única assinatura (S, T, e e-classificador) ou a combinação de múltiplas assinaturas (ST, SE-, TE- e STE-classificador). Seus desempenhos relativos foram avaliados utilizando 100 cartuchos de esquemas de validação cruzada três vezes. Os classificadores foram baseadas em uma regressão logística que pesa automaticamente os recursos de componentes para produzir uma previsão unificada score-o

marcar DR

-scaled de zero a um. Os classificadores por objectivo (T) um desempenho melhor do que os outros classificadores (S, E) na identificação de medicamentos conhecidos (KD do core set) em todos os três tipos de câncer (Fig 2). Esta tendência foi observada de forma consistente em combinação com outras assinaturas (ST, TE SE). Nós fundamentado que as metas de drogas conhecidas (KD) tendem a ser mais bem caracterizado que outros compostos, e classificadores por objectivo pode, consequentemente, favorecer drogas conhecidas. Portanto, avaliou-se ainda os classificadores de uma forma mais imparcial nas secções seguintes.

Os classificadores utilizando um único tipo de assinatura (S, T, e E) e as suas combinações (ST, Se, Te, e STE) foram avaliadas com base nas AUC da curva ROC para o glioblastoma, o cancro do pulmão e cancro da mama. Os valores da AUC foram calculados pela média de 100 cartuchos de validação cruzada de 3 vezes.

Avaliação em comparação com HTS anti-câncer públicas

Para evitar a possibilidade de viés, recolhidos dezenas de grandes -scale HTS anti-câncer ensaios de PubChem [45]. Eles consistiu de oito, treze e oito HTS ensaios para GBM, o cancro do pulmão, e linhas celulares de cancro da mama, respectivamente (Tabela A em arquivo S1). Estes ensaios usados ​​diferentes linhas de células e foram razoavelmente distintos uns dos outros em termos de ambos ensaiados e bateu compounds-

E

g., Foi observada.

apenas uma sobreposição de sucesso de 20% entre o dois ensaios para GBM (AID57, AID59) (Figura B no Arquivo S1). Novamente, nós limitamos nossa avaliação para os compostos testados, que também pertenciam ao conjunto principal. Para focalizar a capacidade de prever novos candidatos DR, drogas conhecidas (KD) foram excluídos os compostos de sucesso. Os hits restantes de cada ensaio foram divididos em duas categorias: i) visitas de anti-câncer que pertenciam ao conjunto de CDs ou tiveram dois ou mais estruturais análogos no conjunto de CDs com um coeficiente 0,7, e ii) novos hits que não foram incluídos no primeiro set. Portanto, os hits anti-câncer representados aqueles que poderiam ser facilmente previsto com base na similaridade estrutural e os novos hits, que eram os casos difíceis e que são o foco deste estudo.

Curiosamente, o desempenho de cada assinatura era em contraste com o resultado da avaliação anterior, com base no conjunto KD. O classificador baseada em expressão (E) melhor previu visitas de anti-câncer em todos os três tipos de câncer (Fig 3A). Em contraste, o classificador baseado em alvo (T) executada pior. Esta tendência foi mais evidente na previsão de novos acessos (Fig 3B). Os classificadores baseados na estrutura (S) ou assinatura-alvo (T) eram essencialmente incapaz de prever novos acessos (mediana AUC = 0.41 ~ 0.62), enquanto que a assinatura de expressão (E) um desempenho razoável (mediana AUC = 0,73 ~ 0,79, Figura 3B ). Esta tendência foi observada de forma consistente em combinação com outras assinaturas (SE TE ST). Notavelmente, o assinatura único (E) de forma consistente um desempenho melhor do que só em combinação com outras assinaturas (Se, Te), para todos os três tipos de cancro. No geral, o assinatura de expressão (E) foi mais informativos do que as assinaturas de estrutura (S) ou um alvo (T) entre os conjuntos de dados de HTS para os três tipos de cancro diferentes. Os dados também sugeriram que as avaliações anteriores de qualquer

in silico

DR poderia ser tendencioso se as drogas conhecidas foram utilizados como o único conjunto de referência, especialmente se o método foi altamente dependente de informações de destino. Notavelmente, com foco no conjunto central mantém apenas um pequeno conjunto de compostos para avaliação, mas esta abordagem permaneceu suficiente para os testes estatísticos imparciais utilizando o mesmo conjunto de compostos (Tabela A em arquivo S1). Os resultados da avaliação de todos os compostos no conjunto de dados HTS apresentaram essencialmente a mesma tendência (Figura C no arquivo S1).

Os sete classificadores (S, T, E, ST, Se, Te, e STE) foram avaliada com base na AUC da curva ROC para o glioblastoma, o cancro do pulmão e cancro da mama. Somente compostos No conjunto foram avaliados. Os valores da AUC foram calculados pela média de 100 cartuchos de validação cruzada de 3 vezes. (A) Exemplos típicos de avaliação de desempenho usando o conjunto de glioblastoma (AID45) dados HTS, o cancro do pulmão (AID5) e câncer de mama (AID97). As AUC foram independentemente calculada usando dois conjuntos distintos de compostos de sucesso como referência (ou positivos) -i) os compostos de sucesso de atividade conhecida anti-câncer (linhas vermelhas) e ii) os novos acessos (linhas verdes). A distribuição das AUC usando (B) os compostos de atividade anti-câncer conhecido como um ponto de referência, e (C) a novela atinge como uma referência.

Validação experimental de drogas candidatos DR para glioblastoma

Glioblastoma multiforme (GBM) é a forma mais comum e agressiva de câncer no cérebro mostrando um grande mau prognóstico apesar quimio-radioterapia concomitante ou sequencial [46]. Temozolomida (TMZ) é um agente quimioterapêutico de primeira linha para o tratamento de GBM. Como um agente de alquilação, TMZ transfere grupos metilo para as bases de purina de DNA, causando quebras de ADN de cadeia simples e de cadeia dupla e subsequente morte celular por apoptose. A maioria dos estudos relatou que a quimioterapia conferido um benefício de sobrevida global limitado a pacientes com GBM. O tempo médio de recorrência foi de apenas 6,9 meses após o tratamento padrão [47]. Portanto, a necessidade de medicamentos mais eficazes é clara e não atendida.

Aqui, listamos os candidatos DR para GBM e testado experimentalmente as suas actividades anti-tumorais exclusivamente com base na assinatura de expressão. Em primeiro lugar, os compostos 8.860 foram ordenados pela pontuação DR,

i

.

e

. o percentil das previsões por o mesmo classificador (E), como descrito na secção anterior. Em seguida, foram aplicados vários filtros: a) aprovado pelo FDA; b) pontuação DR 0,9; e c) indicação para passar barreira cérebro-sangue (BBB), quer pela literatura ou pelo

in silico

previsão de https://www.cbligand.org/BBB. Um alto-marcando candidato (ivermectina, pontuação DR = 0,98) também foi incluído apesar de ser indicado não passar BBB. Os últimos 14 candidatos DR foram seleccionados, e as suas actividades anti-tumorais foram testados utilizando-se quatro linhas de células de GBM e oito células primárias derivadas do paciente. Os nossos pontuações DR correlacionava bem com as actividades anti-tumorais, entre as linhas celulares testadas em termos de actividade anti-proliferativa e a fracção de inibição significativa do crescimento (Figura 4A e 4B). Oito dos 14 candidatos foram sucessos significativas em três ou mais células GBM a 10 uM. Notavelmente, os sete primeiros candidatos mostrou actividade anti-tumoral forte, o que corresponde a um enriquecimento de aproximadamente 20 vezes batida de taxa de acerto ~ 5% de rastreio de alto rendimento convencional.

(A) contagens DR, (B) a fração de células significativamente inibido resumindo os resultados de (C), (c) as actividades anti-proliferativa (inibição do crescimento%) para as linhas de células de quatro glioblastoma (linhas de quatro células de TG98, A172, U251MG e U87MG) e oito pacientes pilhas -derived (a GBLS) em 10 mM, (D) nos escores de predição silico para o transporte de certificação com base em https://www.cbligand.org/BBB. O asterisco indica vermelho suporte experimental para a passagem da BBB acordo com a literatura. , atividades anti-proliferativa globais em todo células de glioblastoma fortemente correlacionada com os rankings pela pontuação DR. A maioria dos candidatos DR foram mostrados para ser capaz de passar o BBB.

Foram pesquisados ​​na literatura para relatórios relativos à actividade anti-cancro dos oito candidatos DR ativos, como resumido na Tabela 1. Descobrimos que quatro drogas (ivermectina, astemizol, nortriptilina, e apomorfina) foram anteriormente relatadas para mostrar a actividade anti-tumor no cancro do cérebro. Três drogas (trifluridina, amlodipina, e maprotilina) demonstrou actividade anti-tumoral em outros cancros, mas não no glioblastoma. Mometasona é um corticosteróide e é considerado um novo medicamento para o cancro porque não foi reportado para mostrar a actividade anti-tumoral em qualquer tipo de cancro. Os corticosteróides têm sido utilizados para reduzir o edema peritumoral e efeitos colaterais associados com a quimioterapia, tais como dor, náuseas, vómitos e [48]. Todos os candidatos DR activas, excepto ivermectina foram mostrados para ser capaz de passar a certificação tanto em relatos na literatura ou através de

in silico

previsão.

Interpretação dos modos de drogas de ação para o ativo candidatos DR

perfis transcriptomic induzidos por drogas refletir as mudanças diretas e indiretas de fisiologia celular em omics escala e fornecer informações ricas sobre o mecanismo farmacológico de drogas. Para interpretar seus modos de ação, foi realizada a análise de enriquecimento via de genes para cima e para baixo-regulados usando caminhos KEGG. Colectivamente, 32 e 17 foram significativamente vias enriquecido no para cima e genes regulados negativamente, respectivamente, a um valor Q 0,1 (Figura 5). No geral, os dados sugerem mecanismos plausíveis para as actividades anti-tumorais que são compartilhados entre os candidatos DR. -Regulada vias incluídos apoptose, metabolismo de aminoácidos e lípidos, e p53 /MAPK sinalização tumor-supressor /WNT, que sugere que as actividades dos processos anti-proliferativas foram aumentadas. Inversamente, vias proliferativas celulares, tais como o ciclo celular, replicação de ADN, reparação de ADN, e a montagem de ribossoma, foram regulados negativamente.

Os valores de p e q os valores ajustados foram calculados pelo teste e o hipergeométrico método Benjamini-Hochberg, respectivamente.

Quatro drogas (amlodipina, astemizole, maprotilina, e nortriptilina) fortemente o aumento do metabolismo lipídico (ácidos esteróides, terpenóides, e ácidos graxos). Por conseguinte, a amlodipina, um bloqueador do canal de cálcio, mas foi anteriormente relatado para induzir a esteroidogénese [66]. A amlodipina e vias de apoptose maprotilina moderadamente supra-regulados, que podem ser associados com a sobre-expressão de PKD1 e activação de caspase-3, respectivamente, [67,68]. Notavelmente, a apomorfina parecia actuar através de um mecanismo distinto: genes associados com o metabolismo energético mitocondrial foram fortemente regulada para baixo, sem alterações apreciáveis ​​de apoptose, metabolismo, ou a reparação do ADN. Estes genes mitocondriais metabólicas incluídos genes que codificam para sintetases de ATP (ATP5O, ATP5D), oxidases do citocromo (COX8A, COX7), e NADH desidrogenases (NADUFS8, NADUFB2). disfunção mitocondrial foi bem estabelecida para modular a apoptose e a tumorigénese [69]. Os outros dois candidatos DR (nortriptilina e maprotilina) também diminuiu o metabolismo energético mitocondrial. A regulação de genes do ciclo celular foi comumente observada entre todos os oito candidatos DR. Cinco fármacos diminuíram significativamente a expressão de genes de reparação de ADN. No geral, estes candidatos DR activos perturbados todos significativamente múltiplas vias tumorigênico ou tumor supressivas, que podem direcionar células cancerosas em direção resultado anti-proliferativa.

Também foi realizada uma análise de agrupamento dos oito candidatos DR juntamente com os 69 medicamentos contra o câncer incluída no conjunto de dados LINCS usando o padrão de enriquecimento da mesma para cima 32 e 17 de vias sub-regulada (Fig 6). Estes medicamentos contra o câncer frequentemente sobre-regular P53, MAPK, apoptose e sinalização imune. Muitos medicamentos contra o câncer, bem como os nossos candidatos DR baixo-regulam cycle- celular, reparo do DNA, e vias de sinalização p53. Sete dos oito candidatos DR mostram um padrão de enriquecimento altamente semelhantes com outros medicamentos contra o cancro (grupo I-V na figura 6). Quatro candidatos DR (amlodipina, astemizole, nortriptilina, e maprotilina) e oito medicamentos contra o câncer pertencem a dois grupos relacionados (I e II).

Deixe uma resposta