PLOS ONE: conceituar medicamentos contra o câncer como Classifiers

Abstract

Cancro e as células saudáveis ​​têm distribuições distintas de propriedades moleculares e, assim, responder de maneira diferente aos medicamentos. medicamentos contra o câncer idealmente matar as células cancerosas, limitando danos às células saudáveis. No entanto, a variação inerente entre células em ambos cancro e populações de células saudáveis ​​aumenta a dificuldade da acção do fármaco selectivo. Aqui nós formalizar uma estrutura de classificação com base na ideia de que uma droga contra o câncer ideal deve maximamente discriminar entre câncer e células saudáveis. Mais especificamente, esta discriminação deve ser realizada com base em marcadores de células mensuráveis. Nós dividir o problema em três partes que explorar com exemplos. Primeiros marcadores moleculares, devem discriminar as células cancerosas de células saudáveis ​​no nível de uma única célula. Em segundo lugar, os efeitos da droga deve ser estatisticamente previsto por esses marcadores moleculares. Em terceiro lugar, as drogas devem ser otimizados para desempenho de classificação. Nós achamos que os níveis de um punhado de genes de expressão suficiente para discriminar bem entre as células individuais em câncer e tecido saudável. Nós também achamos que a expressão do gene prevê a eficácia de alguns medicamentos contra o câncer, sugerindo que estas drogas contra o câncer agir classificadores como sub-óptimos usando perfis de genes. Finalmente, formular um quadro que define uma droga ideal, e prevê os coquetéis de remédios que podem direcionar o câncer mais precisão do que os medicamentos tomados isoladamente. Conceituar medicamentos contra o câncer como resolver um problema de discriminação no espaço de alta dimensão de marcadores moleculares promete informar o desenho de novas drogas contra o câncer e coquetéis de drogas

Citation:. Lawlor PN, Kalisky T, Rosner R, Rosner MR, Kording KP (2014) Conceituar Cancer Drugs como Classificadores. PLoS ONE 9 (9): e106444. doi: 10.1371 /journal.pone.0106444

editor: Sui Huang, Instituto de Biologia de Sistemas, Estados Unidos da América

Recebido: 06 de janeiro de 2014; Aceito: 04 de agosto de 2014; Publicação: 23 de setembro de 2014

Direitos de autor: © 2014 Lawlor et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. PL foi financiado pelo National Institutes of Health 5P01NS044393. KK foi apoiado pelo National Institutes of Health R01NS063399. RR e RM foram apoiados pela Universidade do Conselho das Mulheres Chicago. TK foi financiado pela Fundação Machiah. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

O objetivo central do tratamento do cancro é matar o tecido canceroso, deixando o tecido saudável intacto. medicamentos contra o câncer eficazes deve, portanto, distinguir entre as células cancerígenas e as células saudáveis. Além disso, o tratamento de câncer ideal também deve ser robusto à variabilidade biológica tais como tumor ea heterogeneidade célula saudável [1]. Combinando estas ideias, podemos enquadrar o problema do câncer de uma maneira que equilibra o potencial sobreposição de propriedades saudáveis ​​e células de câncer com a necessidade de matar variantes de células cancerígenas agressivas (Fig. 1). Embora a necessidade de separar o câncer a partir de células saudáveis ​​fundamenta o tratamento do câncer atual, ao nosso conhecimento não tem sido matematicamente formalizada. O desenvolvimento de uma estrutura matemática abre a possibilidade de traduzir conhecimentos de ciência da computação em novas abordagens para o tratamento do câncer

Idealmente, medicamentos contra o câncer executar um cálculo sobre células:. Matar (se cancerosos) ou não matar (se saudável).

drogas câncer devem, portanto, ser concebida como executar um cálculo sobre células. Por exemplo, para drogas tóxicas, alvos celulares conduzir a um resultado único (matar ou não matam) durante o tratamento. Matematicamente, podemos dizer que o efeito de uma droga é um mapeamento a partir de um conjunto de propriedades (Objectivos da célula) para um estocástico, desfecho binário (a vida celulares ou morre) – Este é exactamente a definição de um classificador nos campos de estatísticas e de aprendizado de máquina [2]. Neste sentido, qualquer droga de cancro é, na verdade, um classificador (Fig. 2). No entanto, a aplicação da palavra “classificador” para esta morte selectiva não é apenas semântica. Em vez disso, refere-se a uma abordagem matemática formal e caixa de ferramentas derivadas de aprendizado de máquina, o que pode contribuir para o desenvolvimento de drogas.

Isso ilustra como se pode combinar informações de dois marcadores celulares para construir um classificador que separa as duas populações (cancerosos e as células saudáveis) melhor do que qualquer um dos marcadores sozinho.

Muitos algoritmos de computador têm sido desenvolvidos para resolver problemas de classificação, e uma rica literatura existente nos campos da estatística e aprendizagem de máquina sobre métodos eficazes para a classificação [2 ]. Estes campos computacionais oferecem uma ampla gama de abordagens, incluindo métricas quantitativas de desempenho, algoritmos eficientes para grandes conjuntos de dados e métodos para melhorar classificadores. Por exemplo, muita pesquisa dirigida tem como combinar classificadores fracos, a fim de construir melhores classificadores, sugerindo que estes métodos podem ser adaptados a combinação droga (Fig. 2). aprendizado de máquina, ao definir a busca de classificadores como otimizadores, oferece uma forma limpa de descrever uma pesquisa dirigida a objetivos. Este artigo destina-se a esclarecer a equivalência da busca de classificadores e na busca de medicamentos contra o câncer.

Os dados do recém-desenvolvido omics se aproxima de permitir a aplicação da teoria classificador para otimização de drogas. Microarray e tecnologia de sequenciamento, por exemplo, permitem-nos a recolher simultaneamente informações sobre milhares de celular

marcadores Network – medidas que caracterizam o estado ou fenótipo da célula tal como a expressão do gene. Alguns destes marcadores devem distinguir as células cancerosas de células saudáveis, auxiliando na classificação precisa e câncer de segmentação. É importante salientar, no entanto, nem todos os marcadores são alvos de drogas moleculares. Molecular

alvos Quais são moléculas que medicamentos contra o câncer realmente usar para alterar células. Mas enterrado em milhares de marcadores mensuráveis ​​é um subconjunto de marcadores que

refletir ou se correlacionam com

os alvos moleculares de drogas. Por exemplo, a expressão de genes que estão a jusante de um alvo de droga pode correlacionar bem com que a eficácia do fármaco. Emergente da biotecnologia nos permite medir esses marcadores celulares e analisá-los por ferramentas estatísticas como máquina de aprender a compreender melhor o cancro.

Apesar de medicamentos contra o câncer não foram formalmente caracterizado como classificadores, aprendizado de máquina tem sido amplamente aplicada a muitos aspectos da biologia do câncer. Um grupo estimou resultado do cancro da mama, utilizando aprendizado de máquina para criar um algoritmo de previsão de 70 gene [3], enquanto nós e outros autores utilizaram aprendizagem de máquina, em combinação com vias de sinalização distintas, para prever a sobrevida livre de metástases [4]. Outros tentaram distinguir entre diferentes tipos de câncer usando muitos tipos de algoritmos, incluindo Support Vector Machines (SVM) [5], [6], Análise de Componentes Principais [7], [8] e Redes Neurais Artificiais [9]. No entanto, outros quimiossensibilidade prever com base na expressão do gene [10], [11] e redes de sinalização [12]. No entanto, enquanto todas essas abordagens têm feito progressos impressionantes e são úteis na prática clínica, essas ideias não foram combinadas para produzir uma abordagem baseada em princípios de design de medicamento contra o câncer.

Aqui nós propor um quadro para a concepção de tratamentos contra o cancro que se estende ideias existentes usando a conceituação classificador. Em primeiro lugar, delinear a abordagem e, em seguida, como um exemplo prático, realizar uma análise de dados experimentais para mostrar como isso pode ser feito, em princípio. A abordagem global é assim resumida:

Uma Estrutura para tratar o cancro

Formalização medicamentos contra o câncer como classificadores devem informar a forma como tratamos o câncer. Há três partes essenciais desta abordagem que, primeiro, resumir a um nível elevado, e em seguida demonstrar usando dados experimentais actualmente disponíveis: 1) definir especificamente o objetivo a ser alcançado pela classificação – ou seja, quais as células para matar, que as células para sair, e como dizer a diferença entre os dois; 2) Compreender as ferramentas de tratamento à nossa disposição; e 3) O ideal é usar essas ferramentas de tratamento para alcançar o objetivo de classificação definido. Resumimos definições e pressupostos relativos a este enquadramento na Tabela 1.

Definir o objetivo (Parte I)

O primeiro passo é a discriminar entre células cancerosas e saudáveis. Porque este é o objetivo do tratamento do câncer, é importante especificar concretamente este objetivo. Para fazer isso, usamos a matemática de algoritmos de classificação em conjunto com medições de marcadores celulares. O classificador responde às seguintes questões: quanto é que as células cancerosas diferem das células saudáveis, e que marcadores biológicos pode distingui-los? Ele faz esta pergunta ao considerar explicitamente a heterogeneidade das duas populações. Os marcadores podem incluir a expressão de genes, proteínas de superfície, etc. Porque a distinção entre células cancerosas e saudável requer tendo em conta a heterogeneidade em cada população, temos nos concentrado em marcadores para células individuais em vez de populações de células sempre que possível.

algoritmos que classificam neste contexto são projetados para dar a separação máxima de células de câncer de células saudáveis ​​em termos de estes marcadores de diferenciação. Como tal, podemos dizer que os resultados da classificação de descrever o que um hipotético “ótima” agir droga sobre esses marcadores poderiam alcançar. Parte I dos resultados demonstra como se pode definir este objectivo otimização usando a expressão de genes em células individuais e explora como muitos marcadores e células são necessárias para atingir esse objetivo.

Compreender as ferramentas de tratamento à nossa disposição (Parte II)

O próximo passo é entender como as ferramentas de tratamento disponíveis nos permitir utilizar os marcadores distintivas das células cancerosas. Devemos esforçar-nos para aproximar a droga ideal através da concepção de novas drogas ou combinar os medicamentos existentes. Aqui vamos nos concentrar no segundo.

As drogas devem, idealmente, alvo distinguir propriedades de câncer, mas a maioria das drogas usadas na clínica não faça isso perfeitamente. Além disso, os seus mecanismos de acção diferentes. Assim, pode ser possível prever como as drogas existentes devem ser combinados para produzir resultados mais desejáveis. Realmente fazendo esta previsão seria depender de relacionar as ações de drogas para as propriedades distintivas do câncer. Por exemplo, se as células cancerosas diferem das células saudáveis, principalmente através de três marcadores distintos, três drogas

conhecido para utilizar separadamente cada marcador único como um classificador poderia, teoricamente, ser combinados. Parte II dos resultados demonstra essa ideia, explorando a relação entre a ação de drogas e propriedades moleculares (expressão gênica).

O ideal é o uso de ferramentas de tratamento (Parte III)

O último passo é usar a matemática da classificação para perguntar como nossas ferramentas disponíveis (por exemplo, drogas) nos permite realizar o nosso objectivo. A partir da primeira parte, sabemos como distinguir células cancerosas de células saudáveis. A partir do segundo, sabemos como nossos medicamentos relacionam com marcadores moleculares. Agora podemos usar essas duas idéias para otimizar o tratamento, combinando as habilidades classificando dos nossos medicamentos para o objectivo de classificação especificada.

Aqui vamos novamente se concentrar na otimização combinações de drogas. Uma abordagem seria de prever combinações de drogas que discriminam entre câncer e células saudáveis ​​melhor do que uma ou outra droga sozinho. Parte III dos resultados demonstra uma abordagem que, em condições ideais, pode alcançar este objetivo.

Uma limitação do estudo é que os dados actualmente disponíveis para tais análises são limitadas e não é o ideal. Portanto, a fim de ilustrar as três partes da estrutura de classificação usando dados de amostras biológicas reais, temos substituído ou redefinido fenótipos celulares quando os dados de célula desejada está faltando.

Resultados

Parte I : Definindo o objetivo de classificação com as medições moleculares

Se medicamentos contra o câncer agir como classificadores que usam marcadores mensuráveis ​​como entrada, podemos usar algoritmos de classificação padrão para explorar a possibilidade de resolver o câncer contra o problema de classificação de células saudáveis. É teoricamente possível que haja um (ou a combinação de drogas) óptima da droga que alcança este objectivo na prática. Isto implicaria que tal droga poderia matar as células cancerosas, deixando as células saudáveis ​​sozinho na maior medida possível. Usaremos essa noção de uma droga ideal como um guia para analisar o tratamento. Na prática, as drogas ou combinações de drogas efectivas devem ser escolhidos para se assemelhar a droga ideal. Nós reconhecemos que cada tumor é diferente, mas o nosso objetivo aqui é para ilustrar uma abordagem para distinguir canceroso do tecido não canceroso em um contexto. Esta abordagem também pode ser aplicada a outros tipos de câncer.

Para determinar se é teoricamente possível para resolver este problema, precisamos de um conjunto de dados de células com ambos estado câncer conhecidos e marcadores medidos. Foram utilizados dados de transcrição derivadas de uma única célula a partir do cólon [13]. Este conjunto de dados incluiu tanto um número limitado de marcadores (45 genes), e um número limitado de subtipos de cólon e células de tecido ( 200 células). Assim, nós nos concentramos em distinguir entre células saudáveis ​​e cancerosas de subtipo de um tecido: as células-tronco-like. Porque estas células são tão semelhantes – como apontado na publicação original – esta escolha serviu para tornar o problema de classificação mais desafiador. Este conjunto de dados, assim, permitiu-nos testar o poder da abordagem de classificação.

Pode este problema de classificação ser resolvido? Em outras palavras, os dados podem transcrição de uma única célula prever estado celular (canceroso ou não)? Para responder a esta pergunta foi utilizado um algoritmo padrão de classificação, a regularização GLM [14], [15]. Testando o quão bem como algoritmos de classificação de trabalho permite-nos dar um limite superior de quão bem uma droga real poderia funcionar se ele usou a expressão do gene sozinho.

Em primeiro lugar, queríamos para medir a precisão potencial desta classificação. Na classificação, existem diferentes tipos de erros que se pode fazer. Por exemplo, é fácil para a produção de um fármaco que mata todas as células cancerosas, mas também mata todas as células saudáveis. Esta droga teria 100% de positivos verdadeiros (células cancerosas mortas), mas também 100% de falsos positivos (células saudáveis, abatidos). Assim, para caracterizar completamente uma estratégia de classificação que deve analisar a relação entre os dois tipos de erros. A medida padrão de precisão da classificação é o receptor operando trama característica (ROC). Neste gráfico, a proporção de verdadeiros positivos é representada graficamente como uma função da proporção de falsos positivos (Fig. 3) para quantificar a sensibilidade e especificidade. A área sob esta curva (AUC) dá uma medida geral do desempenho de classificação com um valor máximo de 1 para um teste perfeito. A AUC para o nosso algoritmo de classificação foi ~0.9, indicando que as células saudáveis ​​e cancerosas podem ser bem classificado. Por isso, é teoricamente possível para resolver este tipo específico de câncer contra o problema de classificação saudável para células individuais com alta precisão usando os níveis de expressão para apenas um pequeno conjunto (-45) de genes.

Ao medir a precisão da classificação célula como cancerígeno ou saudável, deve-se considerar os dois tipos de erros: falsos positivos e falsos negativos (ou mais convencionalmente, verdadeiros positivos). Isto é ilustrado pela curva Receiver Operating Characteristic (ROC). Linhas indicam valores médios, e barras de erro indicam bootstrapped intervalos de confiança de 95%. Precisão foi medida utilizando validação cruzada; eo valor oportunidade foi determinada utilizando o controle shuffle.

Em seguida, perguntou

quantas

marcadores celulares uma droga ideal seria necessário para classificar células com precisão. Em outras palavras, qual é o número mínimo de marcadores de uma droga ideal deve considerar a possibilidade de dizer a diferença entre células saudáveis ​​e cancerosas? Descobrimos que um número relativamente pequeno de genes – cerca de 10 a melhor (classificados pela magnitude do parâmetro de ajuste) – suficiente para classificar uma célula cancerosa ou como saudável, com elevada precisão (Figuras 3, 4.). O poder preditivo do classificador saturado logo após os 10 melhores genes foram incluídos. Assim, somente um pequeno número de marcadores celulares fornecer a maior parte da informação utilizada para classificar uma célula cancerosa ou como saudável.

Classificação do desempenho foi medido como a área sob a curva (AUC) da curva ROC. Um classificador ideal seria alcançar uma AUC de 1, ao passo que um classificador aleatória atingiria uma of.5 AUC. Cada linha colorida representa um número diferente de células utilizadas para treinar o classificador, que mostra que o desempenho melhora à medida que mais células são utilizados. Linhas indicam valores médios e as áreas sombreadas indicam bootstrapped intervalos de confiança de 95%. Precisão foi medida utilizando validação cruzada; eo valor oportunidade foi determinada utilizando o controle shuffle.

A capacidade de medir a expressão de genes de células individuais levanta a questão de saber se é mais importante para medir mais células ou mais genes. Para responder a esta, que quantificada a importância relativa de aumentar o número de células medido versus o número de genes medidos por célula. Nós treinado o classificador com números de células totais que variam de dois (um, uma célula saudável do tumor) para 180 células totais (95% de células). Como acima, nós medimos o desempenho do classificador, a não ser que o fazemos para cada cenário de treinamento. Nós encontramos de novo que o desempenho saturada depois de um pequeno número de genes para cada cenário de treino. Importante, também descobrimos que o desempenho continuou a melhorar com o aumento do número de células de formação até cerca de 80 foram utilizadas (Fig. 4). Assim, as medições de pelo menos dezenas de células são obrigados a responsável por uma variância de uma população simplificada de células saudáveis ​​do tumor e.

Nesta seção, demonstramos como realizar uma análise que definiria o tratamento ideal – “droga ideal” – poderia realizar. Com um conjunto de dados experimentais que mostram que é possível resolver o problema de classificação com precisão o cancro. Este tipo de análise pode também identificar os marcadores que distinguem o cancro a partir de células saudáveis. Para o conjunto de dados limitado que nós escolhemos, parecia que resolver o problema de classificação era possível com cerca de 10 marcadores e 80 células. No entanto, estes números variam de acordo com população de células tumorais, bem como os marcadores particulares analisados ​​

Parte II:. Classificação por medicamentos contra o câncer reais

Na primeira parte dos resultados que têm explorado a possibilidade de um medicamento contra o câncer ideal que faz a distinção entre células saudáveis ​​e cancerosas. Nesta segunda parte do estudo, vamos demonstrar

se Comprar e

como

as ferramentas à nossa disposição (neste exemplo, as drogas reais) pode classificar células. Isso nos ajudará a entender como usar drogas reais para aproximar o desempenho da droga ideal.

Especificamente, no exemplo a seguir, perguntamos como drogas contra o câncer

realmente

relacionam com marcadores moleculares. Para responder a esta pergunta, nós ideal seria utilizar células individuais. Isto é difícil com células individuais, no entanto, porque o tratamento e medição de marcador tanto potencialmente destruir a célula. Uma solução possível é a de permitir a replicação limitada de células individuais, a fim de analisar o estado do marcador para um conjunto de células filhas, enquanto, simultaneamente, determinar a eficácia da droga utilizando outras células filhas. No entanto, mesmo estes dois conjuntos exibirão heterogeneidade com o tempo. Uma vez que os dados de expressão de genes para tais populações, que foram tratados com drogas não estão presentemente disponíveis, o substituto mais próximo é estabelecido linhas celulares que possuem uma origem clonal e são em grande parte geneticamente homogénea. Por isso usamos linhas celulares como stand-ins para células individuais para perguntar como drogas relacionam com marcadores moleculares.

Porque os nossos resultados anteriores sugerem que é preciso dezenas de células para resolver o problema de classificação, optamos por analisar um tipo de tecido com muitas linhas celulares estabelecidas. Nós, portanto, utilizados 45 luminal e basal-como linhas celulares de cancro da mama caracterizadas por Gray e colegas [12]. Mediram aproximadamente 19.000 genes nestas linhas de cancro da mama utilizando microarrays, bem como as respostas quimioterapêuticos dessas linhas para cada uma das 74 drogas. Essas linhas são uma boa representação da gama de fenótipos celulares encontrados no cancro da mama e, assim, representar mais variação do que um tumor real. No entanto, estas linhas celulares permitiu-nos a perguntar como marcadores de células relacionadas com a sensibilidade de drogas.

Foi utilizado um algoritmo para prever se drogas contra o câncer vai matar as células de uma linha celular específica, com base em seus marcadores. Em particular, estimamos as sensibilidades de droga dessas linhas celulares. Na verdade, alguns aspectos das respostas ao fármaco eram previsíveis. Por exemplo, previmos a resposta ao fármaco quimioterapêutico lapatinib, um inibidor de tirosina-quinase que bloqueia a sinalização por tanto o receptor de EGF e HER2 /neu. Obtivemos um R

2 valor de -0,5. No entanto, a baixa R

2 valor mostra que a nossa previsão do comportamento droga não era forte. Isto pode ser devido ao pequeno tamanho do conjunto de dados, mas pode também implicar que nem todos os marcadores relevantes foram medidos, ou, alternativamente, que a relação não é linear e não capturado por métodos de aprendizagem automática lineares. Enquanto que os marcadores moleculares, tais como a expressão de genes não capturar todo variabilidade, eles parecem desempenhar um papel na previsão da resposta ao fármaco. Portanto, marcadores celulares prever um certo grau de comportamento de drogas quando tratados como entradas para um classificador.

Também queríamos saber quantos genes suficiente para prever o comportamento real de drogas. Para fazer isso, foram medidos o comportamento do fármaco como uma função do número de genes. Lapatinib apenas necessário um pequeno número de genes (~ 5) para atingir o seu pico de precisão (Fig. 5). Assim, um pequeno número de marcadores celulares prever se ou não medicamentos reais matar uma célula. Isto é importante porque mostra que não necessariamente precisa considerar muitos milhares de genes ao projetar terapias.

resposta da droga foi prevista utilizando marcadores moleculares (expressão gênica). Precisão da previsão quimio-sensibilidade, medida como R

2, que representa a quantidade de variação explicada. As áreas sombreadas indicam bootstrapped intervalos de confiança de 95%. Precisão foi medida utilizando validação cruzada.

Se as drogas agem como classificadores usando um pequeno número de propriedades, em seguida, uma droga pode ser caracterizado através da representação gráfica seu efeito como uma função das propriedades. Foram selecionados, assim, os dois genes (SLC5A8 e PERLD1) que eram conjuntamente melhor em prever o efeito do lapatinib em todas as linhas celulares. Usando interpolação de grade simples e rotinas de extrapolação nós traçamos o efeito da droga como um mapa de calor (Fig. 6). Este tipo de visualização mostra que mesmo os dois genes pode capturar o comportamento complexo de um medicamento contra o câncer.

atividade de drogas é até certo ponto previsível usando marcadores moleculares.

Nós analisar a atividade de drogas como refere-se a marcadores moleculares (isto é, características fenotípicas de uma célula), mas tais marcadores não são necessariamente molecular

alvos (ou seja, componentes celulares, tais como proteínas cujas funções são alteradas por uma droga). Idealmente, os dados experimentais também incluem medições de marcadores mais provável que realmente constituem alvos de drogas, tais como os receptores da tirosina quinase que são direcionados por Lapatinib. Embora os transcritos do gene que analisamos não são os alvos diretos da droga classificação, eles ainda prever a resposta de drogas e são portanto úteis. Assim, esta abordagem poderia ser usada com

qualquer tipo

de marcador molecular ou alvos.

Nesta seção, demonstramos como entender o comportamento de drogas reais dentro do nosso quadro. Em nosso exemplo, relacionados com a eficácia do fármaco para os marcadores moleculares, que, em teoria, permite que um perguntar como drogas real referem-se os marcadores que distinguem células cancerosas. Isto será importante para a seção seguinte, na qual pedimos como otimizar a combinar drogas. Neste conjunto de dados, no entanto, descobrimos que os marcadores medidos subótimamente prever a resposta de drogas. No futuro, os dados recolhidos a partir de muitas mais populações de células e será necessária uma variedade de tipos de marcadores para fazer previsões clinicamente plausíveis

Parte III:. Otimizando o tratamento do câncer

Nas duas seções anteriores, têm mostrado como uma droga de cancro óptima poderia classificar como células cancerosas ou não, e que os marcadores celulares prever, em certa medida como uma droga real comporta. Nesta seção, nós combinar essas duas idéias para delinear uma abordagem possível para otimizar o tratamento do câncer. Nós olhamos para a

pares de drogas

que classificam as células cancerosas melhores quando combinadas do que apenas uma ou outra droga.

Nós demonstramos esta abordagem conceitualmente usando dados de expressão gênica e medições de sensibilidade aos fármacos do mesmo painel de câncer de mama linhas de células [12]. Infelizmente, não fomos capazes de obter dados semelhantes para linhas de células não cancerosas. Por isso, fizemos dois ajustes para mostrar que estes tipos de análises são possíveis, em princípio: 1) mais uma vez tratados cada linha de células clonal como um stand-in para uma única célula; e 2) foi utilizada a capacidade de discriminar entre duas subclasses de tecidos como o objetivo de classificação em vez de distinguir saudável a partir de células cancerosas. Em particular, foram utilizados os subtipos de tipo basal e luminais de câncer de mama, que

aproximadamente

correspondem a agressiva (mais metastático) e câncer (menos metastático) menos agressivo. Estamos cientes de que a situação real é mais complexa do que esta simplificação; no entanto esta distinção é, em última análise arbitrária e simplesmente serve para demonstrar a nossa abordagem usando uma diferença fenotípica real. Dada esta definição e estes dados, que perguntou se era possível encontrar duas drogas que discriminam entre o luminal e basal-like de câncer de mama subtipos melhor do que o mesmo fármaco sozinho.

drogas reais não perfeitamente discriminar entre saudável e células cancerosas. No entanto, podemos usar a aprendizagem de máquina para descrever como combinar drogas, a fim de melhor aproximar a droga ideal. Isto é inspirado pela abordagem bem conhecida na aprendizagem de máquina chamado impulsionar [16], em que recursos adicionais são adicionados a um classificador para permitir progressivamente melhor desempenho. Mais especificamente, dado o objectivo de classificação (droga ideal) da Parte I e comportamento real das drogas da Parte II, podemos determinar qual par de drogas melhor aproximar a droga ideal. Para fazer isso, voltamos a usar a estrutura GLM para enquadrar o tratamento desejado como uma combinação de drogas. Nós então percorrer possíveis combinações de duas drogas para determinar qual o par tem o melhor desempenho. Esta idéia nos permite determinar a melhor combinação de drogas para a classificação.

Encontramos várias combinações de medicamentos que se aproximava a droga ideal. Uma combinação particular incluídas as drogas Lestaurtinib e GSK461364 (Figura 7;. Compare Fig. 2). Estas drogas em conjunto fornecem uma classificação melhor do que qualquer um dos fármacos isoladamente (Fig. 8). Assim, o nosso método proporciona um mecanismo para a escolha de drogas adicionais de uma forma que deverá permitir-nos para direccionar células do cancro de forma mais eficaz. Estes resultados assumir que as drogas agem tanto de forma independente e antes de uma resposta adaptativa ao tratamento. Outras estratégias para abordar esta questão são apresentados na discussão.

Melhor discriminação entre populações de células é conseguida através da inclusão de um medicamento adicional. A linha de limiar de classificação mostrada, na realidade, representa um gradiente relacionadas com “probabilidade de morte celular”, que é indicado pelo sombreado. Veja o texto para a descrição completa.

Precisão (AUC) alcançado por ambas as drogas em conjunto é melhor do que o mesmo fármaco sozinho.

Nesta seção, nós demonstramos como otimizar o tratamento utilizando a estrutura de classificação. Ressaltamos mais uma vez que estamos usando dados biológicos sub-óptimos como exemplos para esclarecer a natureza da nossa abordagem, não produzir previsões clinicamente relevantes. conjuntos de dados maiores e mais exaustivos serão necessárias para tornar isso possível. Além disso, temos feito simplificações improváveis ​​de generalizar a prática clínica. Assim, estes resultados não devem ser tomadas como uma indicação clínica. No entanto, esta análise mostra que a utilização da estrutura de classificação para otimizar o tratamento leva em conta a variação inerente fenótipos e poderia influenciar a escolha de um tratamento para discriminar entre células cancerosas e saudáveis.

Discussão

O abordagem para o tratamento de câncer de

neste estudo, temos argumentado que o emprego de medicamentos contra o câncer como classificadores fornece um quadro conceptual para a elaboração de estratégias de tratamento ideal para o câncer. drogas ideais usar alvos moleculares para matar células cancerosas, minimizando danos às células saudáveis. Consideramos este problema como um que poderia ser resolvido com ferramentas de aprendizado de máquina e demonstrar como este poderia informar uma estratégia para tratar o cancro. Nós demonstramos que uma classe de marcadores moleculares, a expressão do gene, foi suficiente para resolver este problema de optimização muito bem utilizando os conjuntos de dados examinadas. Nós também mostrou como incorporar variação celular intrínseco na análise e reconhecer as drogas reais como classificadores sub-óptimos. Finalmente, sugeriu formas de utilizar a estrutura de classificação para derivar estratégias de desenvolvimento de drogas que realizam, tanto quanto possível uma droga ideal.

Otimizando o tratamento do câncer através da combinação de drogas de acordo com princípios de classificação é relativamente simples se as drogas combinadas não fazer afetam uns aos outros. Por exemplo, pode ser que um segundo fármaco não interfere significativamente com o mecanismo molecular da primeira, e

vice-versa, quando administrados em simultâneo. Se os efeitos dos fármacos individuais são aditivos, a capacidade de uma droga em particular para classificar células cancerosas não seriam afectadas por uma outra droga. Assim, o composto classificador – a combinação de drogas – seria classificar as células cancerosas mais precisão do que uma ou outra droga sozinho. É também possível que fracas interacções entre drogas não-linear pode ainda produzir um composto classificador superior do que qualquer um dos fármacos sozinhos. Assumindo linearidade coloca um

limite superior de quão bem combinações de drogas poderia funcionar.

E se encontramos uma segunda droga que deve melhorar a classificação, mas não é aditivo com o primeiro medicamento? Esta dependência não linear é muito provável que seja importante. Uma solução seria a utilização de forma iterativa a droga next-mais-óptima até encontrar um que não interagem significativamente com a primeira droga. Assim, a escolha do melhor medicamento adicional para uma combinação pode exigir considerações teóricas e empíricas. Este método não pode garantir que uma determinada combinação de drogas funcionará, mas em vez disso propõe uma maneira mais eficiente para seleccionar cocktails de fármacos para o teste.

Deixe uma resposta