PLOS ONE: Identificação dos principais processos subjacentes Cancer fenótipos Usando Biologic Análise Pathway

Sumário

Cancro é reconhecida como uma família de doenças baseadas em genes cujas causas podem ser encontrados em interrupções de processos básicos biológicos. Um catálogo cada vez mais profunda das redes canónicos detalha a interacção molecular específico de genes e seus produtos. No entanto, o mapeamento de fenótipos da doença às alterações dessas redes de interações é realizado indiretamente e não sistematicamente. Aqui nós objetivamente identificar caminhos associados com a malignidade, encenação, e os resultados no cancro através da aplicação de uma abordagem analítica que sistematicamente avalia as diferenças na atividade e consistência das interações dentro processos biológicos canônicos. Usando grandes coleções de expressão de genes do genoma acessível ao público, identificamos pequenos conjuntos e comuns de vias – TrkA Receptor, a resposta apoptose a danos no DNA, ceramida, a telomerase, CD40L e calcineurina – cujas diferenças robustamente distinguir diversos tipos de tumores de amostras normais correspondentes, prever o grau do tumor, e distinguir fenótipos, como status do receptor de estrogênio e do estado de mutação p53. Vias identificadas através desta análise desempenho tão bom ou melhor do que os fenótipos utilizados nos estudos originais na predição dos efeitos do cancro. Esta abordagem fornece um meio para usar caracterizações do genoma para mapear processos biológicos fundamentais para características clínicas importantes na doença

Citation:. Efroni S, Schaefer CF, Buetow KH (2007) Identificação dos principais processos subjacentes Cancer fenótipos Usando Biologic Análise Caminho. PLoS ONE 2 (5): E425. doi: 10.1371 /journal.pone.0000425

Editor do Academic: Nick Monk, da Universidade de Sheffield, Reino Unido

Recebido: 05 de janeiro de 2007; Aceito: 29 de março de 2007; Publicado em: 09 de maio de 2007

Este é um artigo de acesso aberto distribuído sob os termos da declaração Creative Commons Public Domain que estipula que, uma vez colocado no domínio público, este trabalho pode ser livremente reproduzido, distribuído, transmitido, modificado, construído em cima, ou de outra maneira usado por qualquer pessoa para qualquer finalidade lícita

financiamento:.. Esta pesquisa foi apoiada pelo programa de investigação intramural do NIH, Instituto Nacional do Câncer

Conflito de interesses :. os autores declararam que não existem interesses conflitantes

Introdução

fenômenos biológicos surgem como consequência da ação dos genes e seus produtos nas vias. Doenças surgem através da alteração destas redes complexas [1] – [5]. A fim de fazer afirmações mecanicistas que complementam as abordagens atuais para genoma-wide análise [6] – [9], mapeamos as vias biológicas canônicas para fenótipos cancerosas. Um total de 2011 hibridações matriz Affymetrix GeneChip obtido a partir de 9 fontes de dados acessíveis ao público diferentes [10] – [17] foram analisadas. As hibridizações representou 70 tipos de tumores diferentes (1348 amostras). Adicionalmente 83 diferentes tipos de amostras de histologia normal foram incluídos (663 amostras). Os níveis de expressão foram ajustados usando RMA [18]. A definição de normal utilizado aqui exclui amostras adjacentes não envolvidas e /ou tumorais obtidas de indivíduos com câncer.

O uso de vias como um quadro de análise não é em si romance. Estes incluem a projecção de genes do cancro conhecidas e de dados de expressão de genes em vias de [19], [20]. O que distingue o trabalho aqui apresentado é a avaliação sistemática da estrutura de interação através de redes canônicos predefinidos. Ao medir o estado da interacção que combina a informação de estado do gene e a estrutura de rede. Vários estados de genes pode resultar em uma pontuação comum percurso. Por outro lado, as pontuações da via podem mostrar diferenças maiores do que as assinaturas genéticas.

Abordagens à Análise Caminho

Esta investigação complementa outros trabalhos utilizando informações via.

Mais especificamente, Segal et. ai. [6] definida módulos biológicos e refinou-los a um conjunto de módulos estatisticamente significativas. Eles foram capazes de usar esses módulos para ganhar uma perspectiva melhor sobre os diferentes processos biológicos que são activados e desactivados em várias condições clínicas. Notamos duas diferenças principais entre o que apresentamos aqui eo trabalho em Segal et. ai. [6]: em primeiro lugar, os módulos biológicas utilizadas no papel, apesar de altamente informativa e útil, são definidos internamente dentro do papel. A determinação dos genes nestes módulos foi derivado a partir dos mesmos dados para o qual eles são aplicados mais tarde. As vias canônicas que usamos são externamente definidos independente a partir dos dados que analisar, representam o entendimento atual no campo, e não foram derivados ad-hoc. Em segundo lugar, Segal et. ai. não faça uso explícito das interconexões, ou a estrutura da rede, que existe entre genes que compõem módulos biológicos. As pontuações para a atividade e consistência que apresentamos aqui dependem estrutura de rede e as relações específicas (tais como a inibição e promoção), que são características das informações de rede.

Outra abordagem importante é a de Rhodes et. ai. [21], em que a rede de interactoma humano é usada para identificar os sub-redes activados em cancro. A abordagem Rhodes el. ai. usar, em contraste com o apresentado aqui, não tenta computacionalmente e algoritmos destacar as diferenças nos fenótipos através da construção de um classificador em torno de recursos de rede mensuráveis. Em vez disso, ele gera sub-redes pela sua associação com conjuntos de genes identificados através da sobre (ou sob) expressão em cada um fenótipo biológico. Rhodes et. ai. abordagem faz uso da estrutura da rede para construir a sub-rede, mas não faz uso posterior em observar a co-expressão ou co-silenciamento de conjuntos de genes, como é o caso no trabalho aqui apresentado.

Bild et. ai. [14] e Glinski et. ai. [22] demonstram que as assinaturas genéticas determinadas pelo pequeno conjunto de vias canônicas pré-selecionados pode distinguir as características do tumor. Em seu trabalho, eles começam com um conjunto limitado de vias, (por exemplo Bild et. Al. Usar 5 vias) e mostrar que eles diferem em diferentes fenótipos. Como esta abordagem começa com um pequeno conjunto de vias, os autores optaram por examinar, ele não tem a capacidade de descobrir novas associações Caminho com fenótipos. Ao contrário do trabalho atual, que não emprega um método objetivo de identificar um conjunto de vias que podem discriminar fenótipos.

As análises set Gene enriquecimento [23] permite que os autores de escolher um conjunto de genes e determinar sua relação estatística significância de uma lista de genes que separam fenótipos. conjunto de genes de enriquecimento começa com a premissa de genes individuais como classificadores. filiação Pathway é medido para avaliar contribuições combinadas. Novamente, o método não faz uso da estrutura da rede, nem fornece uma conta sistémica para o conhecimento combinada de vias para reduzir a um conjunto ideal de classificar os processos. Como o método começa com a discriminação de genes individuais, ele só pode construir sobre esta inferência estatística, e não leva em conta as diferenças que vêm da inter-dependência de múltiplas interações genéticas. Por exemplo, se o gene A parece permutar aleatoriamente nos dois fenótipos e o gene B parece permutar aleatoriamente nos dois fenótipos, em seguida, cada um dos genes irá marcar mal em um teste de significância estatística. No entanto, a pontuação definida pela sua dependência combinado (por exemplo (se A então B)) pode fornecer muito maior discriminação.

O método pelo Tomfohr, et. ai. [24] é talvez o mais próximo de o apresentado aqui na medida em que olha para grupos combinados de genes e classifica-los em conformidade. No entanto, Tomfohr, et. ai. não usar o conhecimento estrutura de rede para obter pontuação, mas em vez disso executar decomposição singular do valor (SVD) para escolher um metagene específico, e definir uma atividade da via como a expressão desse gene. Como tal, o resultado não utiliza a interdependência da rede como faz o trabalho apresentado acima

Métodos

Avaliando um estado do gene:.

status de Gene na avaliação da rede interação é calculado a partir dos dados observados como um dos dois estados alternativos: para baixo e para cima. Para ser capaz de identificar se um gene está num estado “baixo” ou um “up” estado, que olhe para a sua (RMA ajustado [18]), valores de expressão numa amostra, em comparação com os valores de expressão do mesmo gene em todos outras amostras. Para ser capaz de acomodar uma grande variedade de distribuições de probabilidade, usamos uma distribuição gama, como o modelo tanto para a forma de distribuição “para baixo”, bem como a “para cima” de distribuição, e redefinir o problema como uma mistura de dois distribuição gama. A forma suprimida muitas vezes segue uma distribuição exponencial, que é um caso particular de uma distribuição gama. O estado promovido segue frequentemente uma forma semelhante a uma distribuição normal, que pode ser aproximado por uma distribuição de uma grande gama média. Por cada conjunto de sonda medido pelo microarray, olhamos para a distribuição expressão e tente encaixar essa distribuição em uma mistura de duas distribuições gama. Fazemos isso usando um algoritmo de Maximização da Expectação (EM), a iteração sobre os dados de uma forma que garanta o aumento da probabilidade de ajuste dos dados pelas distribuições modelados. No caso de duas distribuições gama, primeiro dividir os dados em dois grupos: os valores “baixo” e “cima” valores. O número de genes no “up” do grupo é

N

U

eo número de genes no grupo suprimida é

N

D

. As probabilidades anteriores são, portanto:

Nós assumimos cada grupo distribui de acordo com uma distribuição gama:

O objetivo do algoritmo EM é para nos fornecer estimativas de probabilidade máxima para o

a

U, b

U

valores para o grupo promoveu e ao

a

D, b

D

valores para o grupo suprimida. Além disso, ele calcula as estimativas de probabilidade máxima de os coeficientes de mistura, η

1, η

2.

Nós assumimos que a distribuição de cada gene de expressão ou é proveniente de uma mistura de duas distribuições (um para o caso “para cima” e outra para o caso “para baixo”) ou a partir de uma única distribuição (por exemplo, quando o gene é “para cima” em todas as amostras que têm). Nós determinamos o número de distribuições subjacentes (um ou dois) usando o algoritmo EM, em combinação com um método de seleção de modelos, veja abaixo.

Para encontrar o máximo de a probabilidade log, precisamos encontrar o máximo da função auxiliar

Q

[25]: whereHere,

θ

é a coleção de parâmetros que definem a distribuição e o sobrescrito 0 designa magnitudes que haviam sido determinadas na iteração anterior

.

para encontrar maxima, diferenciamos

Q

no que diz respeito aos parâmetros do modelo, e comparar com zero.And o Ψ coefficientswhere (

x

) é a função psi.

usando um multiplicador de Lagrange para incorporar o constrangimento que temos de maximizar o alvo functionwith relação ao

η

i

, nós deriveand obtainWe resolver este numericamente (usando Matlab®) em cada passo iterativo, até que chegar a algum critério de convergência predefinido

a escolha de um número ideal de distribuições:.

Obviamente, os mais distribuições tomarmos como base para as distribuições globais, o ajuste melhor que temos para os dados ea melhor a probabilidade será. Considere-se, por exemplo, como muitas distribuições como existem pontos de dados. Que se encaixam os dados exatamente e produzir probabilidade máxima. Para ultrapassar esta situação, e de ser capaz de escolher um número ideal, que compara os modelos com diferente número de distribuições utilizando o Critério de Informação Bayesiana (BIC) [26], a função custo asThis calculado compensa o aumento adicional na complexidade. O modelo estatístico escolhido é aquele com o maior BIC

Calcule E da mesma forma:. Mas precisamos a probabilidade de estar no estado “promovido” para um valor de expressão específica: E sincewe possível obter os valores necessários por: por exemplo, a expressão do gene CDKN1A no conjunto de dados [13] (a coleta de amostras de 698 tumores) segue essa distribuição (ver Figura 1):

as cima /baixo chamadas para estados de genes baseiam-se numa valor da expressão classificada como residente em um dos dois distribuições distintas.

as duas distribuições distintas (baixo e para cima) são evidentes e o algoritmo dá os parâmetros para as duas distribuições gama.

atividade da via e via de consistência

pathway pontuação consistência: Para determinar a pontuação via consistência de uma dada via de sinalização em uma amostra, siga estes passos:

Cada percurso é um conjunto de interações. genes de entrada e de saída genes definir cada interação. Para cada interação na via, primeiro olhar para os genes de entrada e determinar, para cada gene, a probabilidade de estar em um “baixo” ou “up” estado (ver “estado gene” acima)

Nós, então, determinar a probabilidade de a materialização da interação específica como a probabilidade conjunta de todos os componentes necessários (genes)

em seguida, vamos olhar para a saída molecular da interação. Normalmente, esta saída é uma lista de genes, para o qual estabelecer a probabilidade de estar em um “baixo” ou “up” estado (ver “estado gene” acima)

Em seguida, calcula-se a probabilidade de a gene (s) saída de estar em um dos dois estados, de acordo com a probabilidade dada da interação (calculado em (b))

por último, para obter a pontuação via de consistência, nós calcular a pontuação de consistência para cada interação na via e calcular a média das pontuações sobre todas as interações de que fomos capazes de obter uma pontuação. Na Figura 2 mostram um exemplo de cálculo do valor de consistência de uma interacção tomadas a partir da via de “eventos de sinalização mediados pelo receptor do factor de células estaminais (c-Kit)”, uma das vias NCI-Natureza Curadoria da via interação com o banco (PID ) [27]. As etapas específicas para calcular a consistência neste exemplo são:

Estabelecer probabilidades para todos os genes envolvidos na interação. Isto é feito de acordo com os passos a seguir descritos (ver secção “estado gene”). Os valores que obtemos são: P (CREBBP) = 0,95; P (STAT5A) = 0,8; P (KIT) = 0,7

Calcule a probabilidade conjunta de uma interação ativa. Uma vez que as moléculas de entrada para a interacção não são co-dependente, a probabilidade conjunta da interacção é P (CREBBP) × P (STAT5A) = 0,95 x 0,8 = 0,76

calcular a probabilidade de que a molécula de saída é a resultado da interacção. Uma vez que a molécula é unicamente dependente da interação a probabilidade é simples:

Iterate esse cálculo em todas as interações no caminho. A pontuação final de uma via é uma média ao longo de todas as interações.

A pontuação de atividade da via é a média sobre a atividade das interações em um caminho. Por exemplo, no exemplo anterior, a actividade de interacção é 0,76. A principal vantagem para calcular as actividades das vias no topo de consistências via é que as actividades podem ser calculados, mesmo quando não existem dados suficientes para trabalhar com a saída, como é o caso, por exemplo, quando a interacção é baseado sobre a activação ou modificação de moléculas sem a geração de uma nova molécula como saída. Em tais casos, ainda podemos calcular a actividade, embora a consistência perde o seu significado.

Veja Métodos para obter detalhes.

A escolha de um conjunto mínimo de vias para classificar fenótipo

Como obter escores de atividade e consistência da via para cada percurso, somos capazes de transformar a representação de cada bio-amostra de uma lista de medições de expressão de genes em uma representação romance, exibindo cada amostra com a coleção de atividade da via e dezenas de consistência. Como usamos essa representação para distinguir entre fenótipos, queremos encontrar o conjunto mínimo de pontuação caminhos que é capaz de fazer a distinção entre as classes fenotípicas. Usamos seleção de recurso para escolher um conjunto mínimo ideal (ver resultados). Nós usamos diferentes métodos de extração de características e classificação recurso [28], [29], incluindo a frente seleção, seleção para trás, e busca [29] flutuantes. Estes métodos ajudam na eliminação de pontuação via que não contribuem para fazer a distinção e destacando caminhos específicos que, juntos, alcançar uma taxa de classificação ideal.

Pathway métrica para prever o resultado

representando cada bio-amostra usando seus indicadores de via nos permite olhar para os padrões da coleção de vias. Usando algoritmos de agrupamento, vemos que os valores das métricas via segregar as amostras em grupos. Se olharmos para os padrões de sobrevivência desses grupos, vemos que em alguns casos e em algumas vias, os grupos se correlacionam com padrões distintos de sobrevivência.

Resultados

A análise aplicada aqui trata um via como uma rede de genes cujas interacções são logicamente avaliado no contexto via para gerar conjuntos de pontuação. informações via da estrutura biológica foi obtida a partir de fontes públicas [27], [30], [31].

Cada caminho é avaliada para a consistência e atividade. A pontuação via consistência é calculada como a probabilidade média da consistência lógica da coleção de interações dados os estados calculados dos genes (ver Métodos). A pontuação de atividade da via é calculada como a probabilidade média de interações individuais da via ser ativo dado os estados de genes calculados. Usando princípios básicos da máquina de aprendizado supervisionado [28], [29] um algoritmo de classificação que distingue cada fenótipo oncogénico (por exemplo, cancro verso amostra normal) foi gerado e validado. Baseado na simplicidade e de comparabilidade das abordagens alternativas testadas, foi utilizado um Bayesian classificador discriminante linear.

Em primeiro lugar, um algoritmo de classificação foi derivado de distinguir diversos fenótipos de câncer de tecidos fenótipo normal. Um classificador derivado de uma amostra de 1800 conjunto de treinamento (validação 10 vezes) demonstrou% de sucesso de 98 em um conjunto de teste de validação independente de 211 amostras (ver Figura 3 e Tabela 1).

Cada painel na figura corresponde a uma diferença fenotípica diferente, de acordo com legendas do painel. O eixo horizontal em cada painel corresponde à projecção unidimensional calculada pelo algoritmo de classificação, que significa a distância entre amostras biológicas, de acordo com as métricas de multi-dimensional da via. O eixo vertical é uma dispersão jitter das amostras para permitir uma visão clara da separação.

Desde classificadores lineares transformar cada um dos percursos no problema em uma variável no classificador, ele é possível através da análise de recurso para identificar subconjuntos de variáveis ​​classificador (vias) que, como um grupo, distinguir os fenótipos com alta precisão. seleção de recurso foi utilizado para identificar um conjunto demonstrando a precisão ideal de 98% da classificação inicial na análise da amostra de validação. É composto das pontuações de seis vias de actividade:. TRKA Caminho, caminho DNA danos, ceramida Caminho, a telomerase Pathway, CD40L Caminho e calcineurina Pathway

O cancro é uma doença de grande heterogeneidade fenotípica e molecular. Mesmo dentro de um determinado site do órgão, heterogeneidade fenotípica está associada com diferenças significativas no resultado câncer. É, portanto, de interesse adicional para identificar os processos moleculares que estão na base das diferenças fenotípicas e que prever o resultado. Por esse motivo, as assinaturas derivada para uma variedade de subtipos de cancro da mama. Estes subtipos incluem: grau histológico (graus Elston 1 vs 3, ou graus 2 vs. 3); estatuto P53 (mutado /tipo selvagem); receptor de estrogênio positivo de status /negativo (ER +/-); e estado de receptor de progesterona positivo /negativo (PGR +/-). O desempenho dos classificadores é apresentado na Figura 3. Em todos os casos, classificadores com um pequeno número de vias (3-6) alcançou um elevado nível de precisão (83% a 95%). A Tabela 1 mostra os diferentes grupos da via que classificam diferentes fenótipos.

A seguir, avaliou a capacidade das assinaturas específicas de subtipo de câncer de estratificar as amostras de cancro da mama 236 por resultado. Na sequência de agrupamento sem supervisão das amostras de cancro utilizando os percursos acima identificados, Kaplan Meier foi realizado (Figura 4). Em três casos, um único percurso a partir do sub-tipo de assinatura resultado significativamente previsto: a via de ritmos circadianos, a partir da assinatura de grau 1/3 (P = 2,9E-11); a via de Hedgehog Sonic, a partir da assinatura de grau 2/3 (P = 4E-8); e pós-sináptico em Agrin diferenciação, a partir da assinatura P53 (P = 4.6E-7). As três vias na assinatura PgR +/- separados das amostras em dois grupos com um valor de P 0,0001, com a via de contabilidade osso Remodelação para a maior parte do efeito. Além disso, os cinco vias do ER +/- assinatura separados das amostras em dois grupos, com um valor P de 0,004, com a via de SREBP representando a maior parte do efeito.

(A) (1) Kaplan plot sobrevivência -Meier de pacientes com câncer de mama a partir de [15], estratificados de acordo com o agrupamento com base na atividade da via. O painel (2) em (A) mostra a pontuação de actividade da via hedgehog Sonic colorido de acordo com a afiliação com qualquer uma das curvas de sobrevivência em conformidade coloridos em (1); (B) As mesmas análises feitas com pacientes com câncer de mama a partir de [15], com base na via Remodelação Óssea (ver texto para a escolha pathway). parcelas de sobrevivência (C) Kaplan Meier de câncer de pulmão dados do paciente a partir de [17], estratificada de acordo com a actividade da via Csk e da via (D) NFKβ. Em cada painel, o sub-painel (2) mostra a métrica de percurso mais influente para fora do grupo de vias de estratificação. Isso não significa que o caminho representado é responsável por toda a separação em dois grupos.

É importante notar que uma série de descobertas na literatura surgir independentemente de nossa análise de caminho do cancro da mama amostras. À medida que a importância da ER +/- distinção na gestão do cancro da mama está bem estabelecida, olhamos para cada um destes subgrupos separadamente. Tem sido observado [32] que a trkA Pathway (identificados em ambos o assinatura oncogénica genérico e a assinatura de grau 2/3) desempenha um papel significativo nos casos ER-. A análise mostra que o assinatura oncogénica genérico separa as amostras ER- em dois grupos (P = 4.6E-9), com a via de trkA representando a maior parte do efeito, uma elevada actividade desta via correlacionando-se com mau prognóstico. Da mesma forma, tem-se observado [33], [34] que a beta-catenina desempenha um papel significativo na resposta ao tamoxifeno, de um tratamento padrão para a doença ER +. Para analisar a natureza da resposta induzida pelo tamoxifeno, que derivada de um classificador para distinguir os casos ER + que tinham sido tratadas com tamoxifeno a partir desses casos que não tinha sido tratado e, em seguida, utilizadas as vias na assinatura resultante para agrupar os casos por resultado . A via beta-catenina emergiu como a via mais significativa (P = 1E-13) na previsão de resultados.

tem sido sugerido que as classificações moleculares de cancro pode ter a capacidade de superar as definições de órgãos ou de tecidos específicos . Mais especificamente, tem sido sugerido que as definições moleculares que reflectem as propriedades universais do tipo de célula ou ontologia e que sustentam uma etiologia molecular comum pode surgir através definições site órgão. Para avaliar se as assinaturas observadas acima em câncer do epitélio mamário pode generalizar para outros tipos de câncer, examinamos a sua capacidade de prever fenótipos em pulmão e cólon. Nós aplicamos assinaturas derivados dos subtipos de câncer de mama para agrupar os resultados do cancro do pulmão (Figura 4). Vias predizer os resultados incluídos no caminho de IL-7 (P = 0,002) e a Csk caminho (P = 3E-11). Tem sido observado anteriormente que essas vias têm sido associados com o desfecho no câncer de pulmão [35], [36]

Por fim, examinamos a capacidade da assinatura oncogênico geral para prever o resultado específico do órgão local. Curiosamente, as vias de assinatura separou as amostras de câncer de mama 236 em cinco subgrupos de sobrevivência diferentes (P = 2E-8) amostras eo câncer de pulmão 90 em dois subgrupos diferentes (P = 5E-17).

Discussão

os resultados acima sugerem que o uso da via como a unidade de análise pode aumentar abordagens baseadas atual gene indivíduo para fenótipo mapeamento para processo molecular subjacente. identificação objetiva de processos previamente associados com fenótipos utilizando conjuntos de dados do genoma fornece validação parcial dos resultados observados. Recentemente observou mapeamentos de processos para fenótipos, no entanto, exigem claramente de verificação de conjuntos de dados independentes ou confirmação experimental.

As observações feitas através desta análise são provocantes. Muitas destas vias (por exemplo a apoptose, a manutenção dos telómeros) foram anteriormente descritos como componentes universais de oncogénese [2]. Além disso, os processos são identificados que podem ser a base fenótipos de câncer comum relacionados, tais como a inflamação. Curiosamente, os novos percursos são também identificados como parte da assinatura oncogénica geral tal como foi descrito nos seis vias colectivo (por exemplo, vias de ceramida e calcineurina). O recente interesse em ceramida apoia esta hipótese. Ceramida tem sido conhecida por estar envolvida na apoptose [37] – [39] e recente trabalho é olhar para a relevância de ceramida no câncer [40] – [42] e na terapia do cancro [43], [44]. interesse semelhante tem vindo a desenvolver em calcineurina. Considerando que foi previamente interesse confinada à sua actividade em resposta imunológica, que está agora a tornar-se reconhecidas como um participante predominante na oncogénese [45], [46]. A combinação deste conjunto de percursos podem definir os principais processos que são características de um tipo de células progenitoras universal.

Por outro lado, a análise de caminho de câncer de sub-fenótipos também pode fornecer novas perspectivas mecanicistas que revelam a biologia subjacente. Por exemplo, o tamoxifeno é eficaz no tratamento de alguns casos de cancro da mama ER +. Nestes casos, o tamoxifeno devem estar a afectar a actividade de redes de interacção. É lógico, portanto, para a hipótese de que não haverá diferenças observáveis ​​na actividade de rede entre os casos em que o tamoxifeno é eficaz e esses casos em que a droga não é eficaz. A nossa abordagem utiliza assinaturas via para prever variação no resultado, que é tomado como a medida da eficácia da droga. Nós especulamos que a nossa abordagem pode revelar as redes que são ambos diferencialmente ativados em resposta ao tratamento com tamoxifeno e importantes para o crescimento do tumor e sustentabilidade.

A abordagem aplicada aqui tem paralelos com o uso de mapas de genes para a tradução de fenótipos em o domínio molecular. Primeiro, os modelos da via representam um quadro reproduzível que pode ser testada através de estudos e estendida como mais conhecimento se torna disponível. Além disso, as vias e os seus estrutura fornecer uma ordem superior construir para avaliar o papel dos genes.

Cada interacção dentro de uma via requer a contribuição de várias observações do gene. Cada nível de actividade do gene único contribui apenas no contexto de outros genes que participam numa interacção dentro da rede de processo. Isto é demonstrado pela observação de que não fomos capazes de derivar classificadores eficazes, directamente a partir dos valores gene de estado sozinho (para os genes que compõem os principais seis vias).

Também é interessante que cinco das seis vias usamos para classificar amostras normais e tumorais formam uma única rede ligado (Figura 5, a via de telomerase permanece conectado). Esta interligação pode proporcionar novas oportunidades para o desenvolvimento de intervenções. O conhecimento das conexões pode sugerir alvos alternativos que têm múltiplos efeitos em vias. Minimamente, pode permitir a identificação de complexidades associadas com a seleção de destino antes da concepção intervenção.

nós compartilhados A cor vias unidas.

Entende-se que a classificação probabilística de genes em estados alternativos de baixo e para cima é uma simplificação muito maiores padrões de complexidade do comportamento do gene e ação. No entanto, a avaliação empírica dos dados observados conclui que os padrões de expressão genética comumente pode caber uma das duas distribuições alternativas de nível de expressão. Além disso, essa simplificação provou seu valor em outros domínios de investigação. Por exemplo, a simplificação que abstrai a lógica digital do fluxo contínuo de electrões subjacente em circuitos integrados permitiu o desenho de dispositivos de funcionalidade incrivelmente complexa [47].

É claro que o conhecimento actual das vias biológicas é incompleta e imperfeito. Como tal, os processos identificados são quase certamente não os únicos fatores que influenciam os fenótipos de interesse. No entanto, onde são identificados os processos, eles servem como alvos importantes para uma investigação mais aprofundada. Além disso, a abordagem orientada para o processo permite distinguir quais componentes das redes complexas em que os genes participam estão contribuindo diferencialmente a um fenótipo de interesse. O uso combinado de actividade e pontuação consistência permite a discriminação de processos activados por causa do fenótipo versus aqueles cuja lógica difere entre os fenótipos. Este último (consistência), é potencialmente causalmente atribuível ao fenótipo e sugere candidatos que tenham sido alteradas. No entanto, utilizando dados de expressão de genes, dezenas de consistência só pode ser calculado para interações envolvendo eventos de transcrição, limitando o seu poder discriminatório.

Deixe uma resposta