PLOS ONE: Aplicando de agrupamento hierárquico de análise de padrões de proteína no cancro da-Associated Liver

Humana

Abstract

Fundo

Há duas maneiras que os métodos estatísticos podem aprender a partir de dados biomédicos. Uma maneira é aprender classificadores para identificar doenças e para prever resultados usando o conjunto de dados de treinamento com diagnóstico estabelecido para cada amostra. Quando o conjunto de dados de treinamento não está disponível a tarefa pode ser a mina por presença de grupos significativos (clusters) de amostras e explorar estrutura de dados subjacente (aprendizagem não supervisionada).

Resultados

Nós investigamos a proteomic perfis de a fracção citosólica de amostras de fígado humano usando electroforese bidimensional (2DE). As amostras foram ressecados após tratamento cirúrgico de metástases hepáticas em câncer colorretal. agrupamento hierárquico não supervisionado de imagens de gel 2DE (n = 18) revelou um par de clusters, contendo 11 e 7 amostras. Anteriormente, foram utilizados os mesmos espécimes para medir os perfis bioquímicos baseados em actividades enzimáticas do citocromo P450-dependente e também descobriram que as amostras foram claramente dividida em dois grupos bem separadas por análise de agrupamento. Descobriu-se que os grupos de atividade da enzima quase perfeitamente corresponder aos grupos identificados a partir de dados de proteômica. Dos 271 pontos reprodutíveis em nossos géis 2DE, foram selecionados 15 para distinguir os clusters citosólicas do fígado humano. Usando MALDI-TOF fingerprinting da massa dos péptidos, foram identificadas 12 proteínas para os pontos selecionados, incluindo espécies associadas a cancro conhecidos.

Conclusões /Significado

Nossos resultados destacam a importância da análise de agrupamento hierárquico de proteômica de dados, e mostrou concordância entre os resultados de abordagens bioquímicas e proteômicas. Agrupamento das amostras humanas de fígado e /ou pacientes em clusters diferentes podem fornecer insights sobre possível mecanismo molecular do metabolismo de drogas e cria uma base racional para tratamento personalizado

Citation:. Petushkova NA, Pyatnitskiy MA, Rudenko VA, Larina OV , Trifonova OP, Kisrieva JS, et ai. (2014) Aplicação de Hierarchical Clustering para análise dos padrões de proteína no cancro da-Associated Fígado humano. PLoS ONE 9 (8): e103950. doi: 10.1371 /journal.pone.0103950

Autor: Silvia Mazzuca, Università della Calabria, Itália |

Recebido: 26 de fevereiro de 2014; Aceito: 04 de julho de 2014; Publicação: 01 de agosto de 2014

Direitos de autor: © 2014 Petushkova et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. O trabalho foi apoiado pelo Ministério da Educação e Ciência da Federação Russa, Contrato Estadual nº 16.522.12.2002. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

Conflito de interesses:. Dois autores são empregados também por uma empresa comercial Postgen LLC da tecnologia, mas não o fizeram receber pagamento ou serviços da empresa por qualquer aspecto do trabalho apresentado (incluindo mas não limitado a subsídios, o conselho de monitoramento de dados, desenho do estudo, preparação do manuscrito, análise estatística, etc.). Isto não altera a adesão dos autores para PLOS ONE políticas em dados e materiais de compartilhamento.

Introdução

metástases hepáticas geralmente danificar progressivamente a função hepática e são altamente maligno e refratários a terapias convencionais [1] . A compreensão dos mecanismos moleculares e biológicas do cancro colo-rectal pode permitir o desenvolvimento de novas estratégias terapêuticas concebidas para prevenir e tratar metástases hepáticas [2], [3]. Além disso, as terapias de base molecular pode estender o tempo de recidiva hepática após a ressecção curativa e pode prolongar a sobrevida do paciente. O desenvolvimento de estratégias mais eficazes e menos tóxicos anticancerígenos também vai permitir a personalização dos regimes terapêuticos de acordo com as características moleculares de pacientes individuais [4].

estudos de proteômica de amostras de fígado pode ajudar a identificar marcadores de proteínas específicas para metástases [5]. Um dos procedimentos mais utilizados para a caracterização dos componentes proteicos de sistemas biológicos é bidimensional eletroforese em gel de poliacrilamida (2DE) em combinação com espectrometria de massa. Tipicamente, 2DE é usada para comparar as alterações no nível da proteína, a modificação, degradação e entre as amostras tratadas e não tratadas [6]. alterações proteômica pode ser revelado por análise de imagem gel após a visualização por coloração e identificação de espécies de proteínas com expressão alterada ou em estados pós-traducionais [7].

A maioria dos estudos com base na análise 2DE de perfis de proteínas no câncer colorretal são realizado em lisado de tecido de adenocarcinoma colo-rectal, mucosa do cólon adjacente normal, e metástases hepáticas [8] – [10]. Uma estratégia deste tipo é largamente limitado a proteínas abundantes (por exemplo, proteínas estruturais, enzimas glicolíticas, anexinas, catepsinas, e proteínas de choque térmico) que são sobre-expressos em vários cancros [8]. No entanto, estas proteínas podem dificultar a identificação de proteínas de baixa abundância, tal como proteínas de membrana, as quais desempenham um papel fundamental na sinalização celular, as interacções célula-célula, comunicação e mecanismos de transporte, e são alvos de drogas [11]. abordagens orientadas associados com o isolamento de subproteomes material clínico, tais como a secretoma, proteassoma, fracção de plasma-membrana, matriz nuclear, etc, têm surgido recentemente. fracionamento subcelular combinado com técnicas de espectrometria de massa é uma abordagem poderosa para descobrir romance, baixas abundantes, proteínas associadas a colorretais específicos e biomarcadores candidatos [8]. Por exemplo, foram observadas manchas de 1687 proteínas em geles de grande formato (24 × 33 cm) de uma fracção de proteína solúvel de tecidos de mucosa cancerosas e normais e mostrou-se que a intensidade das manchas de proteína ≥96% foi dispersado dentro de diferenças de 2 vezes e 90.5% dentro de diferenças de 1,5 vezes [12]. Para obter uma fracção citosólica do fígado humano em 17 × 24 cm, géis duas vezes menos manchas de proteína (911 pontos) foram combinados [13]. análises imagem 2DE mostrou que o número de manchas de proteínas foram significativamente alterados no câncer primário e lesões metastáticas hepáticas. Alegadamente, a fracção de membrana de cancro primário e metástases hepáticas demonstraram perda do teor de proteína (isto é, o número de manchas de proteínas no gel correspondentes 2DE) em comparação com a fracção de membrana da mucosa colorrectal normal, [10]. Muto et ai. [12] geralmente relatado que o proteoma de tecido normal pode ser mais homogénea do que a dos tecidos tumorais.

Anteriormente, descrevemos uma abordagem para discriminar amostras de microssomas hepáticos em certas classes com base nos perfis bioquímicos [14]. Neste relatório, um projeto experimental para comparar os perfis bioquímicos e proteômica é apresentado (Figura 1). Na primeira etapa desta abordagem obteve-se o perfil bioquímico. Ele incluiu 12 parâmetros, nomeadamente a actividade da NADPH-citocromo P450 redutase, conteúdo de citocromo P450 e atividades monooxigenase dependente de P450 10 citocromo com substratos marcador. Puramente a partir da análise estatística não supervisionada de perfis bioquímicos de microssomas de fígado humano que derivado que os padrões de o sistema monooxigenase hepática formados dois grupos bem separados (Figura 1, A). Foi demonstrado que, pelo menos, 6 variáveis ​​foram significativamente diferentes entre dois grandes conjuntos de amostras de microssomas hepáticos humanos tendo

p

-valor 0,05 com correção de Bonferroni. Além disso, verificou-se que as alterações na actividade da NADPH-citocromo P450 redutase do citocromo compreendem o factor principal, responsável pela separação dos perfis bioquímicos entre dois grupos de pacientes [14].

(a) o perfil é formada por 12 parâmetros, nomeadamente a actividade de NADPH-citocromo P450 redutase, teor de citocromo P450 e actividades monooxigenase dependente de citocromo P450 com substratos de marcador (Petushkova et al., 2010). (B) O perfil incluía imagens 2DE.

Para correlacionar o perfil de proteínas HLC, conforme definido pela 2DE, com atividades bioquímicas do sistema microssomal usamos previamente coletadas amostras de fígado morfologicamente normais torno metástases hepáticas de cólon Câncer. protocolo de ultracentrifugação foi empregado para se obter fracções de citosol de fígado e de microssomas humanos a partir do mesmo espécime de fígado. O presente estudo foi conduzido para comparar os grupos de amostra obtidos de acordo com a actividade bioquímica microssómica (Figura 1, a), com os respectivos perfis citosólicas proteomic (Figura 1, b). Além disso, estávamos interessados ​​na identificação de proteínas solúveis, que podem ser de alguma forma relacionada com a actividade de ligada à membrana citocromos P450.

Materiais e Métodos

Procedimentos éticos

todas as amostras de fígado residual após análise histológica foram aprovados pelo Departamento de anatomia Patológica do Centro de Pesquisa Nacional de Cirurgia da Academia Russa de Ciências Médicas (Moscou, Rússia). O consentimento informado foi obtido de todos os pacientes. Indivíduos concordaram em participar do estudo de acordo comissão de ética da instituição local do Centro Nacional de Pesquisa de Cirurgia. As amostras foram descritas em publicações anteriores [14], [15].

Chemicals

2- [4- (2-hidroxietil) piperazin-1-il] etanossulfónico, phenylmethanesulfonylfluoride (PMSF ), 2,5-di-hidroxibenzóico, ácido etilenodiaminotetracético (EDTA), fosfato de dinucleótido de nicotinamida e adenina, ditionito de sódio, tripsina, e desoxicolato de sódio foram adquiridos a Sigma-Aldrich (St. Louis, MO, EUA); acetonitrilo e ácido trifluoroacético foram adquiridos a partir de ICN Pharmaceuticals Inc. (Costa Mesa, CA, EUA); Azul Brilhante de Coomassie R-250 foi adquirida da Fluka (Seelze, Alemanha). tripsina modificada (catálogo n °. V511C) foi obtido a partir de Promega (Madison, WI, EUA). Outros produtos químicos foram adquiridos de Reakhim-Penza, LLC (Penza, Rússia).

2.3 As amostras de tecido e preparação

As frações de proteínas hepáticas solúvel humanos foram preparados em nosso estudo anterior (armazenadas a -80 ° C antes da utilização) a partir de massas ressecados e descartados de tecidos do fígado circundantes, que foram tomadas a partir de doentes (n = 23) submetidos a cirurgia hepática [14]. Amostras de fígado morfologicamente normais (3-10 g,) foram obtidos a partir da extremidade distal da ressecção, pelo menos, 5 cm fora do tumor. As amostras foram diagnosticadas pela histopatologia.

Como consistiu com condições do experimento, nós não tomar em consideração qualquer informação personalizada sobre os pacientes ou sobre o tratamento do paciente. No entanto, a recolha de amostras foi realizada de acordo com as instruções a seguir: (1) todos os pacientes estavam sob doença do cancro grave, o que levou à cirurgia de fígado talvez depois de um quimioterapia prévia; (2) não radioterapia foi realizada antes da cirurgia; (3) nenhuma evidência de endócrina ou doença metabólica; (4) nenhuma infecção grave foi detectado; (4) as necessidades dietéticas dos pacientes foram gerido pelo Centro Nacional de Pesquisa de Cirurgia a um padrão relativamente uniforme; como resultado, a influência alimentar exógeno sobre perfil metabólico foi limitada ao nível mais baixo. As amostras ressecados foram colocados imediatamente em gelo antes da obtenção da fracção microssómica de fígado humano [14] e HLC. Todos os procedimentos de preparação foram realizadas a 0-4 ° C. As amostras de fígado foram homogeneizados em dois volumes de tampão de homogeneização, contendo EDTA 1 mM, ditiotreitol 1 mM (DTT), 0,1 mM de PMSF, e 150 mM de KCl utilizando um vidro Potter Elvehjem homogeneizador com um pilão de teflon (Sartorius Stedim Biotech GmbH, Goettingen, Alemanha). O homogeneizado de fígado foi sucessivamente centrifugado a 10.000 ×

g Compra de 20 min e 105.000 ×

g Compra de 70 min. O sedimento (fracção microssómica) foi analisada como descrita no nosso estudo anterior [14]. No presente estudo, o sobrenadante foi usado como a fracção HLC. A concentração de proteína das amostras HLC foi estimada utilizando o ensaio de Bradford [16] com albumina do soro bovino como padrão.

prefraccionamento de HLC amostras antes da electroforese bidimensional em gel de poliacrilamida

aliquota de HLC (200? L, 13,2 ± 5,6 mg de proteína) foram misturados com 1 ml de ácido tricloroacético a 10% frio (TCA) em acetona (v /v), contendo 0,07% de mercaptoetanol. Após uma incubação de 3 h a -18 ° C, a mistura foi centrifugada a 20000 ×

g

durante 10 minutos (4 ° C). O sobrenadante foi rejeitado e o sedimento foi dissolvido em 5 mL de acetona fria, contendo 0,07% de mercaptoetanol, e centrifugado como descrito acima. O sobrenadante foi rejeitado e o sedimento resultante foi utilizado para a separação de proteínas por 2DE.

bidimensionais-electroforese em gel de poliacrilamida (2DE)

2DE de proteínas HLC foi realizada como descrito pelo fabricante (Bio -Rad, Hercules, CA, EUA). Para cada amostra de HLC, o sedimento resultante foi dissolvido em 200 mL de tampão de reidratação (4 M de ureia, 2 M tioureia, 4% 3 – [(3-colamidopropil) dimetilamónio] -1-propano sulfonato, 50 mM de DTT, e 0,5 anfolina%). As proteínas foram carregados por rehidratação passivo para 11 cm, não linear, imobilizada, gradiente de pH (IPG, pH 3-10) tiras durante a noite (14 h) a 50 V e durante mais 30 min a 250 V. Focalização isoeléctrica (IEF) foi realizadas usando a célula Protean IEF (Bio-Rad) com um gradiente aplicado 250-5500 V para um total de 35.000 V-h. Todos os passos de IEF foi realizada a 20 ° C. Seguindo o IEF, as tiras de gel IPG foram equilibradas em tampão de equilíbrio (Tris-HCl a 50, pH 6,8, ureia 6 M, 2% de dodecilsulfato de sódio (SDS), 20% de glicerol) contendo 1% DTT e agitou-se durante 30 min a 50 rpm num agitador orbital [17]. As tiras de IPG foram transferidas para a solução de equilíbrio, que contém 2,5% de acrilamida, e agitada durante um adicional de 30 min antes da separação num gel de poliacrilamida (135 × 80 × 1,0 mm de gel de meia 4%, e 12% de gel de resolução). A separação na segunda dimensão foi realizada usando o Mini-Protean celular Dodeca (Bio-Rad) e tampão Tris-glicina (base Tris 25 mM e glicina 192 mM), contendo 0,1% de SDS, a 150 V. Tempo de ensaio foi de aproximadamente 60 min e sobre a saída de azul de bromofenol para o tampão, a separação electroforética foi considerada completa.

Proteína visualização e de análise de imagem

os géis foram submetidos a coloração com prata [18], as imagens do gel foram adquiridos utilizando um Calibrado Densitometer GS-800 (Bio-Rad) e enviados para a imagem digital proprietária GelEditor software de análise. Ele é escrito em Java e ferramentas supportsl para carregar imagens, detecção de ponto automatizado baseado na Laplacian de filtro Gaussian, detecção de ponto manual de correspondência de perfis de proteínas, e uma opção para salvar os relatórios (Figura S1). A intensidade da mancha no gel foi calculada como a soma dos pixels num local detectado manualmente. O software GelEditor pode ser baixado gratuitamente a partir www.bioinformatics.ru/geleditor.zip.

digestão In-gel

Os spots de proteínas (~ 3 mm

3) foram excisadas do gel utilizando modificado 250 uL dicas e descorados com 50 ul de 100 mM K

3 [Fe (CN)

6] e tiossulfato de sódio 100 mM numa proporção de 1:01 (v /v) por cada peça de gel à temperatura ambiente durante 30 min. Em seguida, os pedaços de gel foram lavados com água à temperatura ambiente e agitou-se durante 15 minutos a 50 rpm num agitador orbital. O procedimento foi repetido três vezes. Em seguida, os pedaços de gel foram lavados duas vezes com 150 mL de NH mM 50

4HCO

3 em 50% de acetonitrilo a 37 ° C, agitou-se durante 15 minutos a 50 rpm num agitador orbital e incubados durante 15 min em solução de desidratação (100% acetonitrilo). Depois de o acetonitrilo foi removido e os pedaços de gel seco, 8 ± 2.0 ul de solução de tripsina (25 ng /mL de tripsina modificada em 50 mM de bicarbonato de amónio) foi adicionado e a mistura foi incubada a 37 ° C durante a noite. Em seguida, 15 ul de ácido trifluoroacético 0,7% foram adicionados a cada pedaço de gel e as amostras foram incubadas durante 2 h à temperatura ambiente. Os péptidos trípticos foram extraídos utilizada para análise de espectrometria de massa

dessorção a laser de ionização por espectrometria de massa de tempo-de-voo assistida por matriz (MALDI-TOF MS)

Cada mistura de péptidos proteolíticos (1. mL) foi flagrado em um alvo MALDI (600/384 Anchor chips; Bruker Daltonik GmbH, Bremen, Alemanha), em três repetições e secas ao ar. Para ionização, uma solução de 2,5-dihidrobenzóico ácido (3 mg /mL) em acetonitrilo e 0,7% de ácido trif luoroacético (01:01 v /v) foi utilizado. Os espectros de massa no

m /z

gama de 600-4000 foram adquiridos manualmente usando software FlexControl (Bruker Daltonik GmbH) no modo de extração de reflexão /atrasada com uma voltagem de aceleração de 25 kV e um atraso de 135 ns usando o Ultraflex II MALDI-TOF MS analisador (Bruker Daltonik GmbH). Todos os espectros de massa representada sinais média de 100 disparos de laser de um local em um ponto de amostra. A partir de cada ponto de amostra, 4-6 espectros de massa foram adquiridos. fluência do laser foi ajustada acima do limiar de dessorção da matriz para se obter a melhor resolução e precisão da medição de massa a mais elevada. Os sinais com uma relação S /N 6 e um máximo de 100 picos por espectro foram usadas para criar listas de pico com o algoritmo SNAP (software FlexAnalysis ver 2.0;. Bruker Daltonik GmbH) e internamente calibrado com produtos tripsina autólise (

m /z 842.5094

e 2211.1046 Da, respectivamente). listas de pico resultantes foram utilizadas para pesquisar a base de dados contra UniProtKB /Swiss-Prot (UniProt libertar 2012_09 – 11 de setembro de 2012). Identificação por impressão digital de massa do péptido (FMP) foi realizada usando software de Mascot (Matrix Science, Inc., Boston, MA, EUA). Durante a pesquisa de banco de dados, um máximo de uma clivagem dispensada foi deixada, foi usada uma tolerância de 80 ppm em massa, e modificações variáveis, tais como a oxidação de metionina e cisteína modificação com acrilamida, foram tidos em conta. A tolerância apropriado m /z (80 ppm) foi estimada como desvio máximo de massa baseado em distribuição estatística de erros em massa em todos os espectros e seu desvio padrão.

A análise estatística

O conjunto de dados inicial consistiu em 19 amostras (géis 2DE), cada uma caracterizada, em média, por manchas 271 ± 99 proteína /características (Tabela S1). Gel Nenhuma. 6 foi utilizado como gel de mestre para o alinhamento manual ponto-a-ponto. Uma vez que estávamos interessados ​​em comparar os resultados com o conhecimento prévio sobre os perfis bioquímicos medidos para as mesmas amostras [14], também foram excluídos no.4 gel porque em nosso estudo anterior foi considerado como um outlier; por isso, tivemos uma coleção de 18 imagens de gel. Para garantir estudo de reprodutibilidade e diminuir a sensibilidade de ruído, analisamos apenas as diferenças qualitativas entre géis em termos de presença /ausência de uma determinada spots de proteínas. Cada gel foi replicada três vezes e a melhor réplica foi seleccionado por inspecção visual da qualidade da separação. conjunto de dados final foi apresentado como um D matriz binária que consiste em 18 linhas (géis imagens) e 389 colunas (manchas), onde

d

ij

= 1 se

j

local -ésimo estava presente em

i

gel -ésimo, caso contrário,

d

ij

= 0. Para o agrupamento gel, utilizou-se o método de Ward. Distância métrica entre dois vectores binários foi definida como o número de bits que diferem dos vectores (também conhecido como a distância de Hamming). Todos os cálculos e gráficos foram realizados com R linguagem estatística (www.r-project.org). O código-fonte do script de análise de dados pode ser encontrado em Análise de Dados Script S1. Para medir a similaridade entre agrupamentos dois dados, foi calculado o índice de Rand ajustado cujo valor está no intervalo entre -1 e +1, onde um corresponde a perfeita concordância entre as partições.

Resultados e Discussão

Em nossos experimentos todas as amostras foram retiradas de uma categoria de doentes: tratamento cirúrgico de metástases hepáticas decorrentes de câncer de cólon (Figura 1). Por isso, o nosso objectivo não era encontrar diferenças entre norma e câncer, mas sim para explorar a estrutura interna do conjunto de dados de um grupo, descrevendo sistema de fígado de droga metabolização humana e fracção de citosol (presente estudo). Em estudo anterior sobre o metabolismo de fármacos [14], apesar do tamanho da amostra relativamente modesto (n = 22) a nossa resultados, sem dúvida, confirmou a presença de dois grupos de dados. Calculamos critérios largura silhueta de validade do cluster, que mostraram que a presença de dois grupos é confirmado com confiança muito alta (p 0,0001). Portanto, a heterogeneidade revelado dentro de um grupo igualmente tratados dos pacientes foi de um fundo para a investigação proteômica atualmente relatados.

análise 2DE de HLC

Estudos sobre os tecidos hepáticos humanos têm sido realizados para identificar se existem grupos de amostras distintas nos seus proteomas. O proteoma HLC foi caracterizado por um conjunto representativo de amostras separadas por 19 2DE em géis de formato médio em três repetições, portanto, um total de 58 imagens 2DE foram examinados. Os melhores repetições 2DE foram selecionados entre as pistas técnicas de acordo com a qualidade de separação (Figura S2). As imagens representativas seleccionadas foram convertidos nas listas no local e mais agrupado usando o método sem supervisão. De forma consistente com nosso trabalho anterior com microssomas de fígado aqui usamos uma abordagem sem supervisão porque a informação clínica sobre as amostras de fígado ressecado foi indisponíveis.

Nós rejeitou algumas amostras devido à baixa qualidade de separação 2DE por causa de peculiaridades na preparação da amostra (Figura 2). As imagens 2DE típicas do gel Ag-manchado de nenhuma amostra. 6 antes e depois prefraccionamento com TCA em acetona (ver Materiais e Métodos) são mostrados na Figura 2,

um

e

b

. Sem prefraccionamento, 2DE da fracção de citosol dificulta separação de spots de proteínas (Figura 2

um

). Figura 2

b

é uma imagem do gel mestre representativa que mostra a separação de proteínas a partir de tecido de fígado humano, após precipitação com TCA /acetona. Esta prática é muitas vezes empregada para remover contaminantes porque minimiza a degradação da proteína [19], mas precipitação com TCA /acetona foi insuficiente para a obtenção de imagens de gel apropriadas dos nsa amostra HLC. 20-23, por isso, excluídos destas amostras de análises posteriores. No total, 687 spots de proteínas foram resolvidas num gel 2DE corado com prata de no.6 amostra HLC, execução técnica # 1, usando a ferramenta de detecção de ponto de software GelEditor. Para além da coloração de prata com base no protocolo de Shevchenko et al. coloração com azul de [18] Coomassie também foi sondado neste estudo e apenas a cerca de 100 manchas de proteína foram detectadas no mesmo n.6 em gel (Figura 2

C

).

30 ug do humano fração de proteína hepática solúvel (HLC) foi separado por 2DE e visualizados por coloração de prata (

a

e

b

) ou coloração com Coomassie Brilliant Blue (

c

):

a Restaurant – HLC antes de pré-tratamento com ácido tricloroacético em acetona;

b

e

c –

HLC após pré-tratamento. Usando coloração Coomassie cerca de 100 spots de proteínas poderia ser revelado, mas usando rotulagem coloração de prata até 687 spots de proteínas foram detectadas automaticamente. Spots nos. 14, 25, 34, 36, 48, 56, 62, 63, 66, 210, 214, 219, 247, 252, 275, 276, 279, 301, 321, 322, e 408 são comuns para todos os géis 2DE de 19 amostras citosol de fígado humano.

As imagens dos géis obtidos foram analisados ​​para caracterizar a reprodutibilidade local e variabilidade. Observou-se que 96% das manchas proteicas estavam no limite inferior do limite de detecção de tiossulfato de prata com uma intensidade normalizada 0.02 unidades relativas. Observou-se uma intensidade média de 0,02-0,04 unidades de 2% de manchas, enquanto que 1% de pontos foi de alta abundância com intensidade relativa . 0,1 unidades

Além disso, foi selecionado o gel mestre como o melhor gel com o maior número de pontos e mínima gama de espalhamento da intensidade média de cada ponto. O gel mestre correspondeu a amostra não 6. Para estimar a variação técnico da nossa configuração experimental, realizamos quatro corridas replicativas independentes de HLC provar não. 6 em momentos diferentes. No primeiro passo da análise que usamos número de pontos como uma medida aproximada da reprodutibilidade gel. Um total de 449, 420, 444, e 406 manchas de proteína foram detectadas nestas pistas nas gamas de pi 3,5-10,0 e 10-250 kDa MW. O número médio de pontos observada foi de 430 ± 20, que era comparável aos dados anteriores, obtidos a partir da fracção citoplasmática de hepatócitos humanos primários em linhas de células HepG2 e Hep2B [20]. Os géis restantes continham suficientemente menos pontos, como mostrado na Figura 3 para 19 amostras HLC. Em toda a série, o nero mio de manchas de proteínas detectadas manualmente era 271 ± 99 (média ± DP, n = 58). As quantidades exatas eram três vezes mais baixa em comparação com os resultados relatados anteriormente de análise da fração citosólica de amostras de tecido do fígado humanos [13], [21], [22]. A diferença no número de ponto foi, provavelmente, devido à configuração 2DE, como utilizado 11-cm tiras de IPG, em vez de 17 cm, utilizados por Wimmer et ai. [13] e Kim et al. [23], e assim os gradientes de focalização isoeléctrica eram mais curtos. Kim et al. [23] analisados ​​regiões não tumorais de tecidos de cancro do fígado e ressecção do tumor por meio da identificação de proteínas citosólicas utilizando 2DE e MALDI-TOF-MS. Eles utilizaram coloração de prata para a detecção de proteína nos géis e observado até 1060 pontos e identificou 127 proteínas; também relataram que um problema com a variabilidade das intensidades de mancha foi decidido usando intensidades normalizadas.

Gel do cluster 1 estão apresentados nas colunas brancas. Os geles que pertencem ao grupo 2 são mostrados nas colunas cinzentas. Gel que removeu a partir de todo o processamento de dados subsequente é mostrado na coluna sombreada.

Para avaliar a variabilidade de gel para gel, foram comparados os pontos entre quatro imagens gel replicados obtidos a partir da amostra não. 6 usando o recurso de correspondência local manual do software de GelEditor proprietário (Figura S1). Cada repetição foi alinhado manualmente para a imagem principal, que continha um número máximo de pontos. Descobrimos que 102 manchas estavam presentes em pelo menos três replicados, 80 pontos combinados metade dos géis, enquanto que 58 manchas estavam presentes no gel somente mestre. Por fim, 47% das manchas (spots) 209 combinados todas as quatro imagens 2DE replicados.

Para determinar a reprodutibilidade de 2DE, nós investigamos funcionamentos técnicos da amostra HLC 6, analisadas as intensidades normalizadas de cada local, e plotados os uns contra os outros em um X-Y e uma quantil – parcelas quantílicas (Q-Q) [24]. As parcelas X-Y para o no.6 exemplo, executar técnica # 1 (gel master) em comparação com a mesma amostra, execução técnica # 2 mostram um coeficiente de correlação de Pearson r = 0,797 (Figura 4

a

). Foi realizada essa análise para todas as quatro corridas técnicas do gel 6 e determinado o coeficiente de correlação de Pearson média, que era igual 0,72 ± 0,06 (média ± 95% intervalo de confiança). A magnitude do coeficiente de correlação r 0,7 sugere uma correlação forte, enquanto parcelas Q-Q foram usadas como uma ferramenta gráfica para a comparação de duas distribuições entre si. Dois conjuntos de dados seriam considerados idênticos se os pontos nas parcelas Q-Q mentir perto de uma linha de regressão

y = x

. Como mostrado na Figura 4b este critério é cumprido perfeitamente para proteínas HLC

intensidades local normalizadas nos dois ensaios técnicos do gel no.- enredo Y e quantil-quantil. (Q – Q) enredo. O X – Y trama mostra uma forte correlação entre as intensidades de mancha com um coeficiente de correlação de Pearson r = 0,797 (a). Q – lote Q mostra alta similaridade entre a distribuição de intensidades ponto (b). A intensidade de cada ponto correspondente no gel foi normalizado por intensidade global de pontos correspondentes dentro deste gel.

As manchas altamente reprodutível (209) foram utilizadas para estimar a variação de intensidade local em quatro repetições por amostra HLC não 6. no histograma coeficiente de variação (CV) de distribuição (ver Figura 5), ​​65% de manchas foram caracterizados por um CV 0,6. Este grau de variação entre os géis replicadas foi comparável ao observado CV entre tecido normal versus várias fases do cancro [9], [25]. Por exemplo, Shi et al. [9] observou um CV média de 62-69% em 1223 recursos à vista de 18 perfis de ponto 2D DIGE entre diferentes grupos de amostras (mucosa do cólon normal de, câncer colorretal primário e metástases hepáticas). Os autores descobriram que ambos os tumores primários e secundários apresentado um significativamente maior grau de variação de volume do que o local do cólon normal.

intensidade de cada ponto correspondente no gel foi normalizado por intensidade global de pontos correspondentes dentro deste gel.

de um modo geral, o CV depende do tipo de material biológico, bem como a preparação da amostra e detecção de ponto abordagens [26], [27]. Na coloração de prata, os pontos correspondentes preparados e executados em condições idênticas variam em intensidade; portanto, é difícil de alcançar uma reprodutibilidade mesmo com repetições paralelas [26]. Portanto, como os nossos géis eram pouco reprodutível nas intensidades dos pontos correspondentes, nós não usar valores de intensidade para uma análise mais aprofundada, mas converteu os pontos em formato binário: ou há uma mancha, ou não

3.2. agrupamento não supervisionado dos géis e amostras microssômicas

Nós usamos análise de cluster para separar géis e elucidar grupos em nossa coleção de amostras de fígado. Inicialmente, pontos em cada gel 2DE foram recolhidos para as manchas no gel master (no. 6 # 1) usando o script Perl (Análise de Dados Script S2). Nossos resultados foram formatados em uma tabela em que as linhas indicou os spots de proteínas e as colunas representadas amostras HLC. Se a mancha de proteína estava presente no gel de HLC e gel de mestre, o valor da célula foi fixada em “1”, caso contrário, se o local estava ausente na próxima gel de HLC, que foi estabelecido em “0”. Foi realizada análise de agrupamento hierárquico da matriz de dados usando o método de Ward, juntamente com a distância de Hamming métrica. Clustering de géis 2DE das amostras HLC foi visualizado como um dendrograma (Figura 6

a

). Dois grupos principais foram claramente distinguidos: o primeiro (aglomeram no 1.) Foi formado por géis nos. 1-3, 5, e 7-13, enquanto que o segundo (Grupo 2 sem.) Incluído géis n ° s. 6 run técnica # 3, e 14-19. Assim, o método de Ward produziu dois grupos de amostras de fígado. Curiosamente, o histograma na Figura 3 preliminarmente apontou para a existência de dois grupos para as amostras HLC. O número médio de manualmente detectado spots de proteínas em géis de aglomerados nos. 1 e 2 eram 219 ± 72 e 342 ± 91 (média ± DP), respectivamente; No entanto, a diferença no número de pontos era estatisticamente insignificante (

P

0,05, n = 18)..

Dois grupos principais pode ser visto

de acordo com nossos dados anteriores, microssomas de fígado humano também segregados em dois grupos [14]: a primeira continha amostras nos. 03/01, 12/05, e 23, ao passo que o segundo continha amostras n ° s. 13-22 (Figura 1A). Assim, houve uma correlação entre o agrupamento amostra emergiu das duas abordagens experimentais absolutamente diferentes.

O índice Rand foi de 0,58, indicando uma correspondência significativa [27] entre os dados bioquímicos e proteômica. Encontrou-se uma ligeira diferença entre a composição do grupo das amostras HLC ea microssomal fígado humano (droga que metabolizam) do sistema. Essas mudanças foram particular, à HLC amostras nos. 6 e 13, atribuída a agrupar-nos.

Deixe uma resposta