PLOS ONE: multi textura Análise de Colorectal Cancer Continuum Usando Multispectral Imagery

Abstract

Purpose

Este trabalho propõe caracterizar o continuum de cancro colorectal (CRC) usando várias características de textura extraída de multiespectral As imagens de microscopia óptica. Três tipos de tecidos patológicos (PT) são considerados: a hiperplasia benigna, neoplasia intra-epitelial e carcinoma

Materiais e Métodos

Na abordagem proposta, a região de interesse contendo PT é primeiro extraído de multiespectral. imagens usando segmentação contorno ativo. Esta região é então codificado utilizando características de textura com base no filtro de Laplacian-de-Gaussian (log), pequenas ondas discretas (DW) e matrizes de co-ocorrência dos níveis de cinza (GLCM). Para avaliar a significância das diferenças de textura entre os tipos da PT, é realizada uma análise estatística com base no teste de Kruskal-Wallis. A utilidade das características de textura é então avaliado quantitativamente em termos de sua capacidade de prever tipos PT utilizando vários modelos de classificador.

Resultados

Os resultados preliminares mostram diferenças significativas entre textura tipos PT, para todas as características de textura (

p

-valor 0,01). Individualmente, características de textura GLCM superar características log e DW em termos de tipo PT previsão. No entanto, um maior desempenho pode ser alcançado através da combinação de todas as características de textura, resultando numa precisão da classificação média de 98,92%, a sensibilidade de 98,12%, e especificidade de 99,67%.

Conclusões

Estes resultados demonstrar a eficiência e eficácia da combinação de várias características de textura para a caracterização do continuum de CRC e discriminar entre tecidos patológicos em imagens multiespectrais

Citation:. Chaddad a, Desrosiers C, Bouridane a, Toews M, Hassan L, Tanougast C (2016) multi textura Análise de colorectal Cancer Continuum Usando imagens multiespectrais. PLoS ONE 11 (2): e0149893. doi: 10.1371 /journal.pone.0149893

editor: Masaru Katoh, National Cancer Center, JAPÃO

Recebido: 27 de novembro de 2015; Aceito: 05 de fevereiro de 2016; Publicação: 22 de fevereiro de 2016

Direitos de autor: © 2016 Chaddad et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Data Availability:. Os dados são disponível em S1 (https://figshare.com/s/5e9c65848bb0aa1f4032 ou DOI: 10,6084 /m9.figshare.2076220).

financiamento:. Os autores não têm apoio ou financiamento para relatar

Conflito de interesses: Os autores declararam que não existem interesses conflitantes

Introdução

O câncer colorretal (CRC) é um tumor maligno comum ter uma incidência crescente em muitos países desenvolvidos.. É o terceiro câncer mais comum recém-diagnosticados, sendo responsável por 8% dos novos casos a cada ano, e também a terceira causa mais comum de morte por câncer em homens e mulheres [1]. Estima-se que 26,270 homens e 24,040 mulheres morreram de carcinoma colorretal em 2014, conforme relatado pela American Cancer Society. A ressecção cirúrgica do tumor primário com finalidade curativa é possível, em apenas 70% dos pacientes [2, 3]. Infelizmente, até 30% de pacientes de CRC que se submetem a ressecção cirúrgica do tumor primário experiência uma recaída subsequente dentro de três anos, com um tempo médio para a morte de 12 meses [4]. Estudos de imagem são frequentemente utilizados para avaliar os pacientes para o rastreio e estadiamento do câncer colorretal. técnicas de imagem transversal, como a tomografia computadorizada (TC) [4], a ressonância magnética (MRI) [5] e microscopia fornecer informações anatômicas e morfológicas sobre a estrutura e os padrões do tumor [6]. Neste informações, textura, e, em particular, a heterogeneidade da textura, é uma característica proeminente da CRC que se manifesta como áreas de densidade celular elevada.

Uma tendência recente computacional foi a análise de imagens de alta resolução de deslizamento inteiros produzido a partir de lâminas de patologia digitais [7, 8]. Características de textura extraídas de tais imagens servem como uma entrada para importantes aplicações computacionais, tais como diagnóstico auxiliado por computador a partir de patologia. Um estudo anterior por Esgiar et al. mostrou que as características entropia textura extraídos a partir de matrizes de co-ocorrência de nível de cinza (GLCM) foram capazes de diferenciar entre o tecido normal e canceroso [6]. Um estudo de seguimento dos mesmos autores incorporados dimensão fractal na análise recurso para melhorar a sensibilidade e especificidade da classificação [9]. Usando histogramas dos canais de cor, GLCM e características estruturais, Kalkan et al. conseguida uma precisão de 75,15% na classificação dos quatro tipos de tecidos do cólon: normal, cancerosos, adenomatosos e inflamatórias [10]. Jiao et ai. propôs um método para detecção automática do cancro do cólon, usando GLCM para extração de textura e máquinas de vetor de suporte (SVM) para a classificação. Este método alcançada uma precisão de 96,67% em diferenciar entre imagens cancerosas e não cancerosas [11]. Hilado et ai. usados ​​2D wavelet discreta (DW) transformar recursos para classificar imagens inteiras de câncer de cólon de slides em casos normais, cancerosos e adenomatosos pólipos, relatando uma precisão de 91,11% [12]. Francesca et ai. usados ​​características de textura tumor inteiro, calculado usando filtros (LOG) Laplaciano-de-Gaussian para avaliar a heterogeneidade da [4] CRC. Em um estudo posterior, Rao et al. recursos de logs de textura considerado discriminação entre pacientes com CCR com e sem metástases hepáticas [13]. Várias abordagens utilizando descritores locais também têm sido propostas, incluindo métodos baseados em função escala invariante Transform (SIFT) [14], a forma de contexto [15], e histogramas de inclinação orientada (HOG) descritores [16]. Porque dependem de pontos-chave que podem variar de um assunto para outro, chave SIFT e forma de contexto baseado em pontos apresenta métodos nem sempre são adequados para a avaliação das anormalidades celulares a partir de sistemas de microscopia óptica. Da mesma forma, os métodos baseados em arco de não são invariantes para rotações que ocorrem em imagens microscópicas. Há argumentos fortes, assim, apoiar o uso de recursos de rotação invariante textura derivados de GLCM, filtros de log e DW para este problema específico.

Como uma metodologia geral, tecidos patológicos (PT) resultantes de anormalidades celulares no CRC, tais como a hiperplasia benigna (BH), neoplasia intra-epitelial (eM) e de carcinoma (Ca), pode ser detectada a partir de sistemas de microscopia óptica clássico utilizando uma variedade de técnicas de processamento de imagem [17-19]. Este estudo se propõe a modelar o continuum de CRC usando ricos, características de textura informativos obtidos a partir de imagens de microscopia óptica multiespectrais. O poder discriminatório de características de textura pode ser apreciado a partir da Fig 1, em que o histograma de intensidades de pixel é mostrado para imagens dos tipos BH, IN e Ca. Pode ser visto que BH, IN e tecidos Ca exibem visivelmente diferentes perfis de intensidade, apoiando a ideia de que tal característica pode ser utilizada para diferenciar entre estas tipos PT. A novidade deste trabalho está na análise comparativa e combinação de três características diferentes texturas baseadas em GLCM [17], a Log [4] e DW [20], para prever tipos PT. Como será mostrado em nossos experimentos, usando a informação multi-textural pode melhorar a detecção e classificação de tecidos patológicos, e fornecer uma compreensão mais abrangente da ligação entre o CRC ea heterogeneidade do tecido. Os potenciais impactos deste trabalho na melhoria da assistência médica são duas vezes. Em combinação com abordagens padrão para rastreio de CRC, o método proposto pode melhorar a detecção da doença na sua fase inicial, aumentando assim as hipóteses de sucesso do tratamento. De acordo com a American Cancer Society, a taxa de sobrevivência relativa de 5 anos é de cerca de 90% quando CRC pode ser detectado antes de se espalhar [21]. A classificação das anormalidades celulares em tecidos patológicos também é essencial para avaliar a progressão da CRC e selecionar o curso adequado de tratamento. Usando características de textura, o nosso método oferece uma maneira eficaz de caracterizar as propriedades dos tecidos a nível celular. Medir a informação textural em vários pontos no tempo poderia ajudar a controlar a progressão da doença e avaliar a eficácia de um determinado tratamento

(a) hiperplasia benigna.; (B) neoplasia intra-epitelial; (C) carcinoma; (D, E, e F) distribuições de intensidade histogramas mostram de pixel para cada tipo.

Materiais e Métodos

Este estudo foi aprovado pelo conselho de revisão institucional da patologia anatômica (Anapath ) Departamento no Nancy-Brabois Hospital CHU. O conselho de revisão dispensou a necessidade de consentimento informado por escrito dos participantes. Parte dos dados foi utilizado em estudos anteriores [18, 22, 23]

O quadro proposto, mostrado na Figura 2, consiste numa série de cinco passos:. 1) preparação de amostras e de aquisição de imagem, 2) segmentação de ROI, 3) extração de características de textura, 4) classificação do tipo PT, e 5) avaliação de desempenho. Uma apresentação detalhada de cada etapa é dada nas secções seguintes.

(a) sistema de microscopia óptica, coloração, corte e digitalização. (B) aquisição de imagem multiespectral através de uma câmera CCD em uma série de bandas espectrais visuais. (C) algoritmo de segmentação de contorno ativo para delinear ROIs. (D) GLCM, faça o login e DW extração de características imagem da textura. (E) classificação supervisionada para a previsão automática de tipos de tecidos anormais de novas amostras.

A preparação da amostra e aquisição de imagem

Os dados CRC foram coletados a partir da anatomia patológica (Anapath) Departamento de na CHU Hospital Nancy-Brabois. As amostras de tecido foram obtidos a partir ressecções sequenciais de dois pontos de 30 pacientes com câncer colorretal. As secções de 5 um de espessura foram extraídos e coradas com hematoxilina a amplamente utilizado e eosina (H E) manchas, para reduzir os requisitos de processamento de imagem. As imagens foram capturadas em baixa ampliação (× 40) usando um microscópio óptico montado com uma (CCD) Charge Coupled Device. Um filtro de cristal líquido sintonizável (LCTF) foi colocada no percurso óptico entre a fonte luminosa e a câmara CCD, proporcionar uma precisão de largura de banda de 5 nm e um comprimento de onda controlável através do espectro visível 500-650 nm [24]. Esta técnica, conhecida como imagiologia hiperespectral ou multi-espectral [25], pode capturar imagens de amostras de tecido em diferentes frequências espectrais. Neste estudo, 16 bandas multiespectrais foram adquiridos na faixa de comprimento de onda de 500-650 nm, com 9,375 passos nm entre bandas sucessivas.

Os dados de 30 pacientes de CRC (10 BH pacientes, 9 em pacientes e 11 Ca pacientes) foram obtidos para análise, dando um total de 160 imagens BH, 144 em imagens, e 176 imagens Ca. Os dados estão disponíveis em S1 Zip (https://figshare.com/s/5e9c65848bb0aa1f4032 ou DOI: 10,6084 /m9.figshare.2076220). A identificação de cada tipo PT a partir de imagens multiespectrais foi feito por um histopathologist sênior, confirmando o diagnóstico. Finalmente, as imagens foram denoised usando um filtro de média e redimensionada para uma resolução de 512 × 512 pixels.

Activo contorno segmentação baseada em

segmentação contorno ativo foi usado para identificar limites de tecido dentro da imagem. Esta técnica de segmentação, o que move uma curva iterativa dinâmica em direcção contornos de objectos na imagem, é bem adaptado para delinear formas irregulares [26, 27]. Embora se possa conseguir uma precisão elevada, também pode sofrer de longos tempos de execução. Para acelerar o processo de segmentação, que limita o número de iterações com base em cálculos empíricos [17]. Uma abordagem multi-escala foi utilizada para reduzir ainda mais os tempos de execução através da realização de uma segmentação inicial numa resolução grosseira de 64 × 64 pixels e depois refinar esta solução a uma alta resolução de 512 × 512 pixels. Usando esta técnica, segmentações foram obtidos em menos de um minuto com um PC padrão (Intel Core i5 processador de 3.4 GHz com 32 GB RAM). Note-se que o desempenho de tempo de execução pode ser melhorado através de tecnologias computacionais especializados alternativos, como um algoritmo de gasoduto com base em field-programmable gate array tecnologia (FPGA) [28].

segmentações verdade terrestre, uma segmentação por amostra, foram obtidos manualmente usando 3D Slicer [29] e validado por dois patologistas. Um exemplo de uma segmentação verdade chão é dado na figura 3. As imagens verdade de campo foram usadas para avaliar o desempenho da segmentação do contorno activa (figura 4), com base nos seguintes resultados: Dados coeficiente de similaridade (DSC), a taxa de falsos positivos ( FPR) e taxa de falsos negativos (FNR). DSC mede o grau de correspondência (similaridade) entre a verdade chão e segmentado ROIs, e é definido como (1) onde

A

e

B Quais são conjuntos de pixels correspondente a terra regiões verdade e segmentados , respectivamente.

(a) imagem original. (B) imagem segmentada. (C) imagem rotulada. área rotulada em (c) corresponde ao ROI usado para extração de características de textura.

As imagens da linha superior corresponde ao (a) BH, (b) tipos IN e (c) Ca. imagens de fundo-linha (A’), (B’), e (c’) mostram o ROI obtido nestas imagens pelo método de segmentação de contorno ativo.

O FPR e FNR são duas medidas de mais e sob segmentação, e são calculados da seguinte forma: (2) (3) onde contém os pixels que não são na verdade terrestre definir

a

recurso textura extração

Três. tipos de filtros de textura, com base no registro, DW e GLCM, foram aplicadas à ROIs segmentada em cada banda espectral. Características de textura foram então extraídas das imagens filtradas através da aplicação de funções quantificadores especializados (Fig 2).

Texture base de log.

O Laplacian de Gaussian (log) filtro pode ser visto como a combinação de um operador de suavização Gaussian com um kernel de sigma largura (

σ

) e um filtro isotrópico, o Laplaciano, que mede a segunda derivada espacial na imagem. O log é comumente usado para detectar bordas e gotas em várias escalas. Para cada ROI segmentada, um filtro de log foi aplicado utilizando

σ

valores de 0,5 (tipo de textura fina), 1,5 (tipo de textura média) e 2,5 (tipo de textura grossa). A região foi então quantificada pelo cálculo da média (

A

), desvio padrão (

SD

) e entropia (

Ent

) dos seus valores de log. O quadro teórico desta técnica é descrita em detalhe no Apêndice B da Ganeshan et al [30]. Vamos

f

(

x

,

y

) ser o valor de log de um pixel (

x

,

y

) em a região segmentada

Ω

. Para o cálculo da entropia, nós discretizar a distribuição dos valores de log em intervalos 256 de igual tamanho e denotam como

Ω

k

o subconjunto de pixels dentro da

k

intervalo -ésimo. As funções LoG quantificador pode ser definida da seguinte forma: (4) (5) (6)

Para cada amostra, assim obtido um conjunto de 9 de textura: (7) onde

f

,

m

, e

c

representam a fina, média e textura grossa.

texture baseado em Wavelet Discreta (DW) Transform.

a DW Transform (DWT) analisa uma imagem decompondo-o em uma aproximação grosseira através de filtragem passa-baixa e um componente detalhadas através de filtragem passa-alta. A decomposição é efectuada recursivamente nos coeficientes de aproximação passa-baixo obtidos em cada nível, até que o número necessário de iterações é alcançado [31]. Quatro direções de decomposição (sub-bandas) são considerados: horizontal (0 °, D

h), primeira diagonal (45 °, D

d), vertical (90 °, D

v) e segunda diagonal (135 °, d

d). A decomposição na cada nível

i

fornece uma matriz de aproximação (imagem) A

i e três detalhe matrizes, ou seja, Dh

i (matriz de coeficientes horizontal), Dv

i (vertical matriz de coeficientes) e DD

i (matriz de coeficientes diagonal).

a um nível 2D DWT decomposição foi aplicado em cada ROI, codificando a textura da região como um componente de baixa frequência a

1 e três componentes de alta frequência: D

d1 (detalhe diagonal), D

v1 (detalhe vertical), e D

h1 (detalhe horizontal) (Fig 5). Três funções quantificadores, medindo entropia (

f

1DW), energia (

f

2DW) e variância (

f

3DW), foram aplicados à matriz de coeficientes DWT média (ou seja, a média de uma

1, DH

1, Dv

1 e DD

1 matrizes) de daubechies (dB), Coiflet (coif) e Symlet (sym) filtros, respectivamente. Para cada amostra, 9 características de textura à base de DW foram obtidos, que correspondem à seguinte vector de características: (8)

R corresponde às linhas, C corresponde a colunas, G e H são o índice de baixo e passa-alto filtrar, respectivamente, 2ds1 e 1ds2 são as colunas e linhas para baixo-amostra, respectivamente, e {x} é o operador de convolução.

Texture matricial nível de cinza co-ocorrência.

proposta por Haralick em [32], a matriz de co-ocorrência de nível de cinzento (GLCM) é um método de análise de textura eficiente que utiliza estatísticas de segunda ordem para caracterizar as propriedades de dois ou mais valores de pixel que ocorrem em locais específicos em relação ao outro. Formalmente, matrizes GLCM representam as probabilidades

P

d

,

θ

(

i

,

j

) de transição de um pixel com intensidade

i

a um pixel da intensidade

j

separados por um vetor de translação definido pela direção

θ

e offset

d

( também conhecido como a distância). Dada uma imagem 2D

I

de tamanho

N

×

N

, a matriz de co-ocorrência

P

d

,

θ

(

i

,

j

) pode ser definida como (9) onde

dx

e

dy

especificar a distância entre o pixel de interesse e o seu vizinho ao longo do eixo x e do eixo y de uma imagem, respectivamente. A matriz GLCM tem um tamanho de

Ng

×

Ng

, onde

Ng

é o número de níveis de cinza na imagem.

Foram extraídos do GLCM apresenta como segue. A equalização de histograma foi aplicada pela primeira vez no ROIs segmentada codificados utilizando 256 níveis de cinza. GLCM matrizes foram, em seguida, calculada com base em quatro deslocamentos (1, 2, 3 e 4 pixels) e quatro fases (0 °, 45 °, 90 °, 135 °). Usando esta técnica, obteve-se 16 matrizes GLCM de tamanho 256 × 256 para cada ROI segmentada. Características de textura foram, então, calculada pela aplicação 12 funções quantificadores em cada matriz GLCM e média dos valores através das 16 matrizes GLCM. As funções 12 quantificadores, propostos por Haralick et al. [32] e Clausi D. [33], são relatados. Características de textura com base na quantificação de valores GLCM pode ser expressa como o seguinte vetor:. (10)

análises estatísticas e critérios de classificação

A análise estatística com base no teste de Kruskal-Wallis foi realizada para medir o significado de características de textura para discriminar entre os três tipos PT. Características que têm um

p

-valor de 0,01 ou menos foram considerados como estatisticamente significativos. Note-se que esta análise não é usado para seleção de recursos e, consequentemente, não viés a seguinte etapa de classificação

Quatro métodos de classificação foram testados:. Análise discriminante linear (LDA) [34], Naive Bayes (NB) [ ,,,0],35], árvores de decisão (DT) [36] e vizinhos mais próximos (NN) classificador [37]. Em LDA, as funções de distribuição de probabilidade (pdf) das aulas estão a ser assumida Gaussian multivariada com diferentes média, mas mesmo matriz de covariância, e classificação de Bayes é usada para selecionar a classe com probabilidade máxima para cada amostra de teste. Naïve Bayes considera características como independentes um do outro, dada a sua classe, e calcula os parâmetros em PDF desses recursos para cada classe. Um PDF Gaussian univariada é assumida por todos os recursos. DT classificação divide o conjunto de amostras de treino de forma recursiva, por aplicação de um limiar de características seleccionadas, até que todos os nós de folha são suficientemente puros (isto é, eles contêm amostras da mesma classe) ou um número máximo de níveis é atingido. Neste trabalho, o índice de Gini foi utilizada como medida de pureza [38]. NN encontra

amostras K

de treinamento mais próximo de uma dada amostra de teste, com base na distância euclidiana, e atribui a amostra de ensaio para a classe mais freqüente de seus vizinhos mais próximos. Com base em testes anteriores, um valor de

K

= 10 foi usado para o número de vizinhos mais próximos

desempenho Classificador é avaliada usando três métricas:. Acurácia, sensibilidade e especificidade [39]. Precisão mede a proporção de amostras de teste corretamente classificados pelo método. Sensibilidade calcula, para cada uma das classes, a razão entre o número de verdadeiros positivos (i.e., as amostras classificadas como positivas positivo pelo método) e o número total de amostras positivas. Os valores obtidos para cada classe são então a média na proporção do número de amostras a classe correspondente. Da mesma forma, a especificidade é a proporção de amostras negativas que são classificados como negativos pelo método. Além disso, a área sob a curva ROC (AUC) é utilizado para avaliar o desempenho dos classificadores para diferentes limiares de decisão. Os valores de AUC são obtidas através da representação gráfica da curva de taxa verdadeira positiva (i.e., sensibilidade) versus taxa de falsos positivos (isto é, 1-especificidade), para vários limiares de decisão, e a medição da área total sob a curva. Um valor mais alto AUC indica um classificador melhor.

Uma abordagem de validação cruzada de 10 vezes foi utilizada para obter estimativas imparciais de desempenho classificador. Nesta abordagem, os dados são primeiro divididas em 10 conjuntos de amostras de tamanho igual. Cada conjunto é então realizada-out por sua vez, para validação, enquanto as peças restantes são usados ​​para treinamento [40]. O desempenho médio, calculado ao longo destes 10 dobras, é relatado.

Resultados

Segmentação

A Tabela 1 mostra a precisão segmentação em termos de DSC, FPR e FNR obtido pela método de segmentação de contorno ativo, para imagens dos três tipos PT. Observamos valores de DSC na faixa de 86,31% -88,21%, com o melhor desempenho alcançado regiões Ca. Além disso, gamas de 5,03% -7,61% e 16,11% -20,26% foram obtidas para FPR e FNR, respectivamente, os valores mais baixos correspondentes a regiões EM (FPR = 5,03%) e regiões Ca (FNR = 16,11%). Estes resultados confirmam a capacidade de segmentação de contorno ativo para extrair com precisão as ROIs, em particular, as regiões correspondentes a Ca.

Texture análise

A média eo desvio-padrão da textura com base-LOG características, obtidas em diferentes escalas de filtro, estão apresentados na Tabela 2. Um teste de Kruskall-Wallis foi utilizado para cada recurso para determinar se a sua distribuição de valores difere entre os tipos de PT. Neste teste, a hipótese nula é de que o grau médio de valores é o mesmo para cada tipo.

-Valores p

obtidos para cada recurso é dado na última coluna da Tabela 2. À excepção de

A

c

, a classificação média de recursos de logs é significativamente maior em Ca do que em e BH (

p

-valor 0,0001). Da mesma forma, a classificação média do IN é maior do que BH, com exceção de características

A

c

e

Ent

f

. Isto apoia a ideia de que tipos PT têm diferentes propriedades de textura e que recursos com base no registro pode ser usado para discriminar entre estes tipos de anormalidade do tecido.

Uma análise similar foi realizada para recursos GLCM (Tabela 3) e características DW (Tabela 4). Para GLCM, a classificação média de recursos

f

1,

f

2,

f

4,

f

8,

f

11 e

f

12 é significativamente maior em Ca do que os tipos iN e BH. Em contraste, a classificação média de recurso

f

9

é maior em comparação com IN BH e Ca. Além disso, a classificação média de recursos

f

5,

f

6,

f

7 e

f

10 foi encontrado para ser significativamente maior em BH do que em (

p

-valor 0,0001). Para características extraídas usando transformar o DW, descobrimos que os recursos

f

1DW_db, e f

1DW_sym teve uma classificação mais elevada significa para IN do que os tipos de BH e Ca, e que o grau médio de recursos

f

1DW_coif, f

2DW_db,

f

2DW_coif,

f

2DW_sym,

f

3DW_db,

f

3DW_coif e

f

3DW_sym foi maior em BH do que em e Ca tipos (

p

-valor 0,001) .

no geral, a análise mostra o potencial de log, GLCM e características de textura DW para a diferenciação entre os tipos PT. Além disso, uma vez que todas as características de textura foram encontrados para ser estatisticamente significativa (

p

-valor 0,01)., Todos eles foram utilizados para a classificação (ou seja, nenhuma etapa de seleção recurso foi realizada antes da classificação)

Classificação

Os três conjuntos de características de textura (ou seja,

F

LOG,

F

DW e

F

GLCM) foram avaliados em um ambiente de classificação, utilizando-os como entrada para LDA, NB, DT e NN classificadores. O desempenho, em termos de precisão, sensibilidade e especificidade, obtido por esses classificadores para cada conjunto de recursos é relatado na Tabela 5. Os melhores precisões de classificação obtidos para registro, DW e GLCM são 81,17% (DT classificador), 90,00% (classificador LDA ) e 94,37% (LDA classificador), respectivamente.

a capacidade dos classificadores de discriminar entre pares de tipos PT, para vários limiares de decisão, foi avaliada usando a métrica AUC. Os resultados, apresentados na Tabela 6 e na Figura 6, indicam que todos os três conjuntos de características de textura são úteis para discriminar entre todos os pares de tipos de PT, com valores de AUC que varia entre 98% a 100%. Além disso, a Tabela 7 mostra a matriz de confusão obtidos para os três tipos de características de textura. Vemos que, para todos os tipos de textura, a mais alta precisão é alcançada para Ca (167/176 amostras Ca corretamente classificados usando GLCM), eo erro de classificação mais frequente ocorre entre BH e nos tipos.

A linha azul, preto, e vermelho é para BH vs IN, BH vs. Ca, e IN vs. Ca respectivamente. (A) textura baseado em filtro de log. (B) Textura baseado em filtro DWT. (C) Textura baseado em GLCM.

Para melhorar ainda mais o desempenho da classificação, nós concatenado as características derivadas de todos os três tipos de textura, dando um vetor de 30 características de textura. Usando essa abordagem, obtivemos uma precisão de 98,92%, uma sensibilidade de 98,12%, uma especificidade de 99,67% e uma AUC de 100% usando o classificador LDA (Tabelas 5 e 6). A melhoria de desempenho obtida com características multi-textura também pode ser observado na matriz de confusão da Tabela 7, com 157/160 de BH, 143/144 de IN, e 175/176 de amostras Ca corretamente classificados

.

randomização teste

testes de permutação randomizados foram usados ​​para quantificar ainda mais a importância da ligação entre texturas de imagem e tipos PT. Vários experimentos foram realizados para calcular a precisão da classificação de etiquetas do tipo PT permutadas aleatoriamente. Esta abordagem permite a quantificação da distribuição nula de precisão da classificação característica textura, ou seja dada a hipótese nula de que os recursos não contêm informações sobre tipos PT, ver teste de permutação [41]. A análise foi realizada como anteriormente, excepto que as etiquetas tipo foram permutadas aleatoriamente antes da avaliação, gerando assim uma distribuição empírica nulo sobre os resultados da classificação a partir de vários ensaios (1000 vezes). Como esperado, a distribuição nulo é um pico em torno de valores de classificação equivalentes a adivinhação aleatória. por exemplo. precisão = 33,25% (mediana = 32,86%) para características de textura com base no filtro de registro, 33,81% (mediana = 33,75%) para os recursos baseados em DW, 33,83% (mediana = 33,95%) para os recursos derivados de GLCM, e 33,91% (mediana = 33,93%) para conjunto completo de recursos (recursos combinados), (Tabela 8). Essas distribuições podem ser usados ​​para calcular empírica

p

-Valores de resultados da classificação obtidos em experimentos na Seção 3, por exemplo, Tabela 5, que estão na faixa significativa.

Discussão

Um pipeline de processamento de imagem multiespectral foi apresentado, em que as regiões de interesse (ROI), representando tecidos anormais são automaticamente segmentados através de um método de contorno ativo multi-resolução eficiente. Este método mostrou-se preciso, com respeito a uma verdade terrestre especialista marcado, a obtenção de valores de similaridade de Dice entre 86,31% e 88,21%.

Em um estudo comparativo, foi avaliada a utilidade de três tipos de texturas para a classificação tecidos patológicos relacionados com o CRC. Individualmente, todas as texturas levar a exatidão da classificação acima de 80%, apesar de texturas baseadas GLCM proporcionou o melhor desempenho com uma precisão de 94,37%, a sensibilidade de 95,63% e especificidade de 100% (Tabela 5). Comparando o desempenho em todos os tipos da PT, observou-se que as amostras Ca têm a menor taxa de erro, e que a maioria dos erros ocorridos entre BH e IN tipos (Tabela 7). Observamos também que a combinação de todos os três tipos de textura (para um total de 30 recursos) proporciona o melhor desempenho, com uma precisão de 98,92%, a sensibilidade de 98,12%, especificidade de 99,67% e da AUC de 100% (Tabelas 5, 6 e 7 ). Isto indica que diferentes características de textura conter informação complementar, que podem ser combinados de uma forma sinérgica para melhorar a análise.

Figura 7 mostra a correlação entre os valores de características encontrados nas três tipos PT, para cada tipo de textura . Para todas as características de textura baseadas em log, os valores de correlação mais elevados são observados entre as texturas médias e grossas de EM e Ca tipos (Fig 7a). Um padrão de correlação semelhante é encontrada entre as características wavelet dentro dos tipos IN e Ca (Fig 7B). Em contraste, menos de correlação é observada entre as diferentes características GLCM (Fig 7c), o que poderia explicar sua precisão relativamente alta classificação. Em todos os tipos da PT, valores de correlação baixos são observados entre os recursos, especialmente para texturas log e GLCM. Mais uma vez, este suporta a hipótese de condução que características de textura pode ser usado para caracterizar e identificar tecidos patológicos em imagens multiespectrais CRC.

(a) recurso textura baseado em filtro de log,

A

,

Ent

e

SD

é a média, entropia e desvio padrão, respectivamente;

f

,

m

e

c

é o índice de multa, médio e textura grosseira, respectivamente. (B) recurso textura baseado em wavelet discreta onde

f

1 |,

f

2

,

e f

3

é a Entropia, Energia e variância respectivamente;

d

,

c

e

s

é o índice de Daubechies, Coiflet e Symlet wavelet respectivamente. (C) extracção de características Textura de GLCM onde

f

1 |,

f

2

,

f

3

,

f

4

,

f

5

,

f

6

,

f

7

,

f

8

,

f

9

,

f

10

,

f

11

e f

12

é o índice de energia, entropia, correlação, Contraste, diferença inversa, Sum-variância, Sum-média, entropia Difference, sombra Cluster, tendência Cluster, a probabilidade máxima, e variância Diferença respectivamente.

Finalmente, observamos que vários estudos na literatura têm descrito as vantagens da utilização de características de textura para identificar amostras de cólon anormais [6, 9 , 10, 42, 43, 44].

Deixe uma resposta