Model Klasifikasi Sel Kanker Payudara Dengan Pendekatan Oversampling Data dan Seleksi Fitur

Gede Angga Pradipta

Abstract

Pada umumnya, kanker payudara didiagnosis melalui pemeriksaan rutin atau ketika pasien menyadari gejala-gejala tertentu. Pemeriksaan fisik saja tidak cukup untuk mengonfirmasi diagnosis kanker payudara, sehingga dilakukan perangkaian prosedur pemeriksaan seperti mamografi, biopsi,dan lain sebagainya untuk memperoleh informasi terkait diagnosis dan kebutuhan terapi pasien. Salah satu data penunjang diagnosis oleh paramedis adalah sel kanker berupa citra mikroskopis yan diamnbil dari tubuh pasien menggunakan kamera khusus. Pengolahan citra membantu paramedis sebagai penyedia informasi dalam meningkatkan diagnosa terhadap penyakit. Pada penelitian ini dilakukan proses pengolahan citra untuk mengetahui ciri dari jua jenis sel kanker yaitu benign dan malignant. Metode gray level co-occurence matrix (GLCM) dan statitical analysis digunakan untuk mendapatkan nilai dari fitur yang digunakan sebagai parameter.

Fitur-fitur yang digunakan adalah contrast, energy, correlation, homogenity, average, mean, min, variance, dan standard deviation selain itu diusulkan sebuah fitur yaitu jumlah sel pda tiap kategori jenis kanker payudara. Pada penelitian ini menghasilkan sebuah skema atau usulan model yang digunakan untuk mengenali jenis citra sel kanker payudara kedalam dua kelas yaitu malignant dan benign. Skema model pertama yaitu tanpa oversampling dan seleksi fitur menunjukkan hasil yang kurang memuaskan dimana akurasi yang didapat hanya mencapai 63.94%. Maka dari itu diusulkan skema/model perbaikan dengan penambahan proses oversampling (SMOTE) pada dataset yang dimiliki dan melakukan seleksi fitur yang sebelumnya berjumlah 24 kemudian diseleksi menjadi 5 terbaik yang memiliki kontribusi paling tinggi dengan menggunakan metode Correlation based Feature Selection (CFS). Hasil yang didapat adalah 5 fitur terbaik yaitu Jumlah sel, correlation 45, energy 180, Min, Class. Hasil ini juga membuktikan bahwa fitur jumlah sel yang diusulkan pada penelitian ini memiliki kontribusi yang sangat baik pada performa classifier dalam membedakan kelas malignant dan benign pada datase

References

B. A. Farahdiba, “Klasifikasi Kanker Payudara Menggunakan Algoritma Gain Ratio,” vol. 8, no. 2, p. 4, 2016.

M. AMRANE, S. OUKID, L. Laboratory, I. GAGAOUA, and T. ENSAR, “Breast cancer classification using machine learning,” p. 4.

Rashmi G D, A. Lekha, and N. Bawane, “Analysis of efficiency of classification and prediction algorithms (Naïve Bayes) for Breast Cancer dataset,” 2015, pp. 108–113.

D. Verma and D. N. Mishra, “Analysis and prediction of breast cancer and diabetes disease datasets using data mining classification techniques,” p. 6, 2017.

A. M. Zamani and J. A. R. Hakim, “Implementasi Algoritma Genetika pada Struktur Backpropagation Neural Network untuk Klasifikasi Kanker Payudara,” vol. 1, p. 6, 2012.

Fourina Ayu Novianti and Santi Wulan Purnami, “Analisis Diagnosis Pasien Kanker Payudara Menggunakan Regresi Logistik dan Support Vector Machine (SVM) Berdasarkan Hasil Mamografi,” J. Sains Dan Seni ITS, vol. Vol. 1 No. 1, no. (Sept. 2012).

M. B. A. Rasyid, “Histogram Statistics and GLCM Features of Breast Thermograms for Early Cancer Detection,” Telecommun. Inf. Technol., p. 5.

H. Bisri and M. A. Bustomi, “Klasifikasi Citra Paru-Paru dengan Ekstraksi Fitur Histogram dan Jaringan Syaraf Tiruan,” vol. 2, p. 4, 2013.

A. A. Kasim and A. Harjoko, “Klasifikasi Citra Batik Menggunakan Jaringan Syaraf Tiruan Berdasarkan Gray Level Co- Occurrence Matrices (GLCM),” p. 7, 2014.

D. Tuwohingide and C. Fatichah, “Spatial Fuzzy C-means dan Rapid Region Merging untuk Pemisahan Sel Kanker Payudara,” vol. 6, no. 1, p. 7, 2017.

Y. Agussationo, I. Soesanti, and W. Najib, “EKSTRAKSI CIRI CITRA DIGITAL X-RAY PARU DIAGNOSIS TUBERKULOSIS BERBASIS METODE STATISTIS,” p. 5, 2015.

Refbacks

  • There are currently no refbacks.