Метод кластеризації з використанням векторів кардинальних чисел

Основний зміст сторінки статті

канд. філос. наук, доц. Олена Олегівна Абакумова
http://orcid.org/0000-0002-5467-2473
д-р техн. наук, проф. Валерій Якович Жуйков
https://orcid.org/0000-0002-3338-2426
Микола О. Лук'янов
https://orcid.org/0000-0001-8930-9992

Анотація

У сучасних технічних системах кластеризація є ключовою процедурою для структурування, аналізу та інтерпретації великих обсягів даних, що забезпечує підвищення ефективності прийняття рішень і оптимізації системних процесів. В роботі проведено порівняльний аналіз основних груп методів кластеризації та запропоновано новий підхід до кластеризації з використанням потужного математичного апарату кардинальних чисел. Розкрито теоретичні засади побудови векторів кардинальних чисел як математичного інструменту для представлення даних у задачах кластеризації. Запропоновано визначення відстаней між об’єктами здійснювати в обраному ортогональному базисі на основі підрахунку потужностей абстрактних послідовностей множин, поданих у вигляді векторів кардинальних чисел. Розглянуто формування векторів кардинальних чисел та обчислення відповідних метрик схожості з подальшим формуванням матриці відстаней. Наведено приклад розрахунку відстаней між трьома функціями та базовою функцією на основі аналізу відповідних векторів кардинальних чисел. Показано, що зміна базису чи проекцій залежно від технічної задачі дозволяє формувати різні кластери, що свідчить про гнучкість і адаптивність запропонованого підходу. Розрахунки формалізовані, прості та легко алгоритмізуються, що дає можливість для втілення динамічної кластеризації. Такий підхід є перспективним для застосування в інтелектуальних системах аналізу даних та обробки інформації в електронних пристроях.

Блок інформації про статтю

Як цитувати
[1]
О. О. Абакумова, В. Я. Жуйков, і М. О. Лук’янов, «Метод кластеризації з використанням векторів кардинальних чисел», Мікросист., Електрон. та Акуст., т. 30, вип. 3, с. 344933.1–344933.7, Груд 2025.
Розділ
Електронні системи та сигнали
Біографія автора

канд. філос. наук, доц. Олена Олегівна Абакумова, Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського»

 

 

Посилання

O. Kyrylenko, B. Stognii, S. Denysiuk, and M. Sopel, “SMART-MONITORING OF ELECTRICAL POWER SYSTEMS”, Tekhnichna Elektrodynamika, vol. 2024, no. 5, pp. 48–62, Aug. 2024. DOI: https://doi.org/10.15407/techned2024.05.048.

G. J. Oyewole and G. A. Thopil, “Data clustering: application and trends”, Artificial Intelligence Review, vol. 56, no. 7, pp. 6439–6475, Nov. 2022. DOI: https://doi.org/10.1007/s10462-022-10325-y.

B. S. Everitt, S. Landau, M. Leese, D. Stahl, Cluster Analysis, London, Wiley, 2011, 352 p. DOI: https://doi.org/10.1002/9780470977811

P.-N. Tan, M. Steinbach, А. Karpatne, V. Kumar, Introduction to Data Mining. 2nd ed. Boston, MA: Pearson, 2021, 856 p.

A. Ultsch and J. Lötsch, “Euclidean distance-optimized data transformation for cluster analysis in biomedical data (EDOtrans)”, BMC Bioinformatics, vol. 23, no. 1, Jun. 2022. DOI: https://doi.org/10.1186/s12859-022-04769-w

S. A. Afghani and W. Y. M. Putra, “Clustering with Euclidean Distance, Manhattan - Distance, Mahalanobis - Euclidean Distance, and Chebyshev Distance with Their Accuracy”, Indonesian Journal of Statistics and Its Applications, vol. 5, no. 2, pp. 369–376, Jun. 2021. DOI: https://doi.org/10.29244/ijsa.v5i2p369-376

Y. Shim, S.-W. Choi, M.-G. Yang, K.-Y. Chung, and K.-H. Baek, “Energy Efficient Distance Computing: Application to K-Means Clustering”, Electronics, vol. 11, no. 3, p. 298, Jan. 2022. DOI: https://doi.org/10.3390/electronics11030298.

M. Sari and A. Armansyah, “Manhattan Metric Technique in K-Means Clustering for Data Grouping”, Journal of Information Systems and Informatics, vol. 6, no. 3, pp. 1945–1961, Sep. 2024. DOI: https://doi.org/10.51519/journalisi.v6i3.841

D. Al-Shammary, E. Hakem, A. M. Mahdi, A. Ibaida, and K. Ahmed, “A novel brain EEG clustering based on Minkowski distance to improve intelligent epilepsy diagnosis”, Informatics in Medicine Unlocked, vol. 47, p. 101492, Jan. 2024. DOI: https://doi.org/10.1016/j.imu.2024.101492.

S. Biswas, A. Fole, N. Khare, and P. Agrawal, “Enhancing correlated big data privacy using differential privacy and machine learning”, Journal of Big Data, vol. 10, no. 1, Mar. 2023. DOI: https://doi.org/10.1186/s40537-023-00705-8

N. Wiroonsri, “Clustering performance analysis using a new correlation-based cluster validity index”, Pattern Recognition, vol. 145, p. 109910, Jan. 2024. DOI: https://doi.org/10.1016/j.patcog.2023.109910.

J. AlShaqsi, W. Wang, O. Drogham, and R. S. Alkhawaldeh, “Quantitative and qualitative similarity measure for data clustering analysis”, Cluster Computing, vol. 27, no. 10, pp. 14977–15002, Aug. 2024. DOI: https://doi.org/10.1007/s10586-024-04664-4.

X. Ran, Y. Xi, Y. Lu, X. Wang, and Z. Lu, “Comprehensive survey on hierarchical clustering algorithms and the recent developments”, Artificial Intelligence Review, vol. 56, no. 8, pp. 8219–8264, Dec. 2022. DOI: https://doi.org/10.1007/s10462-022-10366-3.

M. Jasiński, T. Sikorski, Z. Leonowicz, K. Borkowski, and E. Jasińska, “The Application of Hierarchical Clustering to Power Quality Measurements in an Electrical Power Network with Distributed Generation”, Energies, vol. 13, no. 9, p. 2407, May 2020. DOI: https://doi.org/10.3390/en13092407

A. M. Ikotun, A. E. Ezugwu, L. Abualigah, B. Abuhaija, and J. Heming, “K-means clustering algorithms: A comprehensive review, variants analysis, and advances in the era of big data”, Information Sciences, vol. 622, pp. 178–210, Apr. 2023. DOI: https://doi.org/10.1016/j.ins.2022.11.139.

M. Ahmed, R. Seraj, and S. M. S. Islam, “The k-means Algorithm: A Comprehensive Survey and Performance Evaluation”, Electronics, vol. 9, no. 8, p. 1295, Aug. 2020. DOI: https://doi.org/10.3390/electronics9081295.

Y. Terada, “Strong consistency of factorial $$K$$ K -means clustering”, Annals of the Institute of Statistical Mathematics, vol. 67, no. 2, pp. 335–357, Mar. 2014. DOI: https://doi.org/10.1007/s10463-014-0454-0.

E. Schubert, J. Sander, M. Ester, H. P. Kriegel, and X. Xu, “DBSCAN Revisited, Revisited: Why and How You Should (Still) Use DBSCAN”, ACM Transactions on Database Systems, vol. 42, no. 3, pp. 1–21, Jul. 2017. DOI: https://doi.org/10.1145/3068335.

D. K. Kotary and S. J. Nanda, “A Distributed Neighbourhood DBSCAN Algorithm for Effective Data Clustering in Wireless Sensor Networks”, Wireless Personal Communications, vol. 121, no. 4, pp. 2545–2568, Aug. 2021. DOI: https://doi.org/10.1007/s11277-021-08836-y.

X. Yang, C. Xie, K. Zhou, S. Song, J. Yang, and B. Li, “Towards attributed graph clustering using enhanced graph and reconstructed graph structure”, Artificial Intelligence Review, vol. 57, no. 11, Sep. 2024. DOI: https://doi.org/10.1007/s10462-024-10958-1.

A. S. Tarasenko, V. B. Berikov, I. A. Pestunov, S. A. Rylov, and P. S. Ruzankin, “A fast consistent grid-based clustering algorithm”, Pattern Analysis and Applications, vol. 27, no. 4, Nov. 2024. DOI: https://doi.org/10.1007/s10044-024-01354-0.

I. Strelkovska, I. Solovska, Yu. Strelkovska, V. Paskalenko, “Kompleksna splain-aproksymatsiia v zadachakh pozytsionuvannia”, Visti vyshchykh uchbovykh zakladiv. Radioelektronika, № 65 (7), pp. 445-456, 2022. DOI: https://doi.org/10.20535/S0021347022100028.

M. Du and F. Wu, “Grid-Based Clustering Using Boundary Detection”, Entropy, vol. 24, no. 11, p. 1606, Nov. 2022. DOI: https://doi.org/10.3390/e24111606.

M. Al Jreidy, J. Constantin, F. Dornaika, and D. Hamad, “Clustering using graph convolution networks”, Progress in Artificial Intelligence, Jan. 2024. DOI: https://doi.org/10.1007/s13748-023-00310-z.

C. Weber, D. Ray, A. Valverde, J. Clark, and K. Sharma, “Gaussian mixture model clustering algorithms for the analysis of high-precision mass measurements”, Nuclear Instruments and Methods in Physics Research Section A: Accelerators, Spectrometers, Detectors and Associated Equipment, vol. 1027, p. 166299, Mar. 2022. DOI: https://doi.org/10.1016/j.nima.2021.166299.

S. Sarkar, V. Melnykov, and R. Zheng, “Gaussian mixture modeling and model-based clustering under measurement inconsistency”, Advances in Data Analysis and Classification, vol. 14, no. 2, pp. 379–413, May 2020. DOI: https://doi.org/10.1007/s11634-020-00393-9.

Y. Jie, X. Li, M. wang, F. Zhou, and H. Tan, “Medical image fusion based on extended difference-of-Gaussians and edge-preserving”, Expert Systems with Applications, vol. 227, p. 120301, Oct. 2023. DOI: https://doi.org/10.1016/j.eswa.2023.120301.

H. Huang, “Fuzzy K-means clustering with reconstructed information”, International Journal of Machine Learning and Cybernetics, vol. 16, no. 1, pp. 43–53, Jun. 2024. DOI: https://doi.org/10.1007/s13042-024-02167-7.

A. Javed, D. M. Rizzo, B. S. Lee, and R. Gramling, “Somtimes: self organizing maps for time series clustering and its application to serious illness conversations”, Data Mining and Knowledge Discovery, vol. 38, no. 3, pp. 813–839, Oct. 2023. DOI: https://doi.org/10.1007/s10618-023-00979-9.

M. R. Basarab and K. O. Ivanko, “Deep Learning for the Detection and Classification of Diabetic Retinopathy Stages”, Microsystems, Electronics and Acoustics, vol. 29, no. 2, Aug. 2024. DOI: https://doi.org/10.20535/2523-4455.mea.309642.

D. S. Zaruba, M. Y. Shvets, and Y. V. Khokhlov, “Machine Learning for a Power Consumption and Generation Prediction”, Microsystems, Electronics and Acoustics, vol. 24, no. 6, pp. 17–21, Dec. 2019. DOI: https://doi.org/10.20535/2523-4455.2019.24.6.186996.

B. Zhou, B. Lu, S. Saeidlou, “A Hybrid Clustering Method Based on the Several Diverse Basic Clustering and Meta-Clustering Aggregation Technique”, Cybernetics and Systems, vol. 55, no. 1, pp. 203 229, 2024. DOI: https://doi.org/10.1080/01969722.2022.2110682.

H. Nabli, R. Ben Djemaa, and I. Amous Ben Amor, “Improved clustering-based hybrid recommendation system to offer personalized cloud services”, Cluster Computing, vol. 27, no. 3, pp. 2845–2874, Aug. 2023. DOI: https://doi.org/10.1007/s10586-023-04119-2.

C. J. Date, An Introduction to Database Systems, 8th ed. Boston, MA, Addison-Wesley Professional, 2003, 1024 p.