Метод кластеризації з використанням векторів кардинальних чисел
Основний зміст сторінки статті
Анотація
У сучасних технічних системах кластеризація є ключовою процедурою для структурування, аналізу та інтерпретації великих обсягів даних, що забезпечує підвищення ефективності прийняття рішень і оптимізації системних процесів. В роботі проведено порівняльний аналіз основних груп методів кластеризації та запропоновано новий підхід до кластеризації з використанням потужного математичного апарату кардинальних чисел. Розкрито теоретичні засади побудови векторів кардинальних чисел як математичного інструменту для представлення даних у задачах кластеризації. Запропоновано визначення відстаней між об’єктами здійснювати в обраному ортогональному базисі на основі підрахунку потужностей абстрактних послідовностей множин, поданих у вигляді векторів кардинальних чисел. Розглянуто формування векторів кардинальних чисел та обчислення відповідних метрик схожості з подальшим формуванням матриці відстаней. Наведено приклад розрахунку відстаней між трьома функціями та базовою функцією на основі аналізу відповідних векторів кардинальних чисел. Показано, що зміна базису чи проекцій залежно від технічної задачі дозволяє формувати різні кластери, що свідчить про гнучкість і адаптивність запропонованого підходу. Розрахунки формалізовані, прості та легко алгоритмізуються, що дає можливість для втілення динамічної кластеризації. Такий підхід є перспективним для застосування в інтелектуальних системах аналізу даних та обробки інформації в електронних пристроях.
Блок інформації про статтю

Ця робота ліцензується відповідно до Creative Commons Attribution-ShareAlike 4.0 International License.
Автори, які публікуються у цьому журналі, погоджуються з наступними умовами:- Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.
- Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у цьому журналі.
- Політика журналу дозволяє і заохочує розміщення авторами в мережі Інтернет (наприклад, у сховищах установ або на особистих веб-сайтах) рукопису роботи, як до подання цього рукопису до редакції, так і під час його редакційного опрацювання, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на оперативності та динаміці цитування опублікованої роботи (див. The Effect of Open Access).
Посилання
O. Kyrylenko, B. Stognii, S. Denysiuk, and M. Sopel, “SMART-MONITORING OF ELECTRICAL POWER SYSTEMS”, Tekhnichna Elektrodynamika, vol. 2024, no. 5, pp. 48–62, Aug. 2024. DOI: https://doi.org/10.15407/techned2024.05.048.
G. J. Oyewole and G. A. Thopil, “Data clustering: application and trends”, Artificial Intelligence Review, vol. 56, no. 7, pp. 6439–6475, Nov. 2022. DOI: https://doi.org/10.1007/s10462-022-10325-y.
B. S. Everitt, S. Landau, M. Leese, D. Stahl, Cluster Analysis, London, Wiley, 2011, 352 p. DOI: https://doi.org/10.1002/9780470977811
P.-N. Tan, M. Steinbach, А. Karpatne, V. Kumar, Introduction to Data Mining. 2nd ed. Boston, MA: Pearson, 2021, 856 p.
A. Ultsch and J. Lötsch, “Euclidean distance-optimized data transformation for cluster analysis in biomedical data (EDOtrans)”, BMC Bioinformatics, vol. 23, no. 1, Jun. 2022. DOI: https://doi.org/10.1186/s12859-022-04769-w
S. A. Afghani and W. Y. M. Putra, “Clustering with Euclidean Distance, Manhattan - Distance, Mahalanobis - Euclidean Distance, and Chebyshev Distance with Their Accuracy”, Indonesian Journal of Statistics and Its Applications, vol. 5, no. 2, pp. 369–376, Jun. 2021. DOI: https://doi.org/10.29244/ijsa.v5i2p369-376
Y. Shim, S.-W. Choi, M.-G. Yang, K.-Y. Chung, and K.-H. Baek, “Energy Efficient Distance Computing: Application to K-Means Clustering”, Electronics, vol. 11, no. 3, p. 298, Jan. 2022. DOI: https://doi.org/10.3390/electronics11030298.
M. Sari and A. Armansyah, “Manhattan Metric Technique in K-Means Clustering for Data Grouping”, Journal of Information Systems and Informatics, vol. 6, no. 3, pp. 1945–1961, Sep. 2024. DOI: https://doi.org/10.51519/journalisi.v6i3.841
D. Al-Shammary, E. Hakem, A. M. Mahdi, A. Ibaida, and K. Ahmed, “A novel brain EEG clustering based on Minkowski distance to improve intelligent epilepsy diagnosis”, Informatics in Medicine Unlocked, vol. 47, p. 101492, Jan. 2024. DOI: https://doi.org/10.1016/j.imu.2024.101492.
S. Biswas, A. Fole, N. Khare, and P. Agrawal, “Enhancing correlated big data privacy using differential privacy and machine learning”, Journal of Big Data, vol. 10, no. 1, Mar. 2023. DOI: https://doi.org/10.1186/s40537-023-00705-8
N. Wiroonsri, “Clustering performance analysis using a new correlation-based cluster validity index”, Pattern Recognition, vol. 145, p. 109910, Jan. 2024. DOI: https://doi.org/10.1016/j.patcog.2023.109910.
J. AlShaqsi, W. Wang, O. Drogham, and R. S. Alkhawaldeh, “Quantitative and qualitative similarity measure for data clustering analysis”, Cluster Computing, vol. 27, no. 10, pp. 14977–15002, Aug. 2024. DOI: https://doi.org/10.1007/s10586-024-04664-4.
X. Ran, Y. Xi, Y. Lu, X. Wang, and Z. Lu, “Comprehensive survey on hierarchical clustering algorithms and the recent developments”, Artificial Intelligence Review, vol. 56, no. 8, pp. 8219–8264, Dec. 2022. DOI: https://doi.org/10.1007/s10462-022-10366-3.
M. Jasiński, T. Sikorski, Z. Leonowicz, K. Borkowski, and E. Jasińska, “The Application of Hierarchical Clustering to Power Quality Measurements in an Electrical Power Network with Distributed Generation”, Energies, vol. 13, no. 9, p. 2407, May 2020. DOI: https://doi.org/10.3390/en13092407
A. M. Ikotun, A. E. Ezugwu, L. Abualigah, B. Abuhaija, and J. Heming, “K-means clustering algorithms: A comprehensive review, variants analysis, and advances in the era of big data”, Information Sciences, vol. 622, pp. 178–210, Apr. 2023. DOI: https://doi.org/10.1016/j.ins.2022.11.139.
M. Ahmed, R. Seraj, and S. M. S. Islam, “The k-means Algorithm: A Comprehensive Survey and Performance Evaluation”, Electronics, vol. 9, no. 8, p. 1295, Aug. 2020. DOI: https://doi.org/10.3390/electronics9081295.
Y. Terada, “Strong consistency of factorial $$K$$ K -means clustering”, Annals of the Institute of Statistical Mathematics, vol. 67, no. 2, pp. 335–357, Mar. 2014. DOI: https://doi.org/10.1007/s10463-014-0454-0.
E. Schubert, J. Sander, M. Ester, H. P. Kriegel, and X. Xu, “DBSCAN Revisited, Revisited: Why and How You Should (Still) Use DBSCAN”, ACM Transactions on Database Systems, vol. 42, no. 3, pp. 1–21, Jul. 2017. DOI: https://doi.org/10.1145/3068335.
D. K. Kotary and S. J. Nanda, “A Distributed Neighbourhood DBSCAN Algorithm for Effective Data Clustering in Wireless Sensor Networks”, Wireless Personal Communications, vol. 121, no. 4, pp. 2545–2568, Aug. 2021. DOI: https://doi.org/10.1007/s11277-021-08836-y.
X. Yang, C. Xie, K. Zhou, S. Song, J. Yang, and B. Li, “Towards attributed graph clustering using enhanced graph and reconstructed graph structure”, Artificial Intelligence Review, vol. 57, no. 11, Sep. 2024. DOI: https://doi.org/10.1007/s10462-024-10958-1.
A. S. Tarasenko, V. B. Berikov, I. A. Pestunov, S. A. Rylov, and P. S. Ruzankin, “A fast consistent grid-based clustering algorithm”, Pattern Analysis and Applications, vol. 27, no. 4, Nov. 2024. DOI: https://doi.org/10.1007/s10044-024-01354-0.
I. Strelkovska, I. Solovska, Yu. Strelkovska, V. Paskalenko, “Kompleksna splain-aproksymatsiia v zadachakh pozytsionuvannia”, Visti vyshchykh uchbovykh zakladiv. Radioelektronika, № 65 (7), pp. 445-456, 2022. DOI: https://doi.org/10.20535/S0021347022100028.
M. Du and F. Wu, “Grid-Based Clustering Using Boundary Detection”, Entropy, vol. 24, no. 11, p. 1606, Nov. 2022. DOI: https://doi.org/10.3390/e24111606.
M. Al Jreidy, J. Constantin, F. Dornaika, and D. Hamad, “Clustering using graph convolution networks”, Progress in Artificial Intelligence, Jan. 2024. DOI: https://doi.org/10.1007/s13748-023-00310-z.
C. Weber, D. Ray, A. Valverde, J. Clark, and K. Sharma, “Gaussian mixture model clustering algorithms for the analysis of high-precision mass measurements”, Nuclear Instruments and Methods in Physics Research Section A: Accelerators, Spectrometers, Detectors and Associated Equipment, vol. 1027, p. 166299, Mar. 2022. DOI: https://doi.org/10.1016/j.nima.2021.166299.
S. Sarkar, V. Melnykov, and R. Zheng, “Gaussian mixture modeling and model-based clustering under measurement inconsistency”, Advances in Data Analysis and Classification, vol. 14, no. 2, pp. 379–413, May 2020. DOI: https://doi.org/10.1007/s11634-020-00393-9.
Y. Jie, X. Li, M. wang, F. Zhou, and H. Tan, “Medical image fusion based on extended difference-of-Gaussians and edge-preserving”, Expert Systems with Applications, vol. 227, p. 120301, Oct. 2023. DOI: https://doi.org/10.1016/j.eswa.2023.120301.
H. Huang, “Fuzzy K-means clustering with reconstructed information”, International Journal of Machine Learning and Cybernetics, vol. 16, no. 1, pp. 43–53, Jun. 2024. DOI: https://doi.org/10.1007/s13042-024-02167-7.
A. Javed, D. M. Rizzo, B. S. Lee, and R. Gramling, “Somtimes: self organizing maps for time series clustering and its application to serious illness conversations”, Data Mining and Knowledge Discovery, vol. 38, no. 3, pp. 813–839, Oct. 2023. DOI: https://doi.org/10.1007/s10618-023-00979-9.
M. R. Basarab and K. O. Ivanko, “Deep Learning for the Detection and Classification of Diabetic Retinopathy Stages”, Microsystems, Electronics and Acoustics, vol. 29, no. 2, Aug. 2024. DOI: https://doi.org/10.20535/2523-4455.mea.309642.
D. S. Zaruba, M. Y. Shvets, and Y. V. Khokhlov, “Machine Learning for a Power Consumption and Generation Prediction”, Microsystems, Electronics and Acoustics, vol. 24, no. 6, pp. 17–21, Dec. 2019. DOI: https://doi.org/10.20535/2523-4455.2019.24.6.186996.
B. Zhou, B. Lu, S. Saeidlou, “A Hybrid Clustering Method Based on the Several Diverse Basic Clustering and Meta-Clustering Aggregation Technique”, Cybernetics and Systems, vol. 55, no. 1, pp. 203 229, 2024. DOI: https://doi.org/10.1080/01969722.2022.2110682.
H. Nabli, R. Ben Djemaa, and I. Amous Ben Amor, “Improved clustering-based hybrid recommendation system to offer personalized cloud services”, Cluster Computing, vol. 27, no. 3, pp. 2845–2874, Aug. 2023. DOI: https://doi.org/10.1007/s10586-023-04119-2.
C. J. Date, An Introduction to Database Systems, 8th ed. Boston, MA, Addison-Wesley Professional, 2003, 1024 p.



