Порівняльний аналіз алгоритмів кластеризації
Основний зміст сторінки статті
Анотація
Представлено математичну постановку завдання категоризації товарів, виділено такі етапи її вирішення: індексація, класифікація та оцінка ефективності. Експериментальне дослідження класифікаторів (наївного байєсівського класифікатора, методу опорних векторів та дерев прийняття рішення) показало, що для вирішення задачі категоризації найбільш ефективним є метод опорних векторів.
Блок інформації про статтю

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Автори, які публікуються у цьому журналі, погоджуються з наступними умовами:- Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.
- Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у цьому журналі.
- Політика журналу дозволяє і заохочує розміщення авторами в мережі Інтернет (наприклад, у сховищах установ або на особистих веб-сайтах) рукопису роботи, як до подання цього рукопису до редакції, так і під час його редакційного опрацювання, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на оперативності та динаміці цитування опублікованої роботи (див. The Effect of Open Access).
Посилання
F. Sebastiani, “A tutorial on automated text categorisation”, in Proceedings of the 1st ArgentinianSymposium on Artificial Intelligence (ASAI’99), 1999, pp. 7–34.
Y. Kalnybolotsky and M. Didkovskaya, “Creative component in the solutionintellectual tasks (structuringproblems)”, Electronics and communication, no. 6, pp. 63–71, Jan. 2008.
D. D. Lewis, “Naive (Bayes) at forty: The independence assumption in information retrieval”, in Machine Learning: ECML-98, Berlin, Heidelberg: Springer Berlin Heidelberg, 1998, pp. 4–15. DOI:10.1007/BFb0026666
C. Apté, F. Damerau, and S. M. Weiss, “Automated learning of decision rules for text categorization”, ACM Transactions on Information Systems, vol. 12, no. 3, pp. 233–251, Jul. 1994. DOI:10.1145/183422.183423
G. Salton, A. Wong, and C. S. Yang, “A vector space model for automatic indexing”, Communications of the ACM, vol. 18, no. 11, pp. 613–620, Nov. 1975. DOI:10.1145/361219.361220