Дослідження параметрів простору даних при двокаскадній кластеризації

2010;
: pp. 144 - 149
Authors: 

Р. Мельник, Р. Тушницький

Національний університет «Львівська політехніка», кафедра програмного забезпечення

Для зменшення часових затрат при кластеризації даних великих розмірів запро- поновано декомпозиційний підхід, що ґрунтується на розбитті простору за коорди- натними осями гіперкубів. Відповідне керування алгоритмом дає змогу об’єднувати кластери — результати з підмножин — у кінцеві за незначними втратами точності. Як приклади практичних даних використані зображення із значними кількостями пікселів.

An approach to reduce algorithmic complexity for clustering of large-scale dataset is considered. The main idea is decomposition of item dataset and space by hypercube coordinates. To join clusters from subsets into the result clusters and to minimize the accuracy losses are the main tasks of the algorithm. Some visual patterns with large pixels numbers as test examples were investigated.

  1. Andy M Yip, Chris Ding, Tony F.Chan. Dynamic Cluster Formation Using Level Set Methods // IEEE Trans. on Pattern Analysis and Machine Intelligence, vol.28, n. 6, pp.877–889, June, 2006.
  2. Leo Grady, Eric L.Schwartz. Isoperimetric Graph partitioning for Image segmentation // IEEE Trans. on Pattern Analysis and Machine Intelligence, vol.28, n. 3, pp.469-475, March, 2006.
  3. M Pavan, M Pelillo. Dominant sets and Pairwise Clustering // IEEE Trans. on Pattern Analysis and Machine Intelligence, vol.29, n. 1, pp.167-172, January, 2007.
  4. C. Ding, X. He. Cluster Aggregate Inequality and Multilevel Hierarchical Clustering // Proc. 9th European Conf. Principles of Data Mining and Knowledge Discovery, pp. 71−83, 2005.
  5. R. Melnyk, R. Tushnytskyy. Algorithm Accuracy and Complexity Optimization by Inequality Merging for Data Clustering // Proc. of the Xth Intern. Conf. The Experience of Designing and Application of CAD Systems in Microelectronics (CADSM’2009), pp. 453-455, 2009.
  6. Мельник Р., Тушницький Р. Каскадна декомпозиція множин великої розмірності при кластеризації ключів образів // Комп’ютерні науки та інформаційні технології. — 2008. — № 604. — С. 249–254.