Skip to content

Private implementation of CLOPE: Clustering Algorithm for Transactional Data

Notifications You must be signed in to change notification settings

naidenovaleksei/clope

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Clope

Описание алгоритма - в статье CLOPE: A Fast and Effective Clustering Algorithm for Transactional Data.

Описание

Проект представляет собой реализацию алгоритма CLOPE, заточенную под стандартный набор данных "Mushroom dataset". В случае использования другого набора транзакций следует использовать классы - наследники от DBManager/Transaction.

Использование

Реализация алгоритма CLOPE представлена программой algorithm. Тем не менее, для работы algorithm с набором транзакций "Mushroom dataset", а так же обеспечения удобного анализа результатов алгоритма, предлагаются программы prepareDB и showClusters. Порядок действий:

  1. Подготовить набор транзакций "Mushroom dataset". Для этого необходимо запустить prepareDB с параметрами:
  • -i имя оригинального набора (agaricus-lepiota.data);
  • -o имя модифицированного набора.

Программа prepareDB добавляет в конец каждой строки-транзакции 5 байт вида ",0000". Это необходимо для хранения значения кластера, к которому отнесена каждая транзакция. Значение кластера используется для выполнения работы алгоритма и предоставления результатов оператору.

  1. Запустить algorithm с параметрами:
  • -i имя модифицированного набора;
  • -r значение коэффициента отталкивания.

Программа представляет саму реализацию алгоритма CLOPE. Работает с модифицированным набором "Mushroom dataset". Значение -r позволяет задать коэффициент отталкивания. это влияет на распределение транзакций по кластерам, а также на число кластеров.

Результаты алгоритма представлены непосредственно в файле набора, с которым работает algorithm. В файле модифицированного набора каждой транзакции соответствует номер кластера, к которому она отнесена. Номер кластера записан в конце строки-транзакции. Чтобы получить результаты в виде таблицы, нужно

  1. Запустить программу showClusters с параметрами: -i - имя модифицированного набора. Программа выводит в консоль количество e- и p-транзакций из файла набора, отнесенных к каждому кластеру, в виде таблицы.

Примеры

Пример последовательности команд в Windows:

prepareDB.exe -i agaricus-lepiota.data -o agaricus-lepiota.prepared
algorithm.exe -i agaricus-lepiota.prepared -r 2.6
showClusters.exe -i agaricus-lepiota.prepared

Замечания

Все исходные коды компилируются в MS Visual Studio 2010. Остальные компиляторы и ОС не проверялись.

About

Private implementation of CLOPE: Clustering Algorithm for Transactional Data

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published