Здавалка
Главная | Обратная связь

Практична робота № 5

Тема: Методи кластеризації

Мета: Навчитися проводити кластеризацію даних методами Data Mining

Завдання:Визначити найбільш прибуткові банки із запропонованої множини

(8 балів)

Хід роботи:

1. Завантажити файл Банки.txt в прикладну програму Deductor.Представити результат у вигляді таблиці та OLAP куба.

1.1. Вказати призначення полів куба (6 крок майстра): «Банк», «Филиалы», «Количество робочих» - Вимір, «Прибыль» - Факт. Всі інші поля не використовуються.

1.2. Розташувати поля «Филиалы», «Количество робочих» в колонках OLAP куба, а поле «Банк» - в рядках (7 крок майстра).

1.3. Налаштувати групову операцію для фактів – сума (8 крок майстра).

1.4. Зробити якісний аналіз по даним OLAP куба. Дати відповіді на запитання:

· Які банки мають по 28 філій?

· Скільки банків мають більше 50 філій?

· Яка кількість філій у «Абсолют Банку»? Який його прибуток?

· У скількох банках кількість працівників ≤ 100 чол.?

· Який сумарний прибуток банків, у яких нема філій?

· Який сумарний прибуток банків з кількістю працівників від 100 до 200 чол.?

2. Здійснити кластеризацію банків за допомогою сценарію Data Mining «Самоорганизующаяся карта Кохонена»:

2.1. Запустити Майстер обробки і вибрати спосіб обробки Data Mining «Карта Кохонена».

2.2. Настроїти призначення стовбців (крок 2): «Филиалы», «Сумма активов», «Собственные активы», «Банковские активы», «Средства в банке», «Прибыль» – вхідні, всі інші - інформаційні.

2.3. Вибрати необхідну кількість кластерів – 3 (крок 6).

2.4. Вибрати способи відображення даних: «Карта Кохонена», аналіз «Що-якщо», OLAP-аналіз.

 

2.5. Вказати поля, необхідні для відображення (всі вхідні стовбці, спеціальні - Кластери), та поставити мітку «Границы кластеров» (крок 9).

2.6. Вказати призначення полів куба (10 крок майстра): «Банк», «Филиалы», «Количество робочих», «Сумма активов», «Номер кластера» - Вимір, «Прибыль» - Факт. Всі інші поля інформаційні.

2.7. Розташувати поля «Филиалы», «Количество робочих», «Сумма активов», «Номер кластера» в колонках OLAP куба, а поле «Банк» - в рядках (11 крок майстра).

2.8. Налаштувати групову операцію для фактів – сума (12 крок майстра).

2.9. За отриманою Картою Кохонена визначити, до якого кластеру потрапили найприбутковіші банки. Зазначити їх кількість та назви.

2.10. Зробити якісний аналіз по даним OLAP куба. Дати відповіді на запитання:

· Які банки увійшли до 1 кластеру? (вказати назви)

· У скількох банках 1 кластеру кількість працівників складає 300 і більше чол.?

· До якого кластеру увійшов АКБ «Бин»?

· У якого банку 9 філій, 1200 працівників і сума активів 4134372 у.о.? До якого кластеру він відноситься? Який його прибуток?

· У скількох банків сума активів є більшою 50000000 у.о.? До якого кластеру вони всі відносяться?

· У скількох банках немає найманих працівників? До якого кластеру вони відносяться? Який їх сумарний прибуток?

· Скільки філій у банку з найбільшою кількістю працівників?

· Скільки працівників у банку з найбільшою кількістю філій?

· Який сумарний прибуток всіх банків 1 кластеру? 2 кластеру? 3 кластеру?





©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.