Dolování znalostí z dat - případová studie

Dolování znalostí z dat je proces, jehož úkolem je objevit ve velkých databázích předtím neznámé, ale použitelné a cenné informace a umožnit jejich využití ve strategickém rozhodování firmy. Mezi statistické techniky těžby znalostí patří například lineární a logistická regrese, analýza hlavních složek a vypracování rozhodovacích grafů a algoritmů. Cílem je sestavit model s velkým predikčním potenciálem – nestačí tedy jen zjistit, které vztahy jsou statisticky významné. Článek obsahuje případovou studii řešící kampaň nabízející produkt či službu.

Typickou situací je, že oslovení 100000 zákazníků (např. poštou) vede ke zhruba 1000 uzavřených obchodů (1 %). Dolování znalostí z dat umožní identifikovat, kteří zákazníci s největší pravděpodobností zareagují. Pokud by pak bylo možno zvýšit efektivitu např. o 0,5 %, jednoho tisíce obchodů by bylo dosaženo z 66666 oslovených, což znamená snížení nákladů na poštovné zhruba o jednu třetinu. V uváděném případě bylo pro analýzu nejperspektivnějších zákazníků použito celkem 2158 případů – podrobný rozbor a odkazy na tabulky s daty jsou uvedeny v textu.

Doporučení pro analýzu – autoři předpokládají využití určitého typu softwaru (Splus nebo SAS). Výsledky by měly být zaznamenány do tabulky či grafu vyjadřujících výtěžek - podoba se liší podle toho, zda je kampaň zaměřena na náhodně vybrané zákazníky, nebo na ty, kteří v minulosti reagovali. Výkonnost prediktivního modelu je měřena podle procenta reagujících při různém procentu (10, 20, 30%) oslovených.

Zdroj: McMaster University
Zobrazit přehled článků ze zdroje McMaster University