Americké prezidentské volby: Prognózy big dat ošklivě selhaly

V posledních několika obdobích fungovaly nakódované předpovědní modely v rámci významných voleb ve světě dobře. Jejich předpovědi se naplňovaly a byly dost přesné. Stroje prostě spočítaly pravděpodobnosti, nebylo třeba ptát se zkušených odborníků na jejich názor založený na zákulisních kontaktech.

Proces byl jasný: nejprve shromáždit historická a nynější data, napsat kód a pak spustit regresi. Co se stalo letos, že prognózy selhaly v přímém přenosu?

Ilustrační snímek

Pravda je v datech, nebo ne?

Podívejme se na Brexit nebo americké prezidentské volby. Dat byl letos dostatek. Historické volební chování, trendy v registraci voličů, zajímavé demografické poznatky – vše bylo po ruce a bylo zpracováno pomocí nejnovějších poznatků a technologií pro zpracování big dat.

Tento přístup byl lákavý také proto, že zde zdánlivě nebyl lidský prvek. On zde však byl, protože při průzkumech to byli lidé, kdo formuloval otázky a určoval váhy jednotlivých vzorků.

S volebními daty, průzkumy a historickými výsledky to vypadalo, že Hillary Clintonová zvítězí na Floridě. Jenže ona tam nakonec prohrála. A proto bychom měli své smýšlení o analytických nástrojích trochu korigovat. I když je něco postavené jen na datech, nemusí to být tak neomylné, jak si často myslíme, tvrdí článek na webu strategy-business.com.

1) Průzkumy nejsou tak spolehlivé

V průzkumech nám lidé něco tvrdí, nebo nám říkají, co si myslí, že udělají. My však nevíme, co udělají ve skutečnosti. A právě zde se začnou předpovědi rozcházet se skutečnými výsledky. Sami si můžete zkusit odhadnout, kolikrát budete příští měsíc fyzicky cvičit. Potom si schválně spočítejte, kolikrát jste cvičili ve skutečnosti.

2) Je těžké poskládat si celkový obraz

Lidé, kteří připravují průzkumy, také formulují otázky. A přidělují váhy vzorkům populace. Tato rozhodnutí jsou však činěna ve velmi komplexním prostředí. Populace ve státech, kde není výsledek voleb dopředu jistý, je navíc dnes značně odlišná od té, která zde byla před 4 nebo 8 lety. Rychle narůstá a její charakteristiky se neustále proměňují.

-jk-

Zdroj: Strategy+Business - americký magazín o strategiích v podnikání
Zobrazit přehled článků ze zdroje Strategy+Business