Články označené ako BrandCom sú pripravené a publikované v spolupráci s komerčnými partnermi. Hoci redakcia TRENDU nie je ich autorom, ich obsah považuje za prínosný pre čitateľa a preto umožnila ich publikovanie. Viac o BrandCom

BLOG Filip Vítek

[EN/SK] Data underdogs: what they are and how to spot them?

21.02.2015 | Filip Vítek

Houston Rockets alebo ospravedlňte sa svojej databáze! Prekvapivé poklady klientskych dát a ako ich z množstva dát vyťažiť.

  • Tlačiť
  • 6

(English version of the blog is in the lower part of the text, labeled with [EN] heading)

Písal sa máj roku 1995 a v USA vrcholila sezóna basketbalovej NBA ligy. V  seminifinále play-off boli karty pomerne jasne rozdané: najsilnejší team celej ligy, San Antonio Spurs, ktorý vyhral 76% percent všetkých zápasov sezóny, čakala už len posledná povinná jazda. Rozdrviť neistý team Houston Rockets - ktorí skončili po základnej časti až 11ty - a mohli si vychutnať finále NBA. Šport však opäť ukázal, prečo sa dá podnikať aj v stávkovom biznise. Houston zasadil odbornej verejnosti dvojitý šok, keď v semifinále porazil San Antonio, a vo finále dokonca “spláchol” Orlando magic 4:0 na zápasy. Tým sa stal vôbec prvým teamom v histórii NBA, ktorý vyhral titul, napriek tomu, že do play off vstupoval až ako 11ty (!!) nasadený. Po skončení série povedal Rudy Tomjanovich, tréner Rockets “Nikdy nepodceňujte skutočnú podstatu ...(a srdce šampióna)”

Angličtina zaviedla pre tento druh javov príhodný pojem “underdog”, čo by u nás vo voľnom preklade znelo asi ako “prekvapenie turnaja” alebo “anti-favorit”. Zakiaľ v niektorých oblastiach života (ako napríklad šport) sme si na prítomnosť “underdogs” už zvykli, v priamom marketingu nás víťazstvo nečakaných vplyvov na rozhodovanie klientov stále šokuje rovnako ako Houstom Rockets 1995. Nuž ale prečo?

Data underdogs a ako ich spoznať

Za roky práce s klientskymi dátami som sa stretol s mnohými parametrami správania klientov, ktoré sa stali “šampiónmi“ napriek ich zjavnej nezmyselnosti, ba priam zbytočnosti. Začal som im hovoriť „Data underdogs“ a všímať si, prečo tieto dôležité údaje zostávajú bez povšimnutia. Je to nejaká naša chyba vnímania? Alebo sa azda dajú „prekvapenia databáz“ nejako systematicky hľadať ?

Ak ste žili aspoň chvíľu v niektorom z väčších miest, určite ste sa stali svedkom (alebo nebodaj účastníkom) mini súboja: Dve autá vedľa seba zastavia na červenú, oči vodičov sa stretnú a od toho momentu je to  nepísaná súťaž o to, kto príde ako prvý po najbližšie svetlá. Od ľudí, ktorí to už naozaj vyskúšali, by sme sa dozvedeli, že najdôležitejšie pre víťazstvo je načasovať odpich z križovatky presne do momentu, keď naskakuje zelená na semafore. To nás privádza k javu, ktorý pekne ilustruje úlohu a významnosť „Data underdogs“. Ak sa budete pozerať iba na semafor pre autá, nebudete mať voči konkurencii, žiadnu výhodu (váš súper ten semafor vidí rovnako). Ak však zošliapnete spojku a zaradíte si rýchlosť, keď naskočí chodcom na priechode pred vami červená, môžete získať istú výhodu.

F. Vitek: Traffic lights as data underdogs example

Tento príklad semaforu pre peších slúži ako dobrá analógia pre to, ako vyhľadať “skrytých šampiónov“ Vašich marketingových databáz. Za obdobie, ktoré sa data underdogs téme venujem som si všimol, že parametre tohto typu zväčša spĺňajú nasledovné kritéria:

  1. Data underdog nesúvisí so skúmaným správaním klienta, má však silný vplyv v nejakom inom jave (semafor pre chodcov je pre vás ako vodiča v podstate úplne irelevantný, pravidlá šoférovania auta sa ním vôbec neriadia. )
  2. Ide o parameter, ktorý nadobúda limitovaný počet hodnôt (dve farby semaforu pre chodcov). Ak parameter môže mať veľké množstvo hodnôt, potom je underdogom nie celá hodnota parametru, ale iba nejaká menšia časť z daného parametru (napríklad časť emailovej adresy pred @, uvedené v príklade nižšie)
  3. Data underdog parameter je hodnotou jednoducho a notoricky dostupnou. Často až tak bežnú, že prestáva byť okolím vnímaná. Proste tam vždy bola a nik jej nevenoval pozornosť. (rovnako ako semaforu pre chodcov)

Tak sa poriadne rozhliadnite po svojej databáze, ktoré z parametroch o klientovi spĺňajú tieto pravidlá ? Viete si predstaviť na čo by slúžili ?

Ospravedlňte sa svojej databáze

Aj v našich geografických končinách sa pravidelne objavujú parametre typu Data underdogs. Tíško sedia v databázach spoločností a čakajú na svojich objaviteľov (... ktorých odmenia prekvapivými výsledkami). Aby pátranie po tých Vašich bolo ešte jednoduchšie, pripájam niekoľko prípadov z môjho profesného života:

Číslo bankového účtu a rozvodovosť. Keby som vám povedal, že to, či sa s Vami manželka rozvedie, závisí od čísla jej bankového účtu, asi by ste si mysleli, že vtipkujem o výške jej finančných prostriedkov. V skutočnosti však číslo bankového účtu možno použiť ako indikátor vernosti klienta danej banke. Keď opomenieme úvodne cifry, ktoré sú zvyčajne rezervované na kód produktu, konce čísiel bankových účtov generujú počítače a generujú ich chronologicky.  Preto človek s nižším číslom účtu je v banke dlhšie ako človek s vyšším číslom účtu. (v minulosti už pridelené čísla sa opakovane už nikdy nepridelia inému, aj keby klient odišiel z banky). Ak máte teda 2 klientov tej istej banky dá sa tak rozlíšiť, kto je svojej banke vernejší. A keďže je dokázané, že ľudia sa častejšie rozvádzajú ako menia svoju banku, ktohovie, ako to bude s tou vašou manželkou J.

Email ako príznak formálnosti. Väčšina analytikov na mňa neveriacky pozerá, keď navrhujem, aby do množiny skúmaných parametrov zaradili aj textové pole “emailová adresa“. Čo už by sa dalo len odvodiť z hodnoty typu “filip.vitek@post.sk“ ? V skutočnosti emailové adresy sú zdrojom hneď niekoľkých informácii.  Pre názornosť uvediem aspoň „mieru formálnosti človeka“. Ak vám klient píše z adresy johny.frajer078@gmail.com určite si nepotrpí na uvádzanie akademického titulu alebo formálny tón v texte emailu. Naopak, ak vám dorazí email z adresy peter.hladny@zoznam.sk s prílišnou žoviálnosťou radšej opatrne ... (týmto pozdravujem všetkých tých, ktorí vedia ako vyzerá moja súkromná email adresa J)

Čas nákupu ako miera otvorenosti ponukám. Ak Vám poviem, že čas, kedy sa človek vyberie nakúpiť do lekárne výrazne ovplyvňuje to, či zareaguje na aktuálne platnú reklamu a dokúpi si promovaný prípravok, tak Vás to možno až tak neprekvapí. Iste sa rozprúdi diskusia o dôchodcoch, mamičkách na materskej a iných skupinách, ktoré vykazujú výrazne odlišnú mieru responzívnosti na kampane. Čo by ste však povedali, keby som spresnil, že nemám namysli hodinu, ale MINÚTU nákupu? Naozaj je to tak: ľudia nakupujúci v tú istú dennú hodinu majú rozličnú mieru akceptovania ponuky v rámci danej hodiny. Navyše tento jav sa opakuje pravidelne v mnohých kampaniach po sebe a cyklicky sa opakuje v rámci jednotlivých hodín.

Ak pracujete s údajmi klientov, možno už vám začínajú naskakovať v hlave príklady polí, ktoré by mohli byť vo Vašich databázach práve data underdogs. Systematickému pátraniu môže pomôcť aj tzv. ryanairoský test. Ak ste doposiaľ podceňovali hodnotu niektorých polí v databáze, tak sa im pekne ospravedlňte. Tak ako sa musel jeden horlivý fanúšik Orlanda Magic, nápadne sa ponášajúci na mňa, ospravedlniť za podceňovanie Houstonským raketám v roku 1995.

Ďalšie blogy autora:

Prehľadný sumár blogov F. Víteka

Prípadne si prečítajte 5 CRM hriechov businessu: Hriech 1, Hriech 2, Hriech 3, Hriech 4, Hriech 5.

Autor pracuje ako CRM manažér pre mediworx software solutions, a.s. . Všetky vyjadrenia v tomto blogu sú osobnými názormi autora a nie sú oficiálnym stanoviskom žiadnej organizácie, ktorej je autor členom alebo zamestnancom. Autora zastihnete na LinkedINTwittri ako aj na .

[EN] Data Underdogs – apologize to your database

 

It was late May in 1995 and American NBA was coming to the final stage of the 1995 season. Western division final had appeared to be clear cut: the strongest team of the season, San Antonio Spurs, who had won 76% of all its games in given season, was eager to sweep the mediocre Houston Rockets team (who finished regular season only as 11th team) and advance to play-off final. However, sports confirmed again that it pays off to run betting business. Houston rockets team has taught the experts 2 lessons of shock by not only eliminating San Antonio, but by sweeping the mighty Orlando magic team 4:0 in best of nine format of league final. Houston became the very first team in NBA history to win the champions after qualifying as 11th from the regular season. Upon earning the champions title, the coach of the Rockets has told press: “Don’t you ever underestimate the essence … (of the champion’s heart)!”

English has coined a separate noun of “underdog“ for events like the one just described. Interestingly enough, while in some areas of our lives (such as sports) we already have managed to adjust for underdog events, the direct marketing area remains still puzzled about surprising parameters in client behaviour arising out of our client databases. Why is it so, that when it comes to marketing, we are still caught by surprise by underdogs the same way that Houston basketball team shocked us in 1995?

Data underdogs and how to find them

Over the years,  dealing with plethora of client behaviour indicators, I have come across some data-piece “champions“ that earned their relevance despite treated as meaningless or even obsolete elements in first place. While studying them in more detail I started to label them “Data underdogs”. I kept wondering why these fascinating data fields are still ignored by wider public. Is it some kind of perception error we fail to recognize? Or can we systematically and proactively mine these “database jolly jokers“?

If you ever happened to live in larger city, I am sure you witnessed (or even experienced) following mini fight: Two cars stop at the same traffic light. Eyes of the drivers meet and from that moment on the unofficial contest of who comes first to next lights has been started. Those, who have tried such a battle for few times, would explain to you that the key parameter to win such a race is to precisely time your gear shifting into green light appearance. This analogy nicely illustrates what the principle of “Data underdogs“ is. If during the race you only watch the car traffic lights, you barely will get some advantage, as the lights are visible to all the other contestants of yours. However, if you engage the gear shortly after the green pedestrian light goes to red, you might get a head start advantage.

F. Vitek: Traffic lights as data underdogs example

The traffic light example uncovers the framework of how to recognize data underdog when you come across one. Observing the patterns to reappear again and again in my career, I was able to generalize that data underdogs usually meet following criteria:

  1. Data underdog has no direct link or reference to client behaviour we are investigating. However, it has a strong influence in another domain or phenomenon. (pedestrian lights are of no instructional value to drivers, the way that the car is driven is independent from the pedestrian lights and obeys different rules. If the driver causes the car accident, you are only investigated upon sticking to car signals, it’s the pedestrian role to stick to their traffic light signals.)
  2. Data underdog parameter usually has only few possible values. (think 2 colours of pedestrian light). If the data underdog parameter has too many values than the underdog function might reside only in part (or fraction) of the original parameter to help to reduce complexity (as is the case of the first part of email address in the example listed below).
  3. Data underdog parameter is a value or indicator that is clearly visible and notoriously present in the investigated processes. Actually, the presence of the data underdog parameter might be so natural that it is even overlooked in the process observation. Simply, it has been always there, but nobody paid attention to it. (same way nobody paid attention to pedestrian light)

So take a thorough look around in your own database: which of your parameters meet these criteria? Can you already think of areas they might be utilized for?

Apologize to your database fields

Even in our very own businesses there are continuously mushrooming parameters of the Data underdog type. They silently sit in our data warehouses and wait for their explorers (whom they reward by surprising insights). So that the search for these digital underdogs can be even more straightforward for you, let me get you inspired by few examples I have come across during my data mining career:

Bank account number and getting divorced. If I told you, that the probability your wife will divorce you was linked to her bank account number, you might think I was referring to some old good jokes on shared family bank account. In reality, in CEE region the bank account number can be used as proxy for the client loyalty. If you decompose the account number into product prefix and second part of the number, then the latter is usually assigned chronologically by computer (and never reassigned to somebody else even after the account expires from original owner). Therefore, if you have 2 clients of the same bank, then the one with lower account number is more loyal to that bank (= has been its client for longer time). It is proven in several countries that people divorce more often than switch their primary bank. So bankers know how stable the outlook of your partner might be J

Email as a tone of voice indicator. Most of the analysts I work with roll their eyes upon my request to include into set of investigated parameters also text field of client’s email address. After all, what on earth can value like “filip.vitek@post.sk“tell you more? In fact, email addresses are source of several information. Let me shortly illustrate just one, “tone of voice indicator”, for example sake. If your company received inquiry from email address of johny.dude078@gmail.com, the sender surely does not expect to include all academic titles in addressing him/her or quote Latin phrases to juice up the text. On the other hand, answering email received from address like martin.andrew.cramler@yahoo.com would require extra caution about being too jovial in formulating your reply. (Special hello to all who happen to know my personal email address J )

Time of purchase as offer inclination proxy. Let me tell you that the time person purchased some of the goods in pharmacy clearly correlates with his/her responsiveness to recent cross-sell promotion offer and you certainly come up with maternity leaves, pensioners and all kind of sub-segments that might explain then phenomenon. Now hold on, what if I tell you that I actually meant MINUTES not hours of the time as predictor? Huh? Yes, it’s true some of the minutes blocks within the hour have been proven to be more efficient then the other. The trend has been confirmed over several distinct campaigns and repeats again and again.

If you work with client data, there might be already popping new examples of database fields that ought to be tested on Data underdog syndrome. If you want to be somehow more systematic in your search try to run the ryanair-like database test (explained here). And don’t forget to apologize to some of so-far ignored (or disdained) parts of your database. Same way as one furious fan of Orlando Magic (seriously resembling me) had to apologize Houston Rockets for scorning them in 1995 series.

Other blogs from the same author can be found here:

What can we learn from Nordic marketers ?

[EN/SK] One-to-one marketing is dead! Here comes ONE-TO-ZERO marketing!!!

[EN/SK] Going for a holiday? Who earns more on you: Bank, Insurer or Telco company? 

[EN/SK] SMS from operator “We are sorry your relationship has crashed.” Like what?! 

[EN/SK] "Ryanair"-like database test: Big Data in Slovakia 

[EN/SK] How to detect “Greek“ tendencies among your clients? 

[EN/SK] ATM, E-banking, Smart-banking. So what is next? 

[EN/SK] SMS from operator “We are sorry your relationship has crashed.” Like what?!

[EN/SK] What can supermarket tell about your health status?

Feel free to contact author on LinkedINTwitter or on .

Author works as CRM head for mediworx software solutions, health care specialized CRM provider. All of the statements are persona author's opinions and do not represent official position of any of the organizations that author works for or is member of. 

  • Tlačiť
  • 6

Tagy ako na to, analytics, banks, Big Data, client data, CRM, dáta, data mining, how to, klient, klientské dáta, marketing, nezvyčajné, odvetvia, podnikanie, predikcia, prediktívny model, relationship, unconventional, zákazník

Filip Vítek

Filip Vítek
  • Počet článkov: 50
  • Priemerná čítanosť: 5484
  • Priemerná diskutovanosť: 12
  • RSS blogu

O blogu

Stratég, inovátor a analytik s priamočiarym názorom a zmyslom pre analógiu a sirší pohľad na vec.

Filip Vítek

Filip Vítek
  • Počet článkov: 50
  • Priemerná čítanosť: 5484
  • Priemerná diskutovanosť: 12
  • RSS blogu

O blogu

Stratég, inovátor a analytik s priamočiarym názorom a zmyslom pre analógiu a sirší pohľad na vec.

Kalendár sa načítava...

Moje rubriky