Dat je een stappenteller (of liever gezegd jezelf) kunt neppen zal niemand verbazen. Op Youtube vind je allerlei filmpjes over honden die met de Fitbit van het baasje rondlopen. Bavaria maakte vorig jaar al een commercial over kroegvrienden die voor het thuisfront zogenaamd aan het hardlopen waren. In werkelijkheid gaven ze hun smartphones met stappentel-app mee aan één ingehuurde sportieveling die alle scores ophoogde. En op de site Unfit Bit delen Fitbit-neppers hun vondsten.
Het manipuleren van je stappenteller kreeg zelfs al aandacht uit wetenschappelijke hoek. Making Activity Recognition Robust against Deceptive Behavior heet het artikel dat drie Amerikaanse onderzoekers begin dit jaar publiceerden op het Open Access platform Plos. De achtergrond voor hun artikel is dat fitness trackers een steeds belangrijkere commerciële rol gaan spelen. Sommige Amerikaanse verzekeraars geven bijvoorbeeld korting als je een minimum bewegingsdoel haalt met de gratis tracker die ze weggeven bij hun polis. In Nederland kun je met lekker doorstappen met de Etos stappentel-app korting op je tandpasta of een gratis douchegel verdienen. Kortom: er is steeds meer motivatie om je tracker aan je accuboor vast te maken en even tienduizend stappen bij elkaar te draaien. Als dat zou werken, althans.
Stappen tellen voor al je kroegvrienden
Noem je dat stappen?
Het genoemde Amerikaanse onderzoek richtte zich op het herkennen van iemand die stappen probeert na te doen, terwijl hij of zij iets heel anders aan het doen is. Bijvoorbeeld lekker voor de TV op de bank zitten en ritmisch met je arm op en neer zwaaien om stappen te verzamelen. Door allerlei gegevens te combineren probeerden de onderzoekers dat bedrog te herkennen. Een nadeel is dat ze daar wel een eigen app voor nodig hebben.
De makers van armbanden en fitness-apps zijn zelf ook steeds beter geworden in het wegfilteren van bewegingen die eigenlijk geen stappen zijn. De algoritmen en big data die ze daarvoor gebruiken zijn goed bewaarde bedrijfsgeheimen van Facebook (Moves), Fitbit, Garmin of Apple. Als de nepbeweging bijvoorbeeld extreem regelmatig is, wordt de kans steeds groter dat je stappenteller geen stappen telt.
Stappentellers testen: niet eenvoudig
Als we bij SmartHealth een stappenteller, smartwatch of app bespreken, houden we continu in het achterhoofd dat het absolute aantal stappen dat je op een dag zet vrijwel altijd afwijkt van de score van een tracker. Wanneer je een dag lang vier stappentellers en vier apps gebruikt bij dezelfde persoon, zul je flinke verschillen zien. Dat komt omdat de software van de individuele leveranciers andere keuzes maakt bij het herkennen van stappen.
Meerdere trackers, meerdere dagscores
Wetenschappers hebben inmiddels in tal van onderzoeken proefpersonen laten wandelen (ook op een loopband) en het aantal echte stappen handmatig geteld, om daarmee de precisie van stappentellers te kunnen beoordelen. Die aanpak heeft natuurlijk veel beperkingen, dat erkennen ook de onderzoekers. Eigenlijk zou je een maand lang door de hele dag heen het aantal echte stappen moeten tellen en dat vergelijken met wat je tracker of app aangeeft. Maar dat soort grootschalige ‘free living’ onderzoeken zijn in praktijk nauwelijks haalbaar. Daarom gebruiken de meeste reviewers de gegevens van de stappentellers die ze het meest gebruiken en vertrouwen als (onwetenschappelijke) referentie. Daarbij speelt natuurlijk ook mee dat het vooral belangrijk is dat een stappenteller consistent is in zijn afwijking. Het gaat om de trend in de stappen die je zet, het absolute aantal is alleen interessant voor onderlinge competities. Dus wanneer de stappenteller er vijftien procent naast zit, maar dat consequent doet, vertelt het apparaatje je wel wat over je beweeggedrag.
Neppen voor de goede zaak
Zoals gezegd gebruiken reviewers verschillende manieren om verschillen tussen trackers en apps op te sporen. Je kunt jezelf bijvoorbeeld een paar dagen lang volhangen met meerdere trackers, om zo het verschil in getelde stappen te vinden. Dat werkt redelijk, maar het probleem is dat je linker- en rechterarm niet even actief zijn. Bovendien meet een armband die hoger op je pols zit soms ook anders dan een lager geplaatste band.
Verschillende apps, maar meten ze wel echte stappen?
Het is dus best interessant om een apparaatje te maken waarmee je trackers een uur lang blootstelt aan een loop-achtige beweging. Omdat de omstandigheden voor alle trackers min of meer gelijk zijn, krijg je een aardig idee hoe een tracker reageert. Dat is dan ook precies wat we deden bij Smarthealth. Meer voor de fun dan voor de science overigens.
Stappen nadoen wordt steeds moeilijker
Het bleek nog helemaal niet zo makkelijk te zijn om een apparaatje te bouwen waarmee je stappentellers en apps allemaal om de tuin kunt leiden. Een eenvoudig slingerende of ronddraaiende beweging wordt door Moves en Fitbit trackers bijvoorbeeld vrij snel gediskwalificeerd. De app Moves is daarin keihard: in geval van onraad trekt hij verdachte stappen achteraf gewoon van je score af, zelfs als het om duizenden stappen gaat. Kennelijk laat Moves achteraf nog statistische analyses los op de gedetecteerde bewegingen (dat melden ze trouwens ook op hun site). Ook de Etos-app laat zich niet om de tuin leiden met een eenvoudig hobbelende beweging.
In eerste instantie bedachten we om dan maar met een Arduino computertje een willekeurig patroon in onze constructie te introduceren. Maar je kunt zonder digitale elektronica ook makkelijk constructies maken die schijnbaar willekeurig bewegen. Een bekend voorbeeld uit de natuurkunde is de dubbele slingerconstructie, die garant staat voor hypnotiserende patronen. Zo’n slinger ziet er schematisch zo uit:
We maakten dus een een vrijhangende constructie op basis van het idee van zo’n dubbele slinger. Die slinger draaide niet helemaal rond, maar kreeg telkens een zetje door twee nokkkenwieltjes die op verschillende snelheden draaiden. Daarmee heb je een redelijk chaotisch geslinger, dat zelfs wel wat wegheeft van lopen.
Zoals we vooraf wel hadden verwacht, reageerden de trackers en apps nogal verschillend toen we ze vastmaakten aan onze stappen-simulator. Met de Apple Watch (de eerste versie) bleek het bijvoorbeeld geen probleem om in no time een krankzinnig dagrecord van bijna vijftigduizend stappen te scoren (zo'n 8 uur onafgebroken lopen).
De Fitbit Charge 2 registreerde in dezelfde constructie ongeveer de helft aan stappen, terwijl de Moves app op een Android telefoon geen enkele stap telde, misschien omdat Moves standaard de GPS-positie ook meeneemt in zijn stappenherkenning. De Samsung S Health app zag ook geen brood in het geschud, en telde niet meer dan een schamele 242 stappen tijdens een uur schudden.
De Etos-app leek in eerste instantie ook ongevoelig voor het geschud en geslinger. Er kwam geen stap op de teller. Maar met een kleine aanpassing lukte het ook hier om de app om de tuin te leiden. Je moest eerst gewoon echt een stukje lopen, en daarna pas de smartphone in de simulator leggen. Daarmee dacht de Etos-app dat het lopen gewoon doorging.
Methodologisch kun je hier natuurlijk weinig mee. Daarvoor zou je moeten aantonen dat onze chaotische slinger representatief is voor de willekeurige bewegingen die je door de dag heen maakt zonder dat het stappen zijn. Dan zou je immers kunnen meten hoeveel stappen door trackers ten onrechte worden geteld. Die ambitie hebben we niet: daar kun je daar zo een paar promotieplaatsen voor bewegingswetenschappers en data-analisten op stukslaan.
Wij vonden het vooral nuttig om te zien dat er nog steeds grote verschillen bestaan in de stapherkenning software van apps en trackers. En tegelijk vast te stellen dat er wel degelijk vooruitgang is geweest. De trucs waarmee je pakweg drie jaar geleden je stappenteller nog makkelijk om de tuin kon leiden, werken steeds minder goed. Daarmee krijgen consumenten uiteindelijk dus ook een steeds beter inzicht in het aantal kilometers dat ze lopen op een dag. En we beloven Etos dat we ondanks onze 114.217 stappen per dag geen gebruik zullen maken van de korting op de Vaseline Spray & Go.
Ondanks het gebrek aan standardisatie toch een interessante proef! Beniewd of de nieuwe Apple watch en anderen het ondertussen beter doen met jullie opstelling, aangezien er toch enkele relatief eenvoudige procedures bestaan om gesimuleerde activiteit te detecteren en/of te demotiveren.