Ethics and ‘Big Data’ Geospatial Research

On March 3 2016 a paper was published titled “Tagging Banksy: using geographic profiling to investigate a modern art mystery”. The article describes a technique for analysing geospatial aspects of a large data set of artworks to identify the author of the graffiti. The abstract of the article already gives you an idea of where this is heading:

More broadly, these results support previous suggestions that analysis of minor terrorism-related acts (e.g., graffiti) could be used to help locate terrorist bases before more serious incidents occur, and provides a fascinating example of the application of the model to a complex, real-world problem.

Continue reading

On Taxis and Rainbows: Anonymising is not easy

I’ve written a series of blog posts for the Rathenau Institute on ethical issues in data research. In this article I show that proper anonymisation of data is no easy task. This article is a translation of the Dutch original, and is available under CC-BY

Introduction

In 2013 Chris Whong discovered that the data of all taxi rides in New York City was available based on the FOIL (the Freedom of Information Law). After filling out some forms, providing a large USB flash drive and waiting a few days, he received his flash drive with nearly 20 gigabytes of data. Continue reading

[Dutch] Data verzameling op Smartphones: Big Brother in je broekzak

Ik heb als onderzoeker en docent bij de opleiding System and Network Engineering van de Universiteit van Amsterdam een serie blogs geschreven. In deze serie belicht ik in opdracht van het Rathenau Instituut ethische vraagstukken bij data-onderzoeken. In deze bijdrage ga ik  dieper in op dataverzameling door smartphone apps. Niet alleen de app zelf maar ook het feit of je telefoon op Android of Apple’s iOS draait is van invloed op hoe er met je gegevens wordt omgegaan. Ook gepubliceerd op het Data denkers blog. Deze blogpost is beschikbaar onder CC-BY. Continue reading

[Dutch] Tracking op basis van publieke data

Ik heb als onderzoeker en docent bij de opleiding System and Network Engineering van de Universiteit van Amsterdam een serie blogs geschreven. In deze serie belicht ik in opdracht van het Rathenau Instituut ethische vraagstukken bij data-onderzoeken. In deze bijdrage beschrijf ik hoe openbare data van een dienst zoals Twitter op meer manieren kan worden hergebruikt dan gebruikers veelal voorzien.  Ook gepubliceerd op het Data denkers blog. Deze blogpost is beschikbaar onder CC-BY.

Continue reading

[Dutch] Privacy by Design in beveiligingsonderzoek

Ik heb als onderzoeker en docent bij de opleiding System and Network Engineering van de Universiteit van Amsterdam een serie blogs geschreven. In deze serie belicht ik in opdracht van het Rathenau Instituut ethische vraagstukken bij data-onderzoeken. In deze bijdrage beschrijf ik hoe onderzoekers in beveiligingsonderzoek privacy by design toepassen.  Ook gepubliceerd op het Data denkers blog. Deze blogpost is beschikbaar onder CC-BY. Continue reading

[Dutch] PirateBayWatch

Ik schrijf voor het Rathenau Instituut een serie blogs over ethische vraagstukken bij data-onderzoeken. In deze bijdrage beschrijf ik hoe onderzoekers die gebruik maken van data over internetverkeer een zorgvuldige afweging moeten maken tussen het belang van hun onderzoek en privacy van hun gebruikers. Ook gepubliceerd op het Data denkers blog. Deze blogpost is beschikbaar onder CC-BY.

In januari 2012 is er een blokkade opgeworpen voor de webpagina van ThePirateBay. Stichting BREIN had toen een overwinning bereikt in haar strijd om illegaal downloaden. De providers Ziggo en XS4ALL moesten vanaf dat moment de website blokkeren voor haar klanten. Een aantal maanden later volgde een uitspraak voor de andere grote providers in Nederland en was de website in heel Nederland geblokkeerd.

Het was al vrij snel duidelijk dat er vele manieren om de blokkade te omzeilen. Proxies, mirrors en andere methoden schoten als paddestoelen uit de grond, sneller dan BREIN ertegen kon vechten. Maar hoe bewijs je nu of zo’n blokkade ook daadwerkelijk effectief is? Continue reading

[Dutch] Ethisch Witwassen

Ik schrijf voor het Rathenau Instituut een serie blogs over ethische vraagstukken bij data-onderzoeken. In deze bijdrage laat ik zien hoe er bij samenwerkingen tussen onderzoekers en bedrijven een verschil kan zijn in de ethische standaarden waarmee wordt gewerkt. Ook gepubliceerd op het Data denkers blog. Deze blogpost is beschikbaar onder CC-BY.

Introductie

Facebook is een bedrijf dat leeft op gedeelde data. Mensen worden lid van Facebook om status updates te delen met vrienden, op de hoogte te blijven van wat anderen doen en berichtjes naar elkaar te sturen. Facebook analyseert en filtert de data en probeert op die manier een zo prettig mogelijk beeld te geven van wat er om je heen gebeurt. Door je gedrag kan Facebook leren wie je goede vrienden zijn en wie je vage kennissen. De status-updates van die mensen worden ook op die manier behandeld.

Maar in januari 2012 ging Facebook nog een stapje verder: onderzoekers wilde kijken of het mogelijk was om emoties te beïnvloeden door de filtering van berichten aan te passen. Te kijken of gebruikers ook minder vrolijk werden als er minder vrolijke berichten getoond werden, of juist blijer als er minder verdrietige berichten getoond werden. Continue reading

[Dutch] Taxi’s en Regenbogen: anonimisering geen gemakkelijke opgave

Ik schrijf in opdracht voor het Rathenau Instituut een serie blogs over ethische vraagstukken bij data-onderzoeken. In deze bijdrage laat ik zien dat het goed anonimiseren van open data geen eenvoudige opgave is. Ook gepubliceerd op het Data denkers blog. Deze blogpost is beschikbaar onder CC-BY.

Introductie

In 2013 kwam Chris Whong erachter dat de data van alle taxi-ritten in New York City opvraagbaar was via de Amerikaanse variant van een verzoek op de Wet Openbaarheid Bestuur (WOB). Na het invullen van wat formulieren en een paar dagen wachten ontving hij een USB stick met daarop bijna 20 Gigabyte aan data over de taxi-ritten in New York City in de afgelopen jaren.
Elke taxi-rit was beschreven door een regel met daarin ondermeer het begin- en eindtijd, vertrekpunt en eindpunt en het aantal passagiers. De prijs en de fooi waren in een apart bestand meegegeven. In de originele data was al deze data gekoppeld aan een taxi. In een poging die identiteit te verhullen, maar toch nuttige data op te leveren was dit versleuteld meegeleverd in de geopenbaarde data.

Continue reading

Morality on the Internet

Last year has seen some outcries over privacy breaches through NSA spying. We see more problems with pervasive monitoring and privacy through ad networks, Google tracking you, and soon possibly in your own home. This week we have seen that morality on the Internet goes beyond just privacy; there has been an outcry over the morality of Facebook manipulating news feeds for science. We need to look further than just privacy, and develop a new morality for the online space.

Continue reading

[Dutch] Reactie Internetconsultatie Gegevensdeling

De overheid heeft op dit moment een internetconsultatie uit staan voor Beleidsvisie gegevensdeling en privacy in het sociaal domein. PrivacyBarometer.nl heeft al een zeer goeie samenvatting van hun reactie gegeven. Mijn eigen reactie staat hieronder. Neem vooral de tijd om je te informeren en te reageren!

Continue reading