Ethics and ‘Big Data’ Geospatial Research

On March 3 2016 a paper was published titled “Tagging Banksy: using geographic profiling to investigate a modern art mystery”. The article describes a technique for analysing geospatial aspects of a large data set of artworks to identify the author of the graffiti. The abstract of the article already gives you an idea of where this is heading:

More broadly, these results support previous suggestions that analysis of minor terrorism-related acts (e.g., graffiti) could be used to help locate terrorist bases before more serious incidents occur, and provides a fascinating example of the application of the model to a complex, real-world problem.

Continue reading

On Taxis and Rainbows: Anonymising is not easy

I’ve written a series of blog posts for the Rathenau Institute on ethical issues in data research. In this article I show that proper anonymisation of data is no easy task. This article is a translation of the Dutch original, and is available under CC-BY

Introduction

In 2013 Chris Whong discovered that the data of all taxi rides in New York City was available based on the FOIL (the Freedom of Information Law). After filling out some forms, providing a large USB flash drive and waiting a few days, he received his flash drive with nearly 20 gigabytes of data. Continue reading

[Dutch] Ethisch Witwassen

Ik schrijf voor het Rathenau Instituut een serie blogs over ethische vraagstukken bij data-onderzoeken. In deze bijdrage laat ik zien hoe er bij samenwerkingen tussen onderzoekers en bedrijven een verschil kan zijn in de ethische standaarden waarmee wordt gewerkt. Ook gepubliceerd op het Data denkers blog. Deze blogpost is beschikbaar onder CC-BY.

Introductie

Facebook is een bedrijf dat leeft op gedeelde data. Mensen worden lid van Facebook om status updates te delen met vrienden, op de hoogte te blijven van wat anderen doen en berichtjes naar elkaar te sturen. Facebook analyseert en filtert de data en probeert op die manier een zo prettig mogelijk beeld te geven van wat er om je heen gebeurt. Door je gedrag kan Facebook leren wie je goede vrienden zijn en wie je vage kennissen. De status-updates van die mensen worden ook op die manier behandeld.

Maar in januari 2012 ging Facebook nog een stapje verder: onderzoekers wilde kijken of het mogelijk was om emoties te beïnvloeden door de filtering van berichten aan te passen. Te kijken of gebruikers ook minder vrolijk werden als er minder vrolijke berichten getoond werden, of juist blijer als er minder verdrietige berichten getoond werden. Continue reading

[Dutch] Taxi’s en Regenbogen: anonimisering geen gemakkelijke opgave

Ik schrijf in opdracht voor het Rathenau Instituut een serie blogs over ethische vraagstukken bij data-onderzoeken. In deze bijdrage laat ik zien dat het goed anonimiseren van open data geen eenvoudige opgave is. Ook gepubliceerd op het Data denkers blog. Deze blogpost is beschikbaar onder CC-BY.

Introductie

In 2013 kwam Chris Whong erachter dat de data van alle taxi-ritten in New York City opvraagbaar was via de Amerikaanse variant van een verzoek op de Wet Openbaarheid Bestuur (WOB). Na het invullen van wat formulieren en een paar dagen wachten ontving hij een USB stick met daarop bijna 20 Gigabyte aan data over de taxi-ritten in New York City in de afgelopen jaren.
Elke taxi-rit was beschreven door een regel met daarin ondermeer het begin- en eindtijd, vertrekpunt en eindpunt en het aantal passagiers. De prijs en de fooi waren in een apart bestand meegegeven. In de originele data was al deze data gekoppeld aan een taxi. In een poging die identiteit te verhullen, maar toch nuttige data op te leveren was dit versleuteld meegeleverd in de geopenbaarde data.

Continue reading