Die spannendere Frage ist doch: gibt es wirklich eine Datei irgendwo mit dem Namen "Profil von Moriarty aus Deutschland.txt" oder bist Du irgendein Statistikwert in einem großen, anonymen Massenprofil bei aktuell über 4 Milliarden Internetnutzern? Steht nachts an einer Ecke in Mountain View eine dubiose gestalt mit einem Trenchcoat und flüstern Passanten zu "Hey, pssst. Ich habe hier das Profil von Moriarty aus Deutschland. Willste kaufen?"
Oder konkreter: Gibt es Anhaltspunkte dass personalisierte Werbung so läuft, dass ein Mensch das Profil von Moriarty liest, sich einmal über den Youtube-Verlauf amüsiert und dann drei Werbebanner "losschickt"?
Ich gehe eher davon aus, dass mein Suchverlauf nirgendwo auf der Welt in personalisierter Form auftaucht sondern maximal irgendwelche Algorithmen mir Werbung für Gopro-Akkus anzeigen, weil ich zu den Millionen passenden Profilen gehöre die zufällig gestern ein Testvideo zur Hero 8 angesehen haben.
(Ich zitiere dich jetzt sinnbildlich, meine aber nicht dich ausschließlich)
Ich glaube Ihr versucht diese Daten, die diese Konzerne erfassen, mit gewöhnlichen Konzepten der Datenspeicherung zu verbinden, d.h. Textdateien, tabellarische/relationale Datenbanken, Excel-artige Datenbestände. Aber so funktioniert das nicht. Facebook z.B. bildet Netzwerke: wer kennt wen? Wer mag was? Wer followed wem? Das ist eine andere Art der Datenhaltung und am Ende vom Tag wird da
kein gigantischer JOIN mit der Tabelle "Nutzer" und "Hobbys_Rückenschwimmen" gemacht, um herauszufinden, welchen Nutzern ich Badehosenwerbung anzeige. In Wirklichkeit lasse ich mir einen Subgraphen raus der z.B. alle "Friends of a friend"-Instanzen von "Nutzer" des Interessensknotens "Rückenschwimmen" enthält, bzw. alle die eine gewisse Anzahl Hops entfernt sind, wenn nur bestimmte Kanten betrachtet werden.
Anders ausgedrückt: nein, da schaut keiner in deine "Akte". Aber deine "Akte" existiert, wenn auch nur als (virtueller) View. Der einzige Grund weshalb keiner in deine Akte schaut ist, weil niemand dafür Geld bekommt (aber wie gesagt, die Möglichkeit existiert und wird für Kriminalbehörden genutzt). Wofür die Leute aber Geld bekommen ist eine Liste an Akten und diese werden auch erstellt.
Die wirkliche Frage/Gefahr lautet: willst du auf eine Liste kommen, mit der du ggf. gar nichts zu tun hast?
Diese Assoziation geschieht automatisch, die Algorithmen sind nicht einsehbar und werden nicht manuell überprüft. Schlimmer: ihre Ergebnisse werden von dir erst bemerkt wenn es "zu spät ist" und können händisch fast nie korrigiert werden. Diese Bedrohung hört sich abstrakt an, kann aber schnell real werden und ist auch schon so passiert. Kommen wir zu Beispielen. Du kannst nicht mehr in verschiedene Länder einreisen weil du (unbewusst) neben einem Terroristen gewohnt hast und z.B. selbst einen arabischen Namen hast. Du bist auf eine "Terrorgefahr"-Liste gerutscht, hast das aber erst bemerkt, als du versucht hast, bestimmte Grenzen zu überqueren. Z.B. USA ist hier vorne mit dabei, oder gerne auch China. Insbesondere bei letzteren genügt es auf den falschen Plattformen die falschen Sätze zu schreiben. Dies gab es alles schon und passiert regelmäßig. Das wieder ungeschehen zu machen ist schwer bis unmöglich. Insbesondere mit der Terrorliste ging ja mal ein deutscher Fall durch die Medien. Das Grundproblem hierbei ist immer, dass die Assoziation ja stimmt (du wohnst halt neben Person X und dein Name ist nunmal Y), aber nur weil dem so ist, macht dich das ja nicht zu einem Terroristen. Man kann dich also nicht einfach von dieser Liste "austragen", weil du direkt wieder drauf landest, da der Algorithmus ja nach wie vor das gleiche macht.
In einem anderen Beispiel werden Leute in Kriminalfällen verdächtigt, weil sie zufällig auf einer Straße gelaufen sind, als dort "in der Nähe" ein Verbrechen geschehen ist.
Das sind konkret fassbare Fälle. Die gefährlicheren, weil uns alle betreffend und gleichzeitig selten "bemerkbar", sind eher solche: willst du auf einer Liste "Hat_Fetisch_XY" landen?
Solche Kategorien erlauben zahlenden Akteuren dich bewusst und gezielt zu manipulieren. Dir eine Blase zu konstruieren und dich mit gelenkten Informationen zu füttern. Nur ein leichter Drall reicht, um dir einen Schubs in eine Richtung zu geben, in die du ohne ggf. nie gegangen wärst. Wir wissen, dass dies funktioniert. Wurde oft genug durchgeführt, insbesondere im politischen Rahmen. In welchen Gebieten funktioniert das auch noch super? Ich fürchte, wir werden es herausfinden.
Unabhängig davon ob der Algorithmus dich richtig eingeordnet hat oder nicht, wird es auch hier schnell gefährlich: was wenn du fälschlicherweise in die Kategorie "Mag Kinder etwas zu gerne" fällst, obwohl es gar nicht stimmt? Was wenn dein Arbeitgeber Zugriff auf diese Informationen hat bzw. kaufen kann? Zahlreiche Firmen bieten eine Art "vetting" Dienst an, der darauf basiert, alle deine Online-Informationen zu sammeln, dich in Listen einzuordnen und dem Käufer zu sagen, in welchen du drin bist. Nutzen gerne US Firmen bei der Personalsuche.
Wie das "Endgame" von Assoziationen aussieht sehen wir in China: Sozialkredit. Aktuell in einem "freiwilligen Testlauf" in diversen kleinen Städten und bis Ende 2020 verpflichtend für ganz Beijing (22 Mio Menschen). Jeder Mensch bekommt einen Score, ähnlich dem Schufa Score. Nur fließt darin
alles ein. Verbringst du Zeit mit Menschen, die einen niedrigen Score haben? Schlecht für deinen Score. Kaufst du bestimmte, als "schlecht" angesehene aber absolut legal erhältliche Produkte? Score sinkt.
Aktuell hat ein niedriger Score hauptsächlich finanzielle Auswirkungen und macht eine staatliche Karriere unmöglich. Davon ab können Menschen mit geringem Rating keine Zug- und Flugtickets kaufen oder schnelles Internet bekommen. Ob es dabei bleibt ist abzuwarten. Vielleicht hängt irgendwann der Arzttermin von deinem Score ab...
Übrigens, laut Wiki senden die Elektro-Autos der deutschen Hersteller BMW, Daimler und VW über 60 Messwerte ("darunter zur Akku- und Motorenfunktion und Standortdaten") an die chinesische Regierung, welche ebenfalls in den Score einfließen. Niedriger Score bei zu schneller Fahrt?
Das Problem ist nicht, dass jemand in deine Akte schaut.
Das Problem sind die Verbindungen und Assoziationen, die Algorithmen ungeprüft und automatisiert tätigen.