Wszyscy kłamią. Big data, nowe dane i wszystko, co Internet może nam powiedzieć o tym, kim naprawdę jesteśmy - Seth Stephens-Davidowitz - ebook

Wszyscy kłamią. Big data, nowe dane i wszystko, co Internet może nam powiedzieć o tym, kim naprawdę jesteśmy ebook

Seth Stephens-Davidowitz

4,2

Ebook dostępny jest w abonamencie za dodatkową opłatą ze względów licencyjnych. Uzyskujesz dostęp do książki wyłącznie na czas opłacania subskrypcji.

Zbieraj punkty w Klubie Mola Książkowego i kupuj ebooki, audiobooki oraz książki papierowe do 50% taniej.

Dowiedz się więcej.
Opis

Oto człowiek! Wszystko, czego wolelibyście nie wiedzieć o sobie i innych

Serum prawdy – niepotrzebne, konfesjonały – do lamusa, wykrywacze kłamstw – na śmietnik historii! Jest jedno miejsce, gdzie ludzie są – przynajmniej na ogół – absolutnie szczerzy: okno wyszukiwarki.

Seth Stephens-Davidowitz, filozof i doktor ekonomii, były pracownik Google’a, przeanalizował dane z wyszukiwań internetowych dotyczących między innymi rasizmu, depresji, wykorzystywania nieletnich, poczucia humoru czy preferencji seksualnych. Owocem tych badań jest książka Wszyscy kłamią – bestseller „New York Timesa” i „Wall Street Journal”, Książka Roku według „The Economist” i „Business Insider”.

Jak często ludzie NAPRAWDĘ uprawiają seks?

Co należy mówić na pierwszej randce, żeby nie stracić szans na drugą?

Ilu naprawdę jest rasistów w Ameryce?

Czy Freud ściemniał?

Czy rodzice inaczej traktują synów, a inaczej córki?

Jaki procent mężczyzn to geje?

Znaczna część z tego, co dotychczas myśleliśmy o ludziach, to fałsz, twierdzi Stephens-Davidowitz. Powód? Ludzie kłamią – w kwestionariuszach i rozmowach. Okłamują przyjaciół, kochanków, lekarzy i samych siebie.

Dziś nie musimy już jednak opierać się wyłącznie na deklaracjach ankietowanych. Dane z Internetu – ślady informacji, które miliardy ludzi zostawiają w Google, mediach społecznościowych, serwisach randkowych, a nawet na stronach pornograficznych – wreszcie pokazują nagą prawdę. Możemy teraz dowiedzieć się, co ludzie naprawdę myślą i czego pragną.

Wnioski? Mogą rozśmieszyć, zszokować albo głęboko zaniepokoić. Z całą pewnością jednak skłonią do refleksji nad tym, kim jest człowiek początku XXI wieku.

Ebooka przeczytasz w aplikacjach Legimi na:

Androidzie
iOS
czytnikach certyfikowanych
przez Legimi
czytnikach Kindle™
(dla wybranych pakietów)

Liczba stron: 398

Oceny
4,2 (617 ocen)
273
207
103
28
6
Więcej informacji
Więcej informacji
Legimi nie weryfikuje, czy opinie pochodzą od konsumentów, którzy nabyli lub czytali/słuchali daną pozycję, ale usuwa fałszywe opinie, jeśli je wykryje.
Sortuj według:
nijante

Z braku laku…

Duzo przypadkowych faktów, które są nawet ciekawe, ale żeby do nich dotrzeć trzeba się przebić przez poczucie humoru autora.
20
lena1666

Całkiem niezła

Całkiem niezła książka o tym kim chcemy być i jak mimo naszych najlepszych wysiłków ciagle się demaskujemy buszując w sieci.
10
beatakuczekmaruta

Dobrze spędzony czas

Przeczytałam z wielkim zainteresowaniem. Zawsze wydawało mi się, że ślady cyfrowe które bezrefleksyjnie zostawiamy mogą być kopalnią wiedzy o społeczeństwie, trendach, prawdziwych poglądach ludzi. I oto młody analityk big data w wartkiej opowieści to potwierdza. Książka bardzo ciekawa technologicznie i społecznie.
10
Pawelshoppinguk

Nie oderwiesz się od lektury

Polecm, dobra ksiazka pozwalajaca spojrzec inaczej na big data :)
10
Owcanica

Dobrze spędzony czas

Warto przeczytać!
10

Popularność




Tytuł oryginałuEverybody Lies. Big Data, New Data, and What the Internet Can Tell Us About Who We Really Are
Opieka redakcyjna: MACIEJ ZARYCH
Redakcja: KAMIL BOGUSIEWICZ
Korekta: URSZULA SROKOSZ-MARTIUK, ANETA TKACZYK, MARIA WOLAŃCZYK
Projekt okładki: LISA AMOROSO
Ilustracje na okładce: © Visuals Unlimited, Inc./Victor Habbick, © Shutterstock/Aaron Amat
Opracowanie graficzne wersji papierowej na podstawie oryginału: MAREK PAWŁOWSKI
Redakcja techniczna: ROBERT GĘBUŚ
Copyright © 2017 by Seth Stephens-Davidowitz. All rights reserved © Copyright for the Polish translation by Maciej Świerkocki © Copyright for this edition by Wydawnictwo Literackie, 2019
Wydanie pierwsze
ISBN 978-83-08-07124-3
Wydawnictwo Literackie Sp. z o.o. ul. Długa 1, 31-147 Kraków tel. (+48 12) 619 27 70 fax. (+48 12) 430 00 96 bezpłatna linia telefoniczna: 800 42 10 40 e-mail: [email protected] Księgarnia internetowa: www.wydawnictwoliterackie.pl
Konwersja: eLitera s.c.

Mamie i Tacie

PRZEDMOWA

Odkąd filozofowie zaczęli spekulować na temat „cerebroskopu”, mitycznego urządzenia wyświetlającego ludzkie myśli na ekranie monitora, przedstawiciele nauk społecznych szukają instrumentów, dzięki którym można by odkryć mechanizm natury ludzkiej. Przez długie lata mojej pracy psychologa eksperymentalnego wchodziły w modę i traciły na popularności różne metody badawcze, a ja próbowałem stosować je wszystkie – skalę ocen, czas reakcji, zwężenie źrenic czy neuroobrazowanie funkcjonalne. Miałem nawet chorych na epilepsję pacjentów z elektrodami, którzy w oczekiwaniu na kolejny atak chętnie poddawali się eksperymentom językowym.

Żadna z tych metod nie dostarcza jednak bezpośredniego wglądu w ludzki umysł, jesteśmy więc zmuszeni do wielkich kompromisów naukowych. Ludzkie myśli przyjmują postać skomplikowanych tez i twierdzeń; nie jest tak, jak chce Woody Allen – że przeczytawszy szybko Wojnę i pokój, myślimy potem tylko, że „To była książka o jakichś Rosjanach”. A skomplikowane tezy i twierdzenia w swojej poplątanej, wielowymiarowej chwale sprawiają naukowcom trudności analityczne. Oczywiście gdy ludzie się przed nami otwierają, jesteśmy w stanie zarejestrować bogactwo ich strumienia świadomości, monologi nie stanowią jednak idealnej bazy danych, na których moglibyśmy sprawdzać swoje hipotezy. Z drugiej strony, jeśli skupimy się na elementach łatwo policzalnych, jak czas reakcji człowieka na słowa albo reakcja naszego naskórka na treści wizualne, możemy dokonywać rachunków statystycznych, ale redukujemy wtedy skomplikowaną strukturę poznawczą do pojedynczej liczby. Nawet najbardziej zaawansowane metody badań neuroobrazów mogą nam co najwyżej powiedzieć, jak myśl rozkłada się w przestrzeni 3-D, nie wyjaśnią jednak, z czego jest zbudowana.

Jak gdyby kompromis między łatwością obróbki materiału a jego złożonością nie był złem sam w sobie, uczeni zajmujący się naturą ludzką mają także kłopot z Prawem Małych Liczb. Taką nazwę Amos Tversky i Daniel Kahnemann nadali fałszywemu mniemaniu, że cechy populacji odbijają się w dowolnej, nawet najmniejszej próbce testowej. Wszyscy, w tym i uczeni biegli w matematyce, żywią żałośnie błędne poglądy co do tego, ile osób naprawdę trzeba przebadać, zanim będziemy mogli wyeliminować przypadkowe wnioski i domysły i uogólnić wyniki naszych eksperymentów w taki sposób, aby rozciągnąć je na wszystkich Amerykanów, nie wspominając już o całej ludzkości. A wartość naszych badań jest tym bardziej wątpliwa, jeśli uczestnicy biorą w nich udział dla osobistych korzyści, jak choćby nasi studenci trzeciego roku, którym wypłacamy drobne kwoty na piwo.

Ta książka opisuje zupełnie nowy sposób badania ludzkiego umysłu. Big data, wielki zbiór danych zbudowany na podstawie wyszukiwań internetowych i innych działań online, to wprawdzie nie cerebroskop, ale Seth Stephens-Davidowitz dowodzi, że takie zbiory danych pozwalają nam zajrzeć w głąb ludzkiej duszy głębiej niż kiedykolwiek. Pochyleni w samotności nad klawiaturą komputera ludzie przyznają się do najdziwniejszych rzeczy, czasami dlatego (na przykład na portalach randkowych albo szukając profesjonalnej porady), że chcą wywołać jakieś skutki w realnym życiu, a czasami przeciwnie, dlatego że ich nie chcą – zrzucają zatem niekiedy kamień z serca, przyznając się do pewnych pragnień czy obaw, bo wiedzą, że nikt w realnym świecie nie zareaguje na nie pełnym przerażenia zdumieniem albo w jakiś znacznie gorszy sposób. Czy jednak ktoś zareaguje, czy nie, internauci nie tylko stukają po prostu w klawisze lub przekręcają gałki, ale też wpisują w sieć tryliony najróżniejszych sekwencji znakowych, aby wyrazić za ich pośrednictwem swoje myśli w całym ich wybuchowym, kombinacyjnym ogromie. I jeszcze lepiej – pozostawiamy za sobą te cyfrowe ślady w takiej formie, że łatwo jest je gromadzić i analizować. Internauci wywodzą się z wszystkich grup społecznych. Mogą brać udział w niejawnych eksperymentach, w których wykorzystuje się różne bodźce i tabularyzuje je w czasie rzeczywistym. Ludzie dokonujący wpisów w sieci skwapliwie dostarczają nam takich danych, i to we wprost gargantuicznych ilościach.

Książka Wszyscy kłamią jest czymś więcej niż tylko dowodem na słuszność pewnej koncepcji. Wnioski Stephensa-Davidowitza wielokrotnie przewracały do góry nogami mniemania, jakie miałem na temat mojego kraju i gatunku homo sapiens. Skąd wzięło się nieoczekiwane poparcie dla Donalda Trumpa? Czy kiedy w 1976 roku Ann Landers zapytała swoich czytelników, czy żałują tego, że mają dzieci, i ze zdumieniem stwierdziła, że większość z nich odpowiada twierdząco, to została wprowadzona w błąd, bo jej sondaż objął niereprezentatywną próbkę respondentów, których sama wybrała? Czy to Internet ponosi winę za powstanie „bańki filtrującej”, jak redundantnie bywa nazywany sieciowy kryzys końca drugiej dekady XXI wieku? Co powoduje przestępstwa nienawiści? Czy ludzie szukają dowcipów w Internecie, by poprawić sobie nastrój? Lubię myśleć, że nic nie jest w stanie mnie zaszokować, lecz informacje o tym, co Internet mówi nam na temat ludzkiej seksualności, naprawdę mną wstrząsnęły – jak na przykład wiadomość, że określona liczba kobiet co miesiąc wyszukuje zdjęcia oraz filmy przedstawiające „ruchanie wypchanych zwierząt”. Tego faktu nie mogłyby ujawnić żadne eksperymenty oparte na czasie reakcji, zwężeniu źrenic czy funkcjonalnym neuroobrazowaniu.

Wszyscy kłamią przypadnie do gustu każdemu czytelnikowi. Stephens-Davidowitz z niezłomną dociekliwością i czarującą inteligencją wskazuje nową ścieżkę rozwoju dla nauk społecznych w XXI stuleciu. Po co nam cerebroskop, skoro otworzyliśmy tak nieskończenie fascynujące okno, przez które dobrze widać nasze obsesje?

Steven Pinker, 2017

WSTĘP

ZARYSY REWOLUCJI

Wszyscy mówili, że na pewno przegra.

W czasie prawyborów w Partii Republikańskiej w 2016 roku specjaliści od ankiet i sondaży doszli do przekonania, że Donald Trump nie ma najmniejszych szans na zwycięstwo. Przecież obraził dużo różnych mniejszości. A z badań opinii publicznej i wypowiedzi ich interpretatorów wynikało, że tylko bardzo niewielu Amerykanów toleruje takie oburzające wystąpienia.

Większość ekspertów sądziła też, że Trump przegra w wyborach powszechnych. Zbyt wielu potencjalnych wyborców dawało do zrozumienia, że nie podobają im się jego postawa i poglądy.

Pewne oznaki świadczące o tym, że Donald Trump mimo wszystko może zwyciężyć zarówno w prawyborach, jak i w wyścigu o fotel prezydenta, jednak się pojawiły – w Internecie.

Jestem specjalistą od analizy danych internetowych. Codziennie tropię różne cyfrowe znaki, jakie ludzka obecność zostawia za sobą w sieci. Na podstawie śladów po klawiszach, które wciskamy na klawiaturze komputera, albo kliknięciach myszką, próbuję odgadnąć, czego naprawdę pragniemy, jak rzeczywiście postąpimy w przyszłości i kim faktycznie jesteśmy. Pozwólcie teraz, że wytłumaczę wam, co sprawiło, że wstąpiłem na tę dosyć niezwykłą drogę życiową.

Moja historia zaczyna się wraz z amerykańskimi wyborami prezydenckimi w 2008 roku – dzisiaj wydaje się, że było to już całe wieki temu – i łączy z pewnym pytaniem, które od lat pojawia się w rozważaniach przedstawicieli nauk społecznych: jak ważną rolę odgrywają w Stanach Zjednoczonych uprzedzenia rasowe?

Barack Obama jako pierwszy Afroamerykanin w historii startował w wyborach z ramienia wielkiej partii politycznej, nominowany do walki o fotel prezydenta. Wygrał – i to dość łatwo, a badania opinii publicznej zdawały się sugerować, że kolor jego skóry nie miał większego znaczenia w głosowaniu[1]. Na przykład Instytut Gallupa przeprowadził wiele sondaży przed pierwszą elekcją Obamy oraz po niej. Wnioski? Większości głosujących nie obchodziło to, że kandydat demokratów jest czarny. Niedługo po wyborach dwaj znani profesorowie z University of California w Berkeley przekopali się przez inne dane, oparte na badaniach opinii publicznej, stosując bardziej wyrafinowane metody analityczne[2], doszli jednak do takiej samej konkluzji.

Dlatego za czasów prezydentury Obamy opinia ta przeważała, zarówno w większości mediów, jak i ośrodków akademickich. Metody, do których środki przekazu i socjologowie odwoływali się wtedy już od ponad osiemdziesięciu lat, próbując zrozumieć rzeczywistość społeczną, dostarczały nam dowodów na to, że przy podejmowaniu decyzji o tym, czy Barack Obama ma zostać prezydentem, znaczna większość obywateli Stanów Zjednoczonych nie brała pod uwagę jego etnicznego pochodzenia.

Wyglądało na to, że w USA, przez długie lata plamionych niewolnictwem i dyskryminującymi czarnych ustawami, przestano w końcu oceniać ludzi po kolorze skóry, co z kolei zdawało się sugerować, że amerykański rasizm dogorywa. Znaleźli się nawet mędrcy, którzy ogłosili, że żyjemy już w społeczeństwie postrasowym[3].

W 2012 roku, gdy Obama zwyciężył po raz drugi, byłem zagubionym życiowo doktorantem ekonomii – wypalonym, jeśli chodzi o moją pierwszą specjalność naukową, choć przy tym pewnym siebie, a nawet pyszałkowatym, sądziłem bowiem, że całkiem już nieźle rozumiem, na czym polega ten świat oraz co ludzie XXI wieku myślą i do czego przywiązują wagę. Jeżeli chodzi o uprzedzenia rasowe, to bazując na swoich lekturach psychologicznych i politologicznych, mniemałem, że do rasizmu otwarcie przyznaje się zaledwie znikomy odsetek mieszkańców Stanów Zjednoczonych, w większości konserwatywnych republikanów, mieszkających na ogół na dalekim południu kraju.

Potem odkryłem jednak Google Trends.

Wyszukiwarka ta, wypuszczona po raz pierwszy na rynek bez większych fanfar w 2009 roku, informuje swoich użytkowników, jak często internauci szukali w sieci danego słowa czy frazy w różnych miejscach i czasie. Reklamowano ją właściwie jako zabawkę, na przykład umożliwiającą grupie znajomych dyskusję o tym, który celebryta cieszy się największą popularnością albo co nieoczekiwanie zrobiło się „trendy”. Jej najwcześniejsze wersje opatrywano humorystycznym zastrzeżeniem, że na podstawie takich danych źródłowych „nikt nie zechce napisać doktoratu”, co oczywiście natychmiast mnie skłoniło, aby napisać doktorat, korzystając właśnie z nich[1*].

Informacji pochodzących z wyszukiwarki Google nie uważano w tamtym czasie za odpowiednie źródło dla „poważnych” badań akademickich. W przeciwieństwie do ankiet i sondaży, Google’a nie stworzono z myślą o tym, by pomóc nam zrozumieć ludzką psychikę, tylko raczej po to, żebyśmy mogli dowiedzieć się czegoś o świecie, wyszukiwarki nie traktowano zatem jako narzędzia, dzięki któremu uczeni mogliby lepiej poznać naturę ludzką. Okazało się jednak, że ślady, które po sobie pozostawiamy podczas wyszukiwania w sieci, są wielce pouczające.

Inaczej mówiąc, szukanie informacji samo jest informacją. To, kiedy i gdzie ludzie poszukują różnych rzeczy, faktów, cytatów, dowcipów, miejsc, osób lub pomocy, może, jak się okazuje, powiedzieć nam znacznie więcej, niż większość z nas przypuszcza, o tym, co naprawdę myślimy i robimy oraz czego naprawdę pragniemy i się boimy. Wniosek taki jest tym bardziej uprawniony, że ludzie czasem nie tyle zadają Google’owi pytania, ile mu się zwierzają: „Nie cierpię swojego szefa”. „Jestem pijany”. „Tata mnie uderzył”.

Codzienna czynność polegająca na tym, że wklepujemy jakieś słowo czy frazę w niewielki prostokątny pasek wyszukiwarki, pozostawia po sobie mikroskopijny ślad prawdy, który pomnożony przez wiele milionów, doprowadza nas w końcu do pewnych istotnych faktów. Pierwszym słowem, które wpisałem w Google Trends, był „Bóg” – i dowiedziałem się, że stany, gdzie najczęściej pojawiają się zawierające je wyszukiwania, to Alabama, Missisipi i Arkansas – czyli stany należące do tak zwanego Pasa Biblijnego. I że wyszukiwania te prowadzone są najczęściej w niedziele. Żadna z tych informacji nie była zaskakująca, lecz zaintrygowało mnie to, że z danych o wyszukiwaniu może wynikać tak konkretna wiedza. Następnie wpisałem nazwę drużyny koszykarskiej „Knicks” i okazało się, że pojawia się ona najczęściej w wyszukiwaniach prowadzonych w Nowym Jorku. Tego też nietrudno byłoby się domyślić. W końcu wpisałem w Internet swoje nazwisko. „Przepraszamy – poinformowała mnie Google Trends. – Brak mocy obliczeniowej, żeby wyświetlić rezultaty”. Dzięki temu zdałem sobie sprawę, że Google Trends może udzielić odpowiedzi tylko wtedy, kiedy poszukiwania w sieci na taki czy inny temat prowadzi wiele osób.

Siła odpowiedzi Google’a nie polega jednak na tym, że można się dowiedzieć, że Bóg cieszy się zainteresowaniem na Południu, zespół Knicksów w Nowym Jorku, a mną nie interesuje się zupełnie nikt i nigdzie. O tym mogłaby nas przekonać każda ankieta. Siłą Google’a jest to, że ludzie mówią tej gigantycznej wyszukiwarce rzeczy, jakich nie powiedzieliby nikomu innemu.

Weźmy na przykład seks (temat, któremu przyjrzę się znacznie bliżej w dalszej części książki). W kwestii naszego życia seksualnego nie można ufać sondażom i ankietom. Przeanalizowałem na przykład informacje z badań General Social Survey[4], uważanych za jedno z najbardziej wpływowych i autorytatywnych źródeł informacji o zachowaniach i zwyczajach Amerykanów i Amerykanek. Zgodnie z wynikami GSS – jeśli chodzi o seks par hetero – Amerykanki twierdzą, że odbywają średnio pięćdziesiąt pięć stosunków seksualnych rocznie, w szesnastu procentach przypadków z użyciem kondomów. Daje to miliard sto tysięcy zużytych prezerwatyw na rok. Heteroseksualni mężczyźni utrzymują jednak, że zużywają rocznie miliard sześćset tysięcy kondomów – a przecież liczby podawane przez kobiety i mężczyzn powinny być w tym kontekście jednakowe niejako z definicji. Kto zatem mówi prawdę, mężczyźni czy kobiety?

Okazuje się, że ani jedna, ani druga strona. Zgodnie z analizą globalnej firmy Nielsen, zajmującej się zbieraniem informacji i badaniami metrycznymi zachowań konsumenckich, w Stanach Zjednoczonych sprzedaje się mniej niż sześćset milionów kondomów na rok[5]. Kłamiemy zatem wszyscy, różnica polega tylko na tym, w jakim stopniu mijamy się z prawdą.

A nasze kłamstwa mają daleki zasięg. Na przykład panowie, którzy nigdy nie byli żonaci, twierdzą, że zużywają średnio dwadzieścia dziewięć kondomów rocznie, co oznacza, że ich suma przewyższyłaby liczbę wszystkich prezerwatyw sprzedanych w USA zarówno mężczyznom pozostającym w związkach małżeńskich, jak i kawalerom. Osoby żonate i zamężne też chyba przesadzają, opowiadając o tym, jak często uprawiają seks – bo żonaci mężczyźni poniżej sześćdziesiątego piątego roku życia twierdzą, że kochają się przeciętnie raz w tygodniu, a zaledwie jeden procent z nich przyznaje, że w ostatnim roku nie uprawiał seksu ani razu. Mężatki, jak wynikałoby z badań, kochają się nieco rzadziej, ale tylko trochę.

Tymczasem Google przedstawia daleko mniej ożywiony – i w moim mniemaniu o wiele prawdziwszy – obraz naszego małżeńskiego życia erotycznego. Według wyszukiwarki najczęściej skarżymy się w małżeństwie na brak seksu. Wpisy takie jak „brak seksu małżeńskiego” są trzy i pół razy częstsze niż „nieszczęśliwe małżeństwo” i osiem razy częstsze niż „małżeństwo bez miłości”. Zresztą nawet pary pozostające w związkach partnerskich nierzadko narzekają na brak seksu. Częstotliwość wyszukiwania fraz typu „związek bez seksu” ustępuje tylko wyszukiwaniu „przemocy w związku” (muszę tutaj dodać, że wszystkie te informacje podawane są anonimowo, Google nie ujawnia bowiem oczywiście żadnych danych dotyczących wyszukiwań prowadzonych przez osoby przedstawiane z imienia i nazwiska).

Poza tym wpisy w Google’u pokazywały zupełnie inny obraz Ameryki niż postrasowa utopia, jaką odmalowują badania ankietowe. Pamiętam, kiedy po raz pierwszy wpisałem w Google Trends słowo „czarnuch”. Nazwijcie mnie naiwniakiem, lecz biorąc pod uwagę wysoką toksyczność tego określenia, naprawdę oczekiwałem, że nie będzie używane w Internecie zbyt często. Grubo się myliłem. Bo w Stanach Zjednoczonych „czarnuch” – albo jego liczba mnoga, „czarnuchy” – pojawiało się w wyszukiwarce mniej więcej równie często jak „migrena” („migreny”), „ekonomista” czy „Lakersi”. Zacząłem się zastanawiać, czy na takie wyniki nie mają wpływu teksty piosenek raperskich. Ale nie. A to dlatego, że słowo, którego używają raperzy w swoich utworach, pisze się inaczej: nie „nigger” („niggers”), tylko „nigga(s)”. Co zatem kierowało Amerykanami wstukującymi „czarnuchów” w wyszukiwarkę? Często szukali dowcipów o Afroamerykanach – dwadzieścia procent wyszukiwań ze słowem „czarnuch” obejmowało również słowo „dowcipy”. Inne często spotykane tego typu hasła w Google’u to „głupie czarnuchy” i „nienawidzę czarnuchów”.

Podobnych wpisów co roku pojawiały się miliony. Duża liczba Amerykanów przeprowadzała w swoim zaciszu domowym szokująco rasistowskie poszukiwania w sieci. Im bliżej badałem tę sprawę, tym więcej znajdowałem niepokojących danych.

Pierwszego wieczoru po wyborze Obamy na prezydenta, gdy większość komentarzy skupiała się na komplementowaniu go i podkreślaniu historycznego znaczenia jego elekcji, w Google’u mniej więcej jeden wpis na sto, które zawierały słowo „Obama”, zawierał również skrótowiec „kkk” albo określenie „czarnuch(y)”. Może nie wydaje się, że to tak wiele, pomyślmy jednak o tysiącach nierasistowskich powodów, dla jakich można by wygooglować tego młodego czarnoskórego outsidera z czarującą rodziną, który właśnie dostał pracę na stanowisku najpotężniejszego człowieka na świecie. W dniu wyborów liczba wyszukiwań i wejść na Stormfront[6] – zaskakująco popularny w USA portal białych nacjonalistów – była dziesięciokrotnie wyższa niż zazwyczaj. W niektórych stanach znalazłem więcej wpisów w rodzaju „prezydent czarnuch” niż „pierwszy czarny prezydent”[7].

Mieliśmy więc do czynienia z ciemnotą i nienawiścią, nieobecnymi w tradycyjnych środkach przekazu, ale na porządku dziennym w Internecie.

Wyszukiwania tej treści trudno jest pogodzić z obrazem społeczeństwa, w którym rasizm odgrywa rzekomo niewielką rolę. W 2012 roku Donald J. Trump był mi znany głównie jako biznesmen i uczestnik reality shows. Jak większość z nas, nie miałem bladego pojęcia, że cztery lata później stanie się poważnym pretendentem do fotela prezydenckiego. Ale internetowe wpisy o tak paskudnym rasistowskim wydźwięku łatwo jest chyba zrozumieć na tle sukcesu kandydata, który w swoich atakach na imigrantów, gniewnych wystąpieniach i resentymentach grał często na najniższych instynktach ludzkich.

Wyszukiwania w Google’u uświadomiły nam też, że wiele naszych wyobrażeń na temat geografii uprzedzeń rasowych jest mylnych. Badania ankietowe i powszechne przekonania umieszczały centrum współczesnego rasizmu głównie na południu USA i wśród republikanów. Ale do miejsc, gdzie rasistowskie wpisy pojawiały się najczęściej, należy zaliczyć północną część stanu Nowy Jork, zachodnią Pensylwanię, wschodnie Ohio, przemysłowe Michigan i rolnicze Illinois, choć także Wirginię Zachodnią, południową Luizjanę oraz Missisipi. Prawdziwa linia podziału, jak sugerowały dane z Google’a, nie przebiegała na granicy między południem i północą USA, tylko pomiędzy wschodem i zachodem. Na zachód od Missisipi nie jest już tak źle. Poza tym rasizm bynajmniej nie ograniczał się do republikanów. Mówiąc wprost, rasistowskie wyszukiwania wcale nie występowały częściej w środowisku republikańskim niż wśród demokratów. Innymi słowy, wyszukiwarka Google pomogła nam nakreślić nową mapę rasizmu w Stanach Zjednoczonych, wyglądającą zupełnie inaczej, niż można by przypuszczać. Republikanie z Południa prędzej przyznają się publicznie do rasizmu, lecz wielu demokratów z Północy w głębi duszy podziela ich poglądy.

Mapa, którą stworzyłem dzięki wpisom w Google’u, miała się okazać niezwykle ważna dla wyjaśnienia politycznego sukcesu Trumpa cztery lata później.

W 2012 roku wykorzystałem ją po to, aby ponownie ocenić rolę, jaką odegrało w wyborach pochodzenie etniczne Baracka Obamy. Dane okazały się jednoznaczne. W tych regionach kraju, gdzie wyszukiwań rasistowskich było wiele, Obama uzyskał znacząco gorsze wyniki niż cztery lata wcześniej John Kerry, biały kandydat demokratów na prezydenta. Nie dało się wyjaśnić tej różnicy innymi czynnikami, takimi jak poziom wykształcenia, wiek wyborców, ich religijność czy łatwość dostępu do broni w danym stanie. Ale to, że spośród kandydatów demokratycznych jedynie Barack Obama osiągnie słaby wynik, można było przewidzieć wyłącznie na podstawie internetowych wpisów o treściach rasistowskich.

A wpisy te miały niebagatelne znaczenie. Na skutek postaw jawnie rasistowskich Obama stracił mniej więcej cztery punkty procentowe w skali kraju, czyli znacznie więcej, niż mogliśmy się spodziewać według sondaży. Oczywiście został wybrany na prezydenta dwukrotnie, w czym dopomogły mu pewne niezwykle sprzyjające Partii Demokratycznej okoliczności, musiał jednak pokonać znacznie większe przeszkody, niż spodziewali się ludzie opierający swoje przewidywania na tradycyjnych źródłach informacji – czyli właściwie wszyscy. Rasistów znalazło się zaś potem dosyć, by w roku wyborczym już nie tak pomyślnym dla demokratów pomóc wygrać prawybory ich przeciwnikom albo przechylić szalę na niekorzyść Partii Demokratycznej w wyborach powszechnych.

Moja analiza została początkowo odrzucona przez aż pięć pism akademickich[8]. Wielu recenzentów, jeśli czytelnik wybaczy mi pewną zgryźliwość, twierdziło, że nie sposób uwierzyć, aby tak wielu Amerykanów hołdowało takim zajadłym poglądom rasistowskim. Po prostu ten obraz nie pasował do oficjalnych wypowiedzi naszych obywateli. Poza tym wyszukiwarka Google’a wielu uczonym wydawała się jeszcze wtedy mocno kuriozalną bazą danych.

Dziś, po zaprzysiężeniu prezydenta Donalda J. Trumpa, moje ustalenia wyglądają chyba o wiele wiarygodniej.

Im dłużej prowadziłem swoje badania, tym bardziej się przekonywałem, że Google zawiera wiele informacji, których nie uwzględniają sondaże, a które mogą nam pomóc w zrozumieniu mechanizmu wyborów prezydenckich – a także wielu, bardzo wielu innych zjawisk.

Można na przykład znaleźć w Google’u informacje o tym, kto ostatecznie pójdzie do urn wyborczych. Ponad połowa obywateli, którzy nie głosują, deklaruje w sondażach tuż przed wyborami, że zamierza głosować, co wpływa na nasze przewidywania frekwencji; tymczasem wyszukiwania o treści „jak głosować” albo „gdzie głosować”, prowadzone w Internecie nawet na wiele tygodni przed wyborami, mogą nam pomóc precyzyjnie ustalić, w których częściach kraju frekwencja będzie najwyższa.

W sieci możemy znaleźć nawet informację, na kogo ci wyborcy oddadzą swój głos. Ja i Stuart Gabriel, profesor bankowości i finansów z University of California w Los Angeles, odkryliśmy zaskakującą wskazówkę, pozwalającą odgadnąć, jak będą głosować Amerykanie. Otóż znaczny odsetek wyszukiwań związanych z wyborami zawiera pytania z nazwiskami obu kandydatów. W czasie wyborów w 2016 roku, kiedy kandydatami byli Trump i Hillary Clinton, niektórzy wpisywali w wyszukiwarkę hasło „sondaże Trump Clinton”, inni zaś szukali najciekawszych momentów z „debaty Clinton Trump”. Okazało się, że dwanaście procent wyszukiwań z nazwiskiem „Trump” zawierało także nazwisko „Clinton”, a ponad jedna czwarta z hasłem „Clinton” zawierała też słowo „Trump”.

Gabriel i ja ustaliliśmy, że te pozornie neutralne wyszukiwania mogą nam pomóc wskazać kandydata, którego popierają internauci.

W jaki sposób? Chodzi o kolejność, w jakiej wymieniani są rywale. Nasze badania dowodzą, że ludzie mają skłonność na pierwszym miejscu podawać nazwisko tego kandydata, którego popierają.

W czasie trzech ostatnich wyborów prezydenckich kandydat, który w wyszukiwaniach występował częściej jako pierwszy, dostawał więcej głosów. A co jest jeszcze ciekawsze, porządek, w jakim wyszukiwano pretendentów do Białego Domu, pozwalał przewidzieć wyniki głosowania w poszczególnych stanach.

Okazało się to możliwe dlatego, że kolejność, w której wymieniamy rywali, również wydaje się zawierać pewne informacje, niewynikające z badania opinii publicznej. W 2012 roku, kiedy wyborcy decydowali pomiędzy Obamą i republikaninem Mittem Romneyem, Nate Silver, wirtuoz statystyki oraz dziennikarstwa, trafnie przewidział wyniki głosowania w pięćdziesięciu stanach. My jednak ustaliliśmy, że tam, gdzie w wyszukiwarce na pierwszym miejscu częściej figurował Romney, uzyskiwał on lepszy wynik niż przewidywany przez Silvera, a w stanach, gdzie internauci częściej wpisywali na pierwszym miejscu Obamę, jego wyniki również były lepsze od tych, które prognozował Silver.

Wskazywałoby to, że sondaże mylą się dlatego, że wyborcy okłamują samych siebie albo nie bardzo mają ochotę zdradzać ankieterom swoje rzeczywiste preferencje. Jeśli w roku 2012 twierdzili, że są niezdecydowani, lecz konsekwentnie wpisywali w wyszukiwarkę hasła w rodzaju „sondaże Romney Obama”, „debata Romney Obama” czy „wybory Romney Obama”, to najprawdopodobniej po cichu przez cały czas zamierzali głosować na Romneya.

Czy zatem wyszukiwarka Google niejako przewidziała zwycięstwo Trumpa? No cóż, czeka nas w tej kwestii jeszcze sporo pracy i będzie musiało dołączyć do mnie znacznie więcej badaczy, zanim dowiemy się, jak najlepiej korzystać z materiałów z Google’a, aby przewidywać wyniki głosowania. Analiza danych to nowa gałąź nauki, a my dysponujemy jedynie informacjami z kilku ostatnich elekcji. I z całą pewnością nie twierdzę, że dotarliśmy albo że w ogóle kiedykolwiek dotrzemy do punktu, w którym sondaże opinii publicznej, rozumiane jako narzędzie pomagające przewidzieć wynik wyborów, będzie można po prostu wyrzucić na śmietnik.

Nie zmienia to jednak faktu, że w Internecie dało się zauważyć wiele oznak świadczących o tym, że Trump uzyska lepszy rezultat, niż wskazywały badania opinii publicznej.

Później, już w czasie wyborów powszechnych, wystąpiły kolejne sygnały, że elektorat może sprzyjać Trumpowi. Czarni Amerykanie wciąż podawali w sondażach, że pójdą licznie do urn, żeby wystąpić przeciwko niemu. Ale liczba wyszukiwań na temat wyborów w rejonach gęsto zamieszkanych przez czarnych była niewielka, a w dniu elekcji Hillary Clinton boleśnie odczuła niską frekwencję Afroamerykanów.

Pojawiły się też pewne oznaki, że rzekomo niezdecydowani wyborcy wolą jednak Trumpa. Gabrielowi i mnie udało się bowiem wykazać, że w kluczowych stanach Środkowego Zachodu, w których spodziewano się zwycięstwa Clinton, internauci znacznie częściej wpisywali w wyszukiwarkę hasło „Trump Clinton” niż „Clinton Trump”. Można wręcz powiedzieć, że Trumpowi udało się ostatecznie wygrać właśnie dlatego, że uzyskał w tych stanach wyniki wyraźnie lepsze od prognozowanych.

Upierałbym się jednak, że główną wskazówką dowodzącą możliwości Trumpa – na początek w prawyborach – był ów utajony rasizm, który odkryłem, badając elekcje wygrane przez Obamę. Internet ujawnił ciemnotę i nienawiść znacznej liczby Amerykanów, które przez wiele lat uchodziły uwadze ekspertów. Dane internetowe pokazały, że jesteśmy zupełnie innym społeczeństwem niż to, w którym żyjemy zdaniem akademików i dziennikarzy, opierających swoje opinie na badaniach ankietowych. Pokazały obrzydliwą, przerażającą i powszechną nienawiść, którą nowy kandydat prezydencki uzewnętrzniał niejako w imieniu swoich zwolenników.

Wskaźnik rasistowskich zapytań

Ludzie często kłamią – okłamują siebie oraz innych. W 2008 roku Amerykanie w badaniach opinii publicznej twierdzili, że kwestie rasowe nic ich już nie obchodzą, a osiem lat później wybrali na prezydenta Donalda J. Trumpa, człowieka, który rozpowszechniał na Twitterze fałszywą informację, jakoby to czarni byli odpowiedzialni za większość zabójstw białych Amerykanów, bronił swoich popleczników, którzy poturbowali demonstranta z organizacji Black Lives Matter na jednym z wieców wyborczych, i długo się wahał, czy powinien zrezygnować z poparcia ze strony byłego przywódcy Ku-Klux-Klanu. Utajony rasizm, który zaszkodził Barackowi Obamie, dopomógł Trumpowi.

Na początku prawyborów Nate Silver wygłosił swoją słynną już opinię, że Trump właściwie nie ma szans na zwycięstwo. W miarę upływu czasu okazywało się jednak coraz wyraźniej, że kandydat republikanów cieszy się szerokim poparciem, Silver postanowił więc przyjrzeć się danym analitycznym i zobaczyć, czy uda mu się na tej podstawie zrozumieć, co się dzieje. Jak to możliwe, że Trump osiąga takie dobre wyniki?

Silver zauważył, że regiony, w których Trumpowi szło najlepiej, tworzą dziwnie układającą się mapę, przyszły prezydent radził sobie bowiem świetnie w wielu miejscach na Północnym Wschodzie i uprzemysłowionym Środkowym Zachodzie, nie tylko na Południu, znacznie słabiej wypadł natomiast w stanach zachodnich. Nate zaczął więc szukać odpowiednich zmiennych, żeby wyjaśnić ten układ. Czy decydowało o nim bezrobocie? Religia? Dostęp do broni palnej? Liczba imigrantów? Niechęć do Obamy?

Doszedł do tego samego wniosku, co ja cztery lata wcześniej[9]. Trump mógł liczyć na największe poparcie tam, gdzie w wyszukiwarkach najczęściej pojawiało się słowo „czarnuch”.

W ciągu ostatnich czterech lat analizowałem dane z wyszukiwarki właściwie codziennie, a przez pewien czas nawet jako analityk w Google’u, bo firma wynajęła mnie do pracy, dowiedziawszy się o moich internetowych badaniach nad rasizmem. Nadal analizuję dane jako felietonista i dziennikarz, piszący o Internecie dla „New York Timesa”. I nieustannie odkrywałem coś nowego. Interesowały mnie choroby umysłowe, ludzka seksualność, molestowanie dzieci, aborcja, reklama, religia, zdrowie. To żywotne zagadnienia, a nieistniejące jeszcze dwadzieścia lat temu materiały źródłowe rzucały na nie zaskakująco nowe światło. Ekonomiści oraz inni uczeni, zajmujący się naukami społecznymi, nieustannie poszukują nowych źródeł informacji, powiem więc bez ogródek: jestem dziś przekonany, że wyszukiwania w Google’u to najważniejszy w dziejach ludzkości zbiór danych dotyczących psychiki człowieka.

Ale nie jest to jedyne narzędzie, jakie oferuje nam Internet, abyśmy mogli lepiej zrozumieć świat. Szybko się zorientowałem, że istnieją jeszcze inne cyfrowe kopalnie złota. Zapisałem sobie na twardym dysku całą Wikipedię, przeglądałem profile na Facebooku i „przeleciałem” przez Stormfront. PornHub, jeden z największych portali pornograficznych, udostępnił mi kompletne dane na temat treści wyszukiwanych i oglądanych w sieci przez anonimowych użytkowników z całego świata. Inaczej mówiąc, zanurzyłem się bardzo głęboko w czymś, co nazywamy dzisiaj wielkim zbiorem danych – big data. Poza tym przeprowadziłem dziesiątki rozmów z innymi osobami – uczonymi, dziennikarzami i menedżerami – które również zajmują się tymi nowymi aspektami rzeczywistości, i wiele wyników ich badań przedstawiam w niniejszej książce.

Zapraszamy do zakupu pełnej wersji książki

PRZYPISY

WSTĘP

[1] Katie Fretland, Gallup: Race Not Important to Voters, The Swamp, „Chicago Tribune”, VI 2008.

[2] Alexandre Mas i Enrico Moretti, Racial Bias in the 2008 Presidential Election, „American Economic Review” 2009, nr 2.

[3] 12 XI 2009 roku Lou Dobbs stwierdził w swoim programie telewizyjnym, że żyjemy w społeczeństwie „postkontestacyjnym i postrasowym”. Z kolei 27 I 2010 roku w programie Chrisa Matthewsa usłyszeliśmy oświadczenie autora, że wszystko wskazuje na to, iż Barack Obama „jest prezydentem postrasowym”. Więcej podobnych przykładów podają Michael C. Dawson i Lawrence D. Bobo, One Year Later and the Myth of a Post-Racial Society, „Du Bois Review: Social Science Research on Race” 2009, nr 2.

[4] Szczegóły wszystkich tych wyliczeń można znaleźć na mojej stronie sethsd.com, w zakładce pod nazwą „Sex Data”. Dane z General Social Survey znajdują się pod adresem http://gss.norc.org/.

[5] Dane przekazane autorowi.

[6] Autorska analiza danych z Google Trends. Przejrzałem też dane wszystkich członków Stormfrontu i napisałem o tym w artykule pod tytułem Data of Hate, „New York Times”, 13 VII 2014, SR4. Informacje, o których mowa, można pobrać z sethsd.com spod zakładki „Stormfront”.

[7] Autorska analiza danych z Google Trends. Stany, dla których to twierdzenie jest prawdziwe, to między innymi Kentucky, Luizjana, Arizona i Karolina Północna.

[8] Artykuł ten został ostatecznie opublikowany w „Journal of Public Economics” 2014, nr 118, pod tytułem The Cost od Racial Animus on a Black Candidate: Evidence Using Google Search Data. Można w nim znaleźć więcej szczegółów z tych badań. Dodatkowe informacje podaję też na stronie sethsd.com w zakładce „Racism”.

[9] „Najsilniejszy korelat dla poparcia Trumpa, jaki udało mi się znaleźć, to wyszukiwania w Google’u słowa na «cz». Donosili też o tym inni badacze” (28 II 2016, tweet). Zob. też Nate Cohn, Donald Trump’s Strongest Supporters: A New Kind of Democrat, „New York Times”, 31 XII 2015, A3.

Należy zauważyć, że ponieważ jednostką miary jest procent zapytań w Google’u, nie jest on arbitralnie wyższy w miejscach bardziej zaludnionych czy miejscach, skąd pochodzi najwięcej wyszukiwań. Warto również wskazać, że niektóre różnice pomiędzy tą mapą a mapą poparcia dla Trumpa da się łatwo wyjaśnić. Trump stracił poparcie w Teksasie i Arkansas, ponieważ z tych stanów wywodzą się jego dwaj oponenci, Ted Cruz i Mike Huckabee.

Dane pochodzą z Civis Analytics z grudnia 2015. Faktyczne dane dotyczące głosowania są w tym przypadku mniej użyteczne, ponieważ wpłynął na nie termin prawyborów oraz metoda głosowania. Mapy przedrukowano za zgodą „New York Timesa”.

[1*] Wyszukiwarka Google Trends stała się źródłem znacznej części danych do moich analiz. Mimo to, ponieważ pozwala jedynie porównywać relatywną częstotliwość wyszukiwania i nie podaje liczb absolutnych na temat żadnego pojedynczego hasła, zwykle uzupełniałem te informacje za pomocą Google AdWords, która podaje dokładnie, jak często w sieci pojawiają się konkretne wpisy. W większości wypadków byłem w stanie wyostrzyć ten informacyjny obraz jeszcze bardziej, pomagając sobie opracowanym samodzielnie algorytmem, opartym na Google Trends, który przedstawiam w mojej rozprawie doktorskiej, Essays Using Google Data, i w artykule opublikowanym w „Journal of Public Economics” – The Cost of Racial Animus on a Black Candidate: Evidence Using Google Search Data. Rozprawa, link do artykułu i pełne wyjaśnienie danych oraz kodu, jaki wykorzystywałem w badaniach przedstawionych w niniejszej książce, dostępne są na mojej stronie internetowej: sethsd.com.