4. Demográfiai adatok

Amint a kereskedelmi választói listák kampányok és közvélemény-kutatók által egyre növekszik, a választói fájlok gyártói által kínált adatkínálat bővült. A szokásos politikai felajánlásokon kívül sok eladó ma már számos további demográfiai és életstílus-adatot szolgáltat, amelyeket prediktív modellek alapján hoznak létre, vagy más forrásokból gyűjtenek. Ez a fejezet összehasonlítja a választói fájlokban szereplő demográfiai adatokat a panelisták önjelentéseivel.

A prediktív modellek harmadik féltől származó kereskedelmi forgalmazók és felmérési adatok keverékéből származó adatokat használják fel, hogy megpróbálják megjósolni számos jellemzőt, az ember fajától kezdve az iskolai végzettségig. Néhány modellezett változó esetében azonban az alapul szolgáló információk nagy része csak az államok egy részében érhető el. Például az eladók a választói nyilvántartásokból származó információk és további adatok keverékére támaszkodnak az egyén fajának vagy etnikai hovatartozásának előrejelzéséhez. 16 államban vagy államrészben, nagyrészt délen, az 1965-ös Voting Rights Act előírta, hogy az államok felsorolják a választók versenyét az állami választói névjegyzékben. Azokban az államokban azonban, ahol ez az információ nem áll rendelkezésre, a gyártók megpróbálnak más forrásokból származó információkat felhasználni, például azonosítani a közös vezetékneveket, vagy ha valaki egy adott faj által sűrűn lakott területen él.

Az állami választói nyilvántartások és kereskedelmi adatok mellett néhány szavazói fájlgyártó felmérési adatokat használ fel modelljeinek fejlesztésére és felépítésére. Különösen a partizánszállítók adják a partnerszervezetek felmérési adatait a modellekbe pontosságuk javítása érdekében.

A faj és az etnikum általában jól mérhető az aktákban

Tekintettel a faj és etnikai hovatartozás központi jelentőségére az amerikai politikában, a választói iratgyártók megpróbálják azonosítani az aktában szereplő egyének faját. Az árusok az országbeli választói nyilvántartásokban rögzített versenyt használhatják olyan helyeken, ahol azt az államoknak meg kell gyűjteniük. Más helyeken a verseny modellezhető olyan információk felhasználásával, mint a vezetéknév vagy a földrajzi koncentráció.

A panelisták modellezett faját és etnikai hovatartozását összehasonlították azzal, ahogy a panelisták leírták, amikor felvették őket a testületbe (vagy a későbbi profilfelmérések során). Összességében a legtöbb eladó képes pontosan azonosítani a fehér válaszadók faját, a helyes azonosítás aránya a 3-as fájl 81% -ától a 2-es fájlig 97% között változik. Amikor azonban az önállóan bejelentett fekete és A spanyol panelisták, egyes gyártók pontosabbak, mint mások.

Azok a paneliek, akik saját maguk szerint fekete színűek egy felmérés során, a 2. és az 5. fájlban nagyjából háromnegyedet (az 5. fájlban 74% -ot, a 2. fájlban pedig 76% -ot) a megfelelő modellek feketének minősítettek. Az 1. fájlban szereplő modell azonban sokkal kevesebb fekete panelt azonosít pontosan (56%).



A saját bejelentésű spanyol paneliek osztályozásakor kisebb a különbség a fájlok között, a 3. fájlban helyesen besorolt ​​spanyolok 64% -ától az 1. és 5. fájl 75% -áig terjed.

Összességében a faj szerinti helyes besorolás aránya a 3. fájl 74% -ától a 2. fájl 85% -áig terjed.

Más demográfiai változók pontossága nagymértékben eltér

Az állami választói névjegyzék által nyújtott információk mellett sok választói fájlgyártó más nyilvános és kereskedelmi adatforrásokból származó információkat is tartalmaz. Ezek az adatok számos forrásból származhatnak, például folyóirat-előfizetésekből vagy hitelirodákból, azzal a céllal, hogy további információkat nyújtsanak az amerikaiakról, azon túl, amely közvetlenül elérhető az állami választói listákon.

A kereskedelmi adatok jelenléte a választói aktákban elterjedt; a rendelkezésre álló specifikus változók azonban gyártónként eltérnek. Számos eladó rendelkezik hitelintézetek vagy hitelkártya-társaságok pénzügyi adataival, beleértve például a lakásárat és a jelzálog összegét. Ezen kívül néhány eladó olyan információkat közöl, mint a foglalkozás, a jövedelem és a háztartásban élő felnőttek vagy gyermekek száma. A vadászati ​​vagy halászati ​​engedélyek jelenléte az egyik legelterjedtebb kereskedelmi változó.

Ezek a kereskedelmi adatok is többféleképpen mutatják be önmagukat. Ezen változók közül némelyik zászlóként önálló, például vadászati ​​engedély megléte, míg mások bizonyos eredmények vagy demográfiai adatok előrejelzésére szolgáló modellekben szerepelnek. Például számos eladó olyan modelleket kínál, amelyek személyes érdekeket szolgálnak, például fegyvertulajdonosok vagy csónakázók rajongói. Ez olyan információ, amelyet olyan források alapján modelleznek, mint például a magazin-előfizetések.

A három leggyakrabban elérhető kereskedelmi változó - az oktatás, a jövedelem és a vallási hovatartozás - elemzése azt mutatja, hogy egyes modellek pontosabbak, mint mások. Összességében a legtöbb eladónak nagyobb pontossága volt az oktatás előrejelzésében, mint a jövedelemnek. Ami a vallási hovatartozást illeti, az árusok többnyire helyesen jósolják meg az Egyesült Államokban a nagy vallásokat, például a protestantizmust, de kevesebb sikerrel járnak alacsonyabb előfordulási arányú vallásokkal, például a buddhizmussal.

A modellek egyik gyakori problémája a hiányzó adatok túlsúlya, az egyezések nagy részeinek besorolása némely változóban osztályozatlan. Például az iskolai végzettség előrejelzésére készített modellek értékelésekor a 4. fájlban szereplő mérkőzések több mint fele (57%) és az 5. fájlba tartozó mérkőzések egynegyede (25%) besorolatlan.

Ha azonban kizárják azokat, akiknek hiányzik az oktatásra vonatkozó becslés, sok modellnek meglehetősen magas aránya van abban, hogy helyesen osztályozza a panelistákat saját bevallása szerint végzettségük szerint. A teljesen hat-tízből vagy annál több főiskolát végzett hallgatót helyesen sorolják be az 1., 4. és 5. fájlban a főiskolát végzettek közé.12.

A demográfiai változók közül a legnehezebben értékelhető a háztartás jövedelme. A jövedelem felmérésének pontosságát számos tényező befolyásolhatja, többek között a válaszadó ismeretének hiánya (a válaszadókat általában arra kérik, hogy idézzék fel a háztartások előző évi összes jövedelmét). Ezenkívül a jövedelem kényes téma, és a felmérés válaszadói nagyobb valószínűséggel csökkennek jövedelmük biztosítása érdekében, mint más demográfiai változókkal. Talán nem meglepő, hogy az ügyiratokban szereplő modellezett jövedelem - még akkor is, ha rendelkezésre áll - nem egyezik meg nagyon szorosan a jövedelemről szóló felmérési jelentésekkel. Összességében a becsült jövedelmet kijavító négy fájl csak a válaszadók 30–46% -át sorolta a négy kategória egyikébe.

A fájloknak gondot okozott mind a magas, mind az alacsony jövedelmű válaszadók osztályozása. Tízből négy vagy annál több, aki 100 000 dolláros vagy annál nagyobb jövedelemmel jelentkezik, helyesen besorolja a 4. fájl (helyesen besorolt ​​41%) és az 5. fájl (45%). És a saját bevallás szerint a legalacsonyabb jövedelmű (évente 30 000 dollár alatti) felnőttek egyharmadát helyesen osztályozza mind a négy fájl, amely a jövedelmet jelentette.

A vallási hovatartozás előrejelzésére használt modellek jelentősen eltérnek a helyesen besorolt ​​tagok arányától. Az biztos, hogy minden modell a legjobban képes pontosan megjósolni a protestánsokat, az Egyesült Államok legnagyobb vallási csoportját. Az 1., 4. és 5. dossziéban a saját maguk által azonosított protestánsok mintegy háromnegyedét (72, 77 és 75%) helyesen osztályozták. A 2. fájl helyesen osztályozza a protestánsok nagyjából hat tízét (62%). (Alapként az amerikaiak valamivel kevesebb, mint fele vallja magát protestánsnak.)

Az Egyesült Államok kisebb vallási csoportjain belül egyesek nagyobb valószínűséggel lesznek helyesen modellezve, mint mások. Például a fájlok többsége jobban elvégzi a hinduk helyes osztályozását, mint a buddhisták osztályozását, bár mindkét csoport nagyjából ugyanolyan ritka az Egyesült Államokban.

Az iratok nem kísérlik meg kategorizálni azokat az embereket, akik nem tartoznak egy valláshoz, de a maradék „osztályozatlan” kategóriájuk bizonyítékot szolgáltat arra, hogy egyes személyeket vallási szempontból nem azonosítanak. Összességében az osztályozatlan csoport a fájlok között 5% és 21% között változik. De ezek a besorolatlan egyének nem feltétlenül vallási szempontból nem tartoznak - az 1. fájlba besorolatlanok csupán 28% -a olyan ember, aki a testületben ateistának, agnosztikusnak vagy „semmi különösnek” nevezi magát, és ez a 2. fájl között 36% -ra emelkedik. Tekintettel arra, hogy a felnőttek közel egynegyede vallásilag nem áll kapcsolatban, a „kategorizálatlanok” maradék kategóriája nem tesz különösebben jó munkát ezek megtalálásában.

A helyesen osztályozott összes százalék, beleértve azokat is, akik hiányoznak vagy besorolatlanok egy adott változóhoz, összehasonlítást nyújt a különböző modellezett demográfiai adatok között. Az akták közül sok képes volt helyesen besorolni a panelizálók nagy részét saját maguk által vallott vallásukba. Ennek ellenére számos fájl kiemelkedett, különösen a legalacsonyabb egyezési arányú fájl (5. fájl), amiért megfelelően osztályozni tudták a válaszadók képzettségét és jövedelmét.