Logistisk regression, även känd som binär logit och binär logistisk regression, är en särskilt användbar teknik för prediktiv modellering. Den används för att förutsäga utfall som omfattar två alternativ, till exempel om du röstade eller inte röstade. Nedan ska jag försöka att bara förklara vad vikterna betyder när man använder dem för tolkningar.
Tolkningen av vikterna i logistisk regression skiljer sig från tolkningen av vikterna i linjär regression, eftersom utfallet i logistisk regression är en sannolikhet mellan 0 och 1. Vikterna påverkar inte längre sannolikheten linjärt. Den viktade summan omvandlas av den logistiska funktionen till en sannolikhet. Därför måste vi omformulera ekvationen för tolkningen så att endast den linjära termen finns på höger sida av formeln.
Vi kallar termen i log()-funktionen för ”odds” (sannolikhet för händelse dividerad med sannolikhet för ingen händelse) och inlindad i logaritmen kallas den för log odds.
Denna formel visar att den logistiska regressionsmodellen är en linjär modell för log odds. Bra! Det låter inte särskilt hjälpsamt! Med lite omblandning av termerna kan du räkna ut hur förutsägelsen förändras när en av egenskaperna xjxj ändras med 1 enhet. För att göra detta kan vi först tillämpa funktionen exp() på båda sidor av ekvationen:
Därefter jämför vi vad som händer när vi ökar ett av funktionsvärdena med 1. Men istället för att titta på skillnaden tittar vi på förhållandet mellan de två förutsägelserna: