l'ipotesi proposta sarebbe percorribile se quello che abbiamo davanti fosse un campionamento. Mi spiego: se misuro 100 persone in Italia e dico che l'altezza media è di 170 cm, ho bisogno di un livello di fiducia (confidence) e di un corrispondente intervallo (la famosa "forbice" di cui si sente parlare alle elezioni), perché non ho misurato tutti gli Italiani, ma solo un campione; per essere certo di fare un'affermazione statisticamente valida, devo quindi dire che l'altezza media è sì di 170, ma ad esempio "più o meno 2 cm", ovvero con un certo intervallo di fiducia.
Non è così nel caso di media di una popolazione intera, come è quella relativa all'insieme delle recensioni di una struttura. In questo caso, ho tutti i voti, non devo fare inferenze, e la media è quella vera. Non ha senso applicare i criteri di valutazione legati alle stime.
Poi, possiamo fare tutte le considerazioni sui voti "farlocchi" (la mia struttura non ha voti inferiori a 8 negli ultimi 2 anni, salvo un 1 a dicembre 2021, e non sapete quanto mi piacerebbe toglierlo), ma da un punto di vista statistico, purtroppo, non possiamo percorrere quella strada.
Saluti
Filippo
NOTE TECNICHE (noiose, saltatele pure):
la distribuzione dei voti, come quella dell'esempio, così come la distribuzione di dati qualsiasi, non ha tipicamente una forma a "campana", nel senso che non è a priori simmetrica, ossia non è una gaussiana; prova ne sia che nel caso dei dati c'è una coda "corta" a destra e una coda "lunga" a sinistra (il fenomeno è detto skewness);
l'uso della normale è compiuto con riferimento alla media, non fa riferimento alla forma della distribuzione dei dati (potrebbe esserlo nel caso delle altezze degli individui, ma è un caso raramente valido), ma a come si distribuisce il valore "vero" della media (questo concetto è ostico, ma è così che vanno le cose);
il livello di fiducia del 95% (o qualsiasi altro) e il conseguente intervallo di fiducia (che è ben altro, per quanto esposto sopra) non vanno quindi presi come indicativi per "tagliare" dati; nessuno nelle scienze sociali (e nessuno statistico) rimuoverebbe mai dei dati perché sono fuori da determinati limiti. I dati sono "sacri" :D
Buonasera,
l'ipotesi proposta sarebbe percorribile se quello che abbiamo davanti fosse un campionamento. Mi spiego: se misuro 100 persone in Italia e dico che l'altezza media è di 170 cm, ho bisogno di un livello di fiducia (confidence) e di un corrispondente intervallo (la famosa "forbice" di cui si sente parlare alle elezioni), perché non ho misurato tutti gli Italiani, ma solo un campione; per essere certo di fare un'affermazione statisticamente valida, devo quindi dire che l'altezza media è sì di 170, ma ad esempio "più o meno 2 cm", ovvero con un certo intervallo di fiducia.
Non è così nel caso di media di una popolazione intera, come è quella relativa all'insieme delle recensioni di una struttura. In questo caso, ho tutti i voti, non devo fare inferenze, e la media è quella vera. Non ha senso applicare i criteri di valutazione legati alle stime.
Poi, possiamo fare tutte le considerazioni sui voti "farlocchi" (la mia struttura non ha voti inferiori a 8 negli ultimi 2 anni, salvo un 1 a dicembre 2021, e non sapete quanto mi piacerebbe toglierlo), ma da un punto di vista statistico, purtroppo, non possiamo percorrere quella strada.
Saluti
Filippo
NOTE TECNICHE (noiose, saltatele pure):