01. Osservazione e probabilità

1. Osservazione e probabilità

Statistica descrittiva

statistica descrittiva

La statistica è una scienza, una disciplina, che ha come scopo lo studio quantitativo e qualitativo di fenomeni (non deterministici).
La statistica descrittiva ha lo scopo di fornire una fotografia di una situazione o di un particolare fenomeno osservato.

Una statistica è funzione dei dati campionari

I dati campionari sono costituiti dalle misurazioni (osservazioni) fatte sul campione osservato. Il campione è fatto da unità statistiche selezionate da una popolazione. La popolazione è solitamente l'oggetto di studio finale, del quale si vogliono studiare alcuni fenomeni.

Drawing 2023-03-02 19.59.49 Statistica descrittiva schema generale.excalidraw.png|700

Solitamente ci si basa su un campione limitato di dati (n piccolo)

esempio

Se volessi calcolare l'altezza media degli italiani dovrei misurare più di 60 milioni di persone. Mi posso però limitare a un gruppo ristretto e usare la [[#Statistica Inferenziale]] per estendere il dato all'intera popolazione.

Misurazioni

Una volta osservato il campione avremo una serie di misurazioni che indichiamo come:

x=(x1,x2,,xn)

un vettore di Rn di tutte le misurazioni effettuate.

Probabilità

Variabili deterministiche o aleatorie

Variabili deterministiche

variabili deterministiche

Sono variabili x di cui posso conoscere con certezza il valore.

Ad esempio, se lascio cadere un oggetto sul pavimento, in condizioni ideali posso calcolare esattamente il tempo che impiegherà a toccare terra.

Le variabili deterministiche danno vita a modelli deterministici: f(x,y).

Variabili aleatorie

variabili aleatorie

Sono variabili X di cui NON posso conoscere con certezza il valore.

Ad esempio, se lascio cadere un oggetto sul pavimento, ma è presente un forte vento, non posso conoscere con esattezza il punto in cui cadrà. Posso dire che sicuramente non cadrà a metri di distanza o che cadrà in un punto specifico con una certa probabilità.

Le variabili aleatorie danno vita a modelli aleatori: g(X,Y).

Possiamo studiare un fenomeno come una variabile aleatoria X di cui non conosciamo il valore fino a che X non si realizza.
Chiamiamo x la realizzazione della variabile aleatoria X. xΩ dove Ω è l'insieme di tutte le possibili xi realizzazioni di X.

dado regolare

Se abbiamo un dado regolare, chiameremo la faccia uscita a seguito di un lancio X. La faccia può assumere i valori xΩ, dove

Ω={1,2,3,4,5,6}

Ci interesserà studiare le seguenti probabilità:

P(X=x),P(Xx),P(X<x),P(X>x),P(Xx)

Eventi certi e impossibili

Evento certo

evento certo

Un evento X che ha probabilità di realizzarsi pari a 1:
P(X)=1

Evento impossibile

evento impossibile

Un evento X che ha probabilità di realizzarsi pari a 0:
P(X)=0

Statistica Inferenziale

Date le osservazioni su un numero n piccolo di misurazioni, mi chiedo come ottenere conclusioni per n.
Cioè, voglio ottenere delle informazioni sulla popolazione totale, a partire da un campione della popolazione-

Ottengo così conclusioni sull'Universo.

Drawing 2023-03-03 08.40.36 Statistica descrittiva - probabilità - statistica inferenziale.excalidraw.png|700

esempio - componente elettronico

Immaginiamo di voler trovare l'affidabilità di un componente elettronico. Per farlo potrei:

  • Selezionare n componenti (a caso)
  • Verificare quanti k di questi funzionano (k[o,n])
  • Ottenere kn componenti funzionanti

kn è la percentuale di componenti funzionanti. È quindi la probabilità che un qualsiasi componente funzioni. È l'affidabilità.

È chiaro che per n il rapporto kn si deve mantenere costante. Questo è vero se sono rispettate alcune condizioni: Inferenza Statistica.

È importante ricordare che per STIMARE una misura prendendo un campione limitato, devo assicurarmi che gli elementi del campione siano:

Il concetto di probabilità

Impostazione classica

Ω finito|Ω|<,P(E)=|E||Ω|

Impostazione frequentista

P(E)=limnP(En)n prove (ripetute) indipendenti
n deve essere grande a sufficienza, dipende dalla velocità di convergenza.

esempio

Data una moneta. Non so se è regolare. La lancio e registro il risultato. Ripeto n volte (sono prove indipendenti). Se la moneta non è truccata avrò Testa nella metà dei lanci e Croce nell'altra.

Impostazione soggettiva

Si basa su una definizione soggettiva di probabilità: la probabilità di un evento è il prezzo che siamo disposti a pagare in una scommessa per ricevere 1 al verificarsi dell’evento o 0 altrimenti.

Impostazione Bayesana

Fa riferimento alla probabilità condizionata

La probabilità di un evento dipende da una legge a posteriori ottenuta scegliendo (anche soggettivamente) una legge a priori. È forte quindi il condizionamento a ciò che conosciamo sul fenomeno che ci interessa. Si può definire in questo ambito uno schema che prevede aggiornamenti successivi della priori con la posteriori fino ad uno step definito ottimo in qualche senso.

Impostazione Assiomatica

Basato sugli assiomi di Kolmogorov