statistica-header

Statistica

 

STATISTICA: è la tecnica che ha come scopo la conoscenza quantitativa dei fenomeni collettivi e si occupa dei criteri con cui si processano e si analizzano i dati.

 

UNITÀ STATISTICA: è l’oggetto dell’osservazione, l’insieme di tutte le unità statistiche che sono uguali in alcuni caratteri costituisce una popolazione.

 

OBBIETTIVO: indica la natura delle informazioni da raccogliere e gli strumenti con i quali esaminare i dati.

 

LE 5 FASI DI UNA ANALISI STATISTICA sono:

1. Definizione degli obiettivi della ricerca;

2. Rilevazione dei dati;

3. Elaborazione metodologica;

4. Presentazione ed interpretazione dei risultati;

5. Utilizzazione dei risultati della ricerca.

Statistica-1

 

LA PRIMA FASE DELL’INDAGINE STATISTICA: viene definita come schematizzazione e consiste nella definizione del fenomeno e della collettività in cui esso si realizza così da definire gli obbiettivi.

 

LA SECONDA FASE: viene definito in che modo rilevare gli obiettivi e a chi viene indirizzata l’analisi, se all’intera collettività o se soltanto ad una parte detta campione. Nel primo caso di parlerà di una rilevazione completa, nel secondo caso di una rivelazione parziale.

 

LA TERZA FASE: vengono definiti gli elementi di sintesi dei dati raccolti distinguendo tra i caratteri quantitativi (detti variabili) e caratteri qualitativi (detti attributi o mutabili) così da definire il metodo di elaborazione.

 

LA QUARTA FASE: viene definita l’evidenziazione di alcuni aspetti della ricerca che devono essere ignorati o esaltati.

 

LA QUINTA FASE: viene definita l’evidenziazione dei limiti entro i quali il risultato dell’analisi.

 

FUNZIONE DI RIPARTIZIONE EMPIRICA indica la funzione che associa ad ogni valore reale x0 la frazione delle unità che sono inferiori o uguali a x0^15.

 

LA FREQUENZA indica il numero delle volte che un certo valore si presenta.

 

LE MEDIE indica quegli indici che sono utilizzati per sintetizzare in un unico valore un intera distribuzione.

 

LE DUE TIPOLOGIE DI MEDIE sono:

 

MEDIA ANALITICHE sono calcolate mediante operazioni algebriche sui valori del carattere che deve essere di tipo quantitativo.

 

MEDIE LASCHE sono calcolate utilizzando mediante alcuni valori della distribuzione di frequenza.

 

statistica-2

 

LE 3 TIPOLOGIE DI MEDIE ANALITICHE sono:

 

MEDIA ARITMETICA: viene definita dal rapporto tra la somma dei valori al numero dei valori. Essa può essere inoltre definita come quel valore che se sostituito ai valori osservati non modifica il risultato del calcolo della media aritmetica, risulta quindi essere un valore inviariante rispetto alla operazione di somma.

 

LE 4 PROPRIETÀ DELLA MEDIA ARITMETICA sono:

 

PRIMA PROPRIETÀ: La somma degli scarti della media è nulla.

 

SECONDA PROPRIETÀ: La somma dei quadrati degli scarti detta devianza è minore della somma dei quadrati degli scarti di qualsiasi altro numero.

 

TERZA PROPRIETÀ: La media aritmetica è associativa ossia la media aritmetica della collettività o la somma delle media aritmetiche dei sottogruppi in cui una collettività viene suddivisa è lo stesso numero.

 

QUARTA PROPRIETÀ: La media aritmetica è un operatore lineare ossia se ogni valore osservato viene contestualmente moltiplicato per una costante e sommato per un’altra costante anche la media aritmetica risulterà moltiplicata.

 

FUNZIONE DI INVARIANZA: indica un operazione la cui applicazione agli elementi genera un unico valore che sostituito a quelli rilevati non ne cambia il risultato.

 

MEDIA GEOMETRICA: viene definita come la radice n-esima del prodotto di n valori e viene spesso utilizzata per calcolare il rendimento medio annuo di un investimento.

 

statistica-3

 

3 CARATTERISTICHE DELLA MEDIA GEOMETRICA:

 

PRIMA CARATTERISTICA: ha come funziona di invarianza il prodotto dei valori e la non somma degli stessi come per la media aritmetica.

 

SECONDA CARATTERISTICA: non è superiore alla media aritmetica.

 

TERZA CARATTERISTICA: difficoltà computazionale relativa al calcolo della media aritmetica.

 

CRITERIO DI INTERNALITÀ DI CAUCHY: influenza la media geometrica secondo il quale una media deve sintetizza e in un unico valore un intera distribuzione e si ritiene che tale valore sia un numero interno alla distribuzione data che comprende anche gli estremi.

 

MEDIA ARMONICA: viene definita come l’inverso della media aritmetica degli inversi la cui funzione di invarianza è la somma dei reciproci dei valori.

 

3 TIPOLOGIE DI MEDIE LASCHE:

 

MODA: indica il valore che si manifesta il maggior numero di volte in una popolazione analizzata.

 

MEDIANA: indica il valore centrale in un insieme di dati ordinati dal valore più piccolo al più grande.

 

QUANTILI: indica la partizione in quantili di una popolazione.

 

INDICI DI VARIABILITÀ: sono degli indici che permettono la misurazione del grado di dispersione delle modalità rispetto alla media.

 

4 MODALITÀ DI CALCOLO DELLA VARIABILITÀ DEI VALORI DI UNA DISTRIBUZIONE:

 

RANGE O CAMPO DI VARIAZIONE INTERQUARTILE indica la differenza fra il valore massimo e il valore minimo.

 

VARIANZA O SCARTO QUADRATICO MEDIO indica un operatore non lineare che è pari alla media aritmetica dei quadrati meno il quadrato della media aritmetica.

 

COEFFICIENTE DI VARIAZIONE indica un indice relativo indipendente dall’unità di misura che risulta quindi essere un numero puro.

statistica-4

 

RAPPORTO DI CONCENTRAZIONE DI GINI indica una misurazione che permette di rappresentare in un unico numero il livello di concentrazione di un carattere trasferibile fra le varie unità del carattere osservato.

 

UN CARATTERE È EQUIDISTRIBUITO quando ogni unità possiede lo stesso ammontare posseduto dalle altre unità.

 

LA CONCENTRAZIONE MINIMA si ha in caso di equidistribuzione quando per la quale ogni unità possiede la medesima quota dell’ammontare complessivo del carattere.

 

LA CONCENTRAZIONE MASSIMA si ha in caso di equidistribuzione quando l’ammontare complessivo del carattere è posseduto da una sola unità e le restanti unità posseggono zero.

 

2 INDICATORI DI FORMA: permettono di confrontare le distribuzioni di frequenza di più variabili analizzate.

 

L’INDICE DI ASSIMMETRIA: permette di confrontare diverse distribuzioni tra di loro ad esempio attraverso la differenza tra la Media e la Mediana. Nel caso in cui la Media è maggiore della Mediana l’assimmetria è positiva, nel caso in cui la Media è minore della Mediana l’assimetria è negativa mentre se la Media è uguale alla Mediana la distribuzione è assimetrica.

 

L’INDICE DI ASSIMETRIA DI PEARSON: indica invece la differenza tra la Media e la Moda.

 

L’INDICE DI ASSIMETRIA DI FISHER: indica uno degli indici maggiormente utilizzato per il calcolo dell’assimetria.

 

L’INDICE DI CURTOSI: permette di misurarare la curtosi di una distribuzione, cioè il rapporto tra la parte centrale e le parti laterali di una distribuzione.

 

L’INDICE DI CURTOSI DI PEARSON: da il nome a distribuzione leptocurtica ad una distribuzione che presenta un valore dell’indice maggiore di 3 e distribuzione platicurtica ad una distribuzione che presente un valore dell’indice minore di 3.

 

L’INDICE DI CURTOSI DI FISHER: indica uno degli indici maggiormente utilizzato per il calcolo della curtosi.

 

statistica-5

 

INDICI CHE MISURANO LE RELAZIONI FRA DUE VARIABILI:

 

LA FREQUENZA: ci permette di calcolare quale è la relazione esistente fra due variabili analizzate stabilendo se esiste una connessione o indipendenza.

 

LA CONNESSIONE indica un legame generale fra le due variabili analizzate.

 

L’INDICE DI CONNESSION CHI-QUADRATO: indica un indice di connessione che può essere calcolato svolgendo alcuni passaggi algebrici anche senza conoscere le contingenze.

 

L’INDIPENDENZA indica il condizionamento di una distribuzione a seconda delle due variabili analizzate.

 

LE CONTINGENZE indicano le differenze fra le frequenze assolute e le frequenze teoriche, se tali differenze sono nulle le variabili sono indipendenti.

 

L’INDICE DI CONTINGENZA QUADRATICA: indica un indice di contingenza che ha come valore minimo zero.

 

L’INDICE NORMALIZZATO: indica un indice che ha un campo di variazione predefinito cioè rapporta l’indice di contingenza quadratica al suo massimo.

 

LA MEDIA ARITMETICA DEI PRODOTTI DELLE VARIABILI STANDARDIZZATE: indica quale sia la relazione lineare esistente tra due variabili.

 

IL COEFFICIENTE DI CORRELAZIONE LINEARE: permette di quantificare la relazione lineare esistente tra le due variabili ma non fornisce l’equazione delle retta di regressione.

 

LA RETTA DI REGRESSIONE indica una retta che quantifica precisamente la relazione lineare esistente fra le due variabili.

 

IL METODO DEI MINIMI QUADRATI: ci permette di determinare i parametri della retta di regressione che rappresentano al meglio la relazione tra le due variabili analizzate.

 

I NUMERI INDICE SEMPLICI: indicano dei rapporti statistici costruiti ponendo al denominatore una intensità di fenomeno della medesima tipologia di quella posta al numeratore. Il numero indice svolge quindi il ruolo di mezzo di confronto nel tempo e nello spazio dell’intensità di un fenomeno.

 

statistica-6

 

IL RAPPORTO STATISTICO: indica in termini frazionari un rapporto fra intensità di un fenomeno singolo moltiplicato per 100.

 

2 TIPOLOGIE DI NUMERI INDICE:

 

NUMERI INDICE A BASE FISSA: sono caratterizzati da una base di confronto che non cambia da un periodo di riferimento ad un periodo successivo.

 

NUMERI INDICE A BASE MOBILE: sono caratterizzati da una base di confronto che segue come termine quello del numeratore.

 

4 PROPRIETÀ DEI NUMERI INDICE:

 

IDENTITÀ: indica che un numero diviso se stesso è uguale a 1.

 

REVERSIBILITÀ DELLE BASI: indica che si può passare da un numero indice che rapporta un quantificazione successiva ad una base-quantificazione precedente ad un numero indice che inverte il numeratore con il denominatore invertendo il numero indice medesimo.

 

REVERSIBILITÀ DEI FATTORI: indica che il valore di una merce è pari alla moltiplicazione del prezzo per la quantità.

 

TRANSITIVITÀ DELLE BASI: indica la possibilità di passare da una base ad un altra tramite una divisione fra due numeri indice.

 

I NUMERI INDICE COMPLESSI: indicano quei numeri indice che confrontano n grandezze al contrario dei numeri indice semplici che ne confrontano soltanto una.

 

I 2 METODI PER ELABORARE I NUMERI INDICE COMPLESSI:

 

RAPPORTO FRA AGGREGATI DI VALORE: in questo metodo si esegue la moltiplicazione dei prezzi per le quantità scambiate e successivamente si procede al rapporto fra i valori che sono stati creati così da ottenere un risultato.

 

statistica-7

 

METODO DEGLI INDICI ELEMENTARI: in questo metodo una volta individuati i vari prezzi e le varie quantità scambiate si creano dei rapporti fra i prezzi e le merci e dei rapporti fra le quantità delle merci.

 

7 PROPRIETÀ DEI NUMERI INDICE COMPLESSI:

 

IDENTITÀ

 

REVERSIBILITÀ DELLE BASI

 

REVERSIBILITÀ DEI FATTORI

 

TRANSITIVITÀ

 

COMMENSURABILITÀ: indica che un numero indice che la possiede non varia al variare dell’ordine di geandenza dell’unità di misura utilizzata.

 

DETERMINATEZZA: indica che l’indice non si annulla e non tende all’infinito se uno dei termini elementari che lo compongono si annulla oppure tende all’infinito.

 

PROPORZIONALITÀ: indica che l’indice che la possiede varia della variazione di un suo elemento.

 

IL NUMERO INDICE DEI PREZZI DI LASPEYRES: in questo indice le quantità usate come peso saranno quelle dell’anno temporalmente posteriore indicato al numeratore e i pesi saranno costituiti dai prezzi dell’anno base quindi tale indice risulta essere il rapporto tra le medie aritmetiche dei prezzi dei beni facenti parte del paniere nei due periodi confrontati ponderati ovviamente con le rispettive quantità.

 

IL NUMERO INDICE DEI PREZZI DI PAASCHE: in questo indice la sommatoria delle moltiplicazioni fra prezzi e quantità non è posta al denominatore e infatti le singole moltiplicazioni contengono i prezzi dell’anno base moltiplicati per le quantità dell’anno finale del confronto quindi tale indice risulta essere pari al rapporto tra le medie aritmetiche dei prezzi nei due periodi di confronto, ponderati con le quantità del periodo finale.

 

IL NUMERO INDICE DELLE QUANTITÀ DI PAASCHE: in questo indice le quantità sono poste a denominatore e la relativa moltiplicazione per i prezzi dell’anno finale al denominatore la la moltiplicazione al numeratore degli stessi elementi forniscono l’indice delle variazioni delle quantità del paniere di riferimento per i periodi considerati.

 

statistica-8

 

2 MOTIVI PRINCIPALI PER CUI SI UTILIZZANO GLI INDICI A CATENA O CONCATENATI sono nella possibilità di un agevole confronto intertemporale permesso dagli indici a catena e nel risultato di una considerazione importante per le applicazioni economiche.

 

2 PROPRIETÀ NON RISPETTATE DAGLI INDICI A CATENA sono la transitività o circolarità delle basi e la proprietà della additività cioè non è possibile redigere dei conti che evidenzino valori espressi tramite la moltiplicazione dei prezzi dell’anno base con le quantità finali uguali ai valori derivati dalla moltiplicazione dei prezzi dell’anno base con l’indice a base fissa.

 

I TRE CONCETTI FONDAMENTALI DELLA TEORIA DELLA PROBABILITÀ: sono la Prova, l’Evento e la Probabilità.

 

LA PROVA indica ogni esperimento soggetto a incertezza.

 

L’EVENTO indica uno dei possibili risultati della prova.

 

LA PROBABILITÀ indica un numero associato al verificarsi di un evento.

 

LE TRE DEFINIZIONI O CONCENZIONI DELLA PROBABILITÀ sono la definizione Classica, Frequentista o Soggettivista.

 

LA DEFINIZIONE CLASSICA DI PROBABILITÀ indica che dato un esperimento ben specificato ed un evento E tra quelli possibili per quell’esperimento, se m è il numero dei possibili risultati che danno luogo all’evento E mentre n è il numero di tutti i possibili risultati dell’esperimento, allora la probabilità dell’evento E è il rapporto m/n, purché tutti gli n risultati siano ugualmente possibili. Quindi Pr(E)=m/n.

 

LA DEFINIZIONE FREQUENTISTA DI PROBABILITÀ indica che dato un esperimento ben specificato e perfettamente ripetibile, sia E un evento tra quelli possibili, ed indichiamo con frn(E) il numero di volte che E si è verificato in una serie di n esperimenti ripetuti tutti nelle medesime condizioni (cioè la frequenza assoluta di E). Allora, la probabilità è il limite cui tende la frequenza relativa dell’evento al crescere del numero degli esperimenti. Quindi: Pr(E)= lim→∞ [fr(E)/n].

 

statistica-9

 

LA DEFINIZIONE SOGGETTIVISTICA DI PROBABILITÀ indica che dato un esperimento ben specificato, sia E un evento fra quelli possibili. Allora, la probabilità dell’evento E è la somma che un individuo coerente è disposto a scommettere in un gioco nel quale al verificarsi di E egli riceve dal banco un importo unitario.

 

I 3 POSTULATI SODDISFATTI DALLA TEORIA DELLA PROBABILITÀ sono il primo postulato Pr( Ei)≥ 0 ∀ Ei ⊂ Ω che afferma che la probabilità di ciascun evento è non negativa e questo è vero per ogni i-esimo evento E appartenente allo spazio degli eventi Omega. Il secondo postulato : Pr(Ω)=1 afferma che la probabilità dello spazio campione cioè dell’insieme di tutti i possibili eventi, cioè i risultati di una prova, la cui probabilità di verificarsi coincide con la probabilità dell’evento certo è pari a 1. Il terzo postulato Pr(Ei)∪Pr(Ej)=Pr(Ei)+Pr(Ej) afferma che se due eventi sono incompatibili, cioè se si verifica l’uno non si verifica l’altro, la probabilità che si verifichi l’uno o l’altro è data dalla somma delle probabilità che si verifichi ciascuno dei due.

 

IL TEOREMA DELLE PROBABILITÀ TOTALI permette di calcolare la probabilità dell’unione di due eventi compatibili o incompatibili.

 

IL TEOREMA DELLE PROBABILITÀ COMPOSTE permette di calcolare la probabilità dell’intersezione di due eventi che si condizionino o meno reciprocamente.

 

IL TEOREMA DI BAYES che permette di determinare che il verificarsi di un evento con una determinata probabilità modifica la probabilità precedentemente attribuita ad un altro evento ritenuto una possibile sua causa nello stesso modo in cui la quantificazione della probabilità di questo secondo evento, che consiste nella causa possibile, modifica l’attribuzione di probabilità di verificarsi dell’evento che si è verificato.

 

LA PERMUTAZIONE indica uno dei possibili ordinamenti in cui si possono ordinare degli elementi n che compongono un insieme.

 

LE DISPOSIZIONI indicano il numero di permutazioni degli elementi n che compongono un insieme.

 

LE COMBINAZIONI indicano il numero di permutazioni degli elementi n che compongono un insieme.

 

statistica-10

 

VARIABILE CASUALE è una regola che associa ad ogni evento un numero reale con il fine di determinare una corrispondenza tra
eventi dello spazio campionario e i numeri reali, essa può anche essere indicata come un indicatore numerico sintetico di un risultato casuale.

 

FUNZIONE DI PROBABILITÀ DI UNA VARIABILE CASUALE è quella funzione che associa ad ognuno dei possibili valori la corrispondente probabilità.

 

LA FUNZIONE DI RIPARTIZIONE DI UNA VARIABILE CASUALE è la funzione che fa corrispondere ai valori le probabilità cumulate.

 

IL VALORE ATTESTO DI UNA VARIABILE CASUALE DISCRETA è pari alla somma delle probabilità dei singoli valori ossia alla somma di tutti i valori ciascuno moltiplicato per la propria probabilità di verificarsi.

 

I 3 MODELLI DI RIFERIMENTO PER VARIABILI CASUALI DISCRETE:

 

DISTRIBUZIONE DI BERNOULLI permette di verificare se un certo evento si verifica oppure no.

 

DISTRIBUZIONE BINOMIALE permette di verificare se un certo evento si verifica oppure no quando si ha a che fare con n sottoprove indipendenti.

 

DISTRIBUZIONE DI POISSON permette di verificare se un certo evento si verifica oppure no quando si cerca il numero x di eventi che si verificano in un definito intervallo temporale

 

statistica-11

 

IL TEOREMA DEL LIMITE CENTRALE indica che partendo da qualsiasi distribuzione e con assunzioni minime se un dato fenomeno X può essere espresso come somma di n fenomeni casuali indipendenti ma con stessa distribuzione allora al crescere di n questo fenomeno tende a distribuirsi come una curva normale con media nX e deviazione standard nO. Tale teorema indica quindi che tutte le volte che un fenomeno reale può essere interpretato come la somma, oppure la media, di un gran numero di cause indipendenti, nessuna delle quali ha la prevalenza sulle altre e ragionevole attendersi che la distribuzione di probabilità di quel fenomeno sia approssimabile mediante la distribuzione della variabile casuale normale.

 

I 3 MODELLI DI RIFERIMENTO PER VARIABILI CASUALI CONTINUE:

 

IL MODELLO VARIABILE CASUALE NORMALE è il modello teorico più utilizzato per descrivere fenomeno reali.

 

IL MODELLO VARIABILE CASUALE CHI-QUADRATO indica una distribuzione teorica assimmetrica e definita per valori non negativi, essa è inoltre definita come n somma di variabili casuali normali standardizzate indipendenti al quadrato e che all’aumentare di n diventa sempre più simmetrica e tende a distribuirsi come il modello variabile casuale normale.

 

IL MODELLO VARIABILE CASUALE T di STUDENT è definito come quoziente di due variabili casuali indipendenti. Al numerato ci sarà una variabile casuale normale standardizzata e al denominatore la radice quadrata di una variabile casuale chi-quadrato divisa per n.

 

IL MODELLO VARIABILE CASUALE F DI FISHER è espressa dal quoziente fra due variabili casuali chi-quadrato reciprocamente indipendenti, ciascuna divisa per la propria numerosità di composizione. Tale variabile casuale è utilizzata per la verifica dell’ipotesi di uguaglianza tra le varianze di due popolazioni indipendenti.

 

I METODI DI COSTRUZIONE DEI CAMPIONI:

 

CAMPIONAMENTO IN BLOCCO O SENZA RIPETIZIONE.

 

CAMPIONAMENTO CON RIPETIZIONE O BERNOULLIANO.

 

CAMPIONAMENTO A GRAPPOLI consiste nel selezionare i grappoli di determinate unità statistiche e procedere successivamente ad analizzare le caratteristiche di ciascun contenuto del grappolo.
statistica-12
UNO STIMATORE indica una variabile casuale utilizzata per stimare una determinata caratteristica della popolazione.

 

LA STIMA indica il valore assunto dallo stimatore in corrispondenza di un determinato campione.

 

LA CONSISTENZA ASINTOTICA indica che uno stimatore è consistente se la sua precisione aumenta all’aumentare della numerosità campionaria.

 

Scarica la guida STUDIA CON PIACERE in formato PDF per imparare le tecniche per studiare meno e meglio.