import pandas as pd
import numpy as np
from scipy import stats
import seaborn as sns
import matplotlib.pyplot as plt
from decimal import Decimal

import warnings  
warnings.filterwarnings('ignore')


df_salarios = pd.read_csv('dados/dados_tratados.csv').drop('Unnamed: 0', axis=1)
df_b3 = pd.read_csv('dados/b3_stocks_1994_2020.csv')
df_b3['datetime'] = pd.to_datetime(df_b3['datetime'])


print(df_salarios['salario_em_dolares'].min(), df_salarios['salario_em_dolares'].max())

5132 450000


x = list(range(5132, 450000, 1))
probabilidade = list(np.linspace(1/444868, 1/444868, 444868))
probabilidade2 = list(np.linspace(0, 1/444868, 100))
final = list(np.linspace(450000, 450000, 100))
a = list(np.linspace(5132, 5132, 100))
b = list(np.linspace(116349, 116349, 100))
with sns.axes_style("whitegrid"):
    plt.plot(x, probabilidade, 'b')
    plt.plot(final, probabilidade2, 'b--')
    plt.plot(a, probabilidade2, 'r--')
    plt.plot(b, probabilidade2, 'r--')
    for i in list(np.linspace(5132, 116349, 100)):
        valor = list(np.linspace(i, i, 100))
        plt.plot(valor, probabilidade2, 'r--')
    plt.show()


valor_medio_y = list(np.linspace(0, 0.07, 14))
valor_medio_x = list(np.linspace(7, 7, 14))
a_x = list(np.linspace(5, 5, 14))
a_y = list(np.linspace(0, 0.07, 14))
b_x = list(np.linspace(9, 9, 14))
b_y = list(np.linspace(0, 0.07, 14))
platicurtica = [1, 1, 3, 3, 5, 5, 7, 7, 9, 9, 11, 11, 13, 13]
df_assimetrico_direita = pd.DataFrame({'valores': platicurtica})

with sns.axes_style("whitegrid"):
    df_assimetrico_direita.plot(kind='kde', figsize=(5, 3))
    plt.plot(valor_medio_x, valor_medio_y, 'r--', label='$x_0$')
    plt.plot(a_x, a_y, 'g--', label='$a$')
    plt.plot(b_x, b_y, 'k--', label='$b$')

    valor_rachurado = list(np.linspace(0.07, 0.07, 14))

    for index, i in enumerate(list(np.linspace(5, 9, 14))):
        y = valor_rachurado[index]
        valor_y = list(np.linspace(0, y, 14))
        valor = list(np.linspace(i, i, 14))
        plt.plot(valor, valor_y, 'y-', linewidth=4, alpha=0.3)
    plt.legend()
    plt.show()


def grafico_distribuicao_acumulada(array):
    lista = []
    for x in array:
        if x <= 0.0:
            resultado = 0
            lista.append(resultado)
        elif x > 1.0:
            resultado = 1
            lista.append(resultado)
        else:
            resultado = x ** 2
            lista.append(resultado)
    return lista

with sns.axes_style("whitegrid"):
    x = list(np.linspace(-1, 2, 1000))
    y = grafico_distribuicao_acumulada(x)
    plt.plot(x, y)


def distribuicao_uniforme(array, alpha, beta):
    y = []
    for i in array:
        resultado = 1/(beta-alpha)
        y.append(resultado)
    return y

x = list(np.linspace(0, 90, 1000))
y = distribuicao_uniforme(x, 10, 80)
beta_x = np.linspace(80, 80, 1000)
beta_y = np.linspace(0, y[0], 1000)
alpha_x = np.linspace(10, 10, 1000)
alpha_y = np.linspace(0, y[0], 1000)

with sns.axes_style("whitegrid"):
    plt.plot(x, y)
    plt.plot(10, 0, 'bo', label='$𝛼$')
    plt.plot(80, 0, 'go', label='$𝛽$')
    plt.plot(beta_x, beta_y, 'r--')
    plt.plot(alpha_x, alpha_y, 'r--')
    plt.legend()
    plt.show()


def grafico_distribuicao_acumulada_uniforme(array, alpha, beta):
    lista = []
    for x in array:
        if x < alpha:
            resultado = 0
            lista.append(resultado)
        elif x >= beta:
            resultado = 1
            lista.append(resultado)
        else:
            resultado = (x-alpha)/(beta-alpha)
            lista.append(resultado)
    return lista

x = list(np.linspace(0, 90, 1000))
y = grafico_distribuicao_acumulada_uniforme(x, 10, 80)
beta_x = np.linspace(80, 80, 1000)
beta_y = np.linspace(0, 1, 1000)
beta_x2 = np.linspace(0, 80, 1000)
beta_y2 = np.linspace(1, 1, 1000)

with sns.axes_style("whitegrid"):
    plt.plot(x, y)
    plt.plot(10, 0, 'ro', label='$𝛼$')
    plt.plot(80, 0, 'go', label='$𝛽$')
    plt.plot(beta_x, beta_y, 'g--')
    plt.plot(beta_x2, beta_y2, 'g--')
    plt.legend()
    plt.show()


def distribuicao_normal(valores):
    y = []
    media = sum(valores) / len(valores)
    variancia = sum((valores - media)**2)/ (len(valores) - 1)
    for valor in valores:
        multiplicador = np.exp(-((valor - media)**2) / 2 * variancia)
        resultado = (1/(np.sqrt(variancia * 2 * np.pi))) * multiplicador
        y.append(resultado)
    return y

x = list(np.linspace(0, 5, 1000))
media = sum(x) / len(x)
desvio_padrao = np.sqrt(sum((x - media)**2)/ (len(x) - 1))
y = distribuicao_normal(x)

media_x = np.linspace(media, media, 1000)
media_y = np.linspace(0, max(y), 1000)
media_mais_desvio_padrao_x = np.linspace(media + desvio_padrao, media + desvio_padrao, 1000)
media_menos_desvio_padrao_x = np.linspace(media - desvio_padrao, media - desvio_padrao, 1000)
desvio_padrao_y = np.linspace(0, 0.03, 1000)

with sns.axes_style("whitegrid"):
    plt.plot(x, y)
    plt.plot(media_x, media_y, 'b--', label='$𝜇$')
    plt.plot(media_mais_desvio_padrao_x, desvio_padrao_y, 'r--', label='$𝜇+𝜎$')
    plt.plot(media_menos_desvio_padrao_x, desvio_padrao_y, 'g--', label='$𝜇-𝜎$')
    plt.legend()
    plt.title('Exemplo de distribuição Normal')
    plt.show()


def distribuicao_normal_padronizada(valores):
    y = []
    media = 0
    variancia = 1
    for valor in valores:
        multiplicador = np.exp(-((valor - media)**2) / 2 * variancia)
        resultado = (1/(np.sqrt(variancia * 2 * np.pi))) * multiplicador
        y.append(resultado)
    return y

x = list(np.linspace(-5, 5, 1000))
media = 0
desvio_padrao = 1
y = distribuicao_normal_padronizada(x)

media_x = np.linspace(media, media, 1000)
media_y = np.linspace(0, max(y), 1000)
media_mais_desvio_padrao_x = np.linspace(media + desvio_padrao, media + desvio_padrao, 1000)
media_menos_desvio_padrao_x = np.linspace(media - desvio_padrao, media - desvio_padrao, 1000)
desvio_padrao_y = np.linspace(0, 0.237, 1000)

with sns.axes_style("whitegrid"):
    plt.plot(x, y)
    plt.plot(media_x, media_y, 'b--', label='$𝜇$')
    plt.plot(media_mais_desvio_padrao_x, desvio_padrao_y, 'r--', label='$𝜇+𝜎$')
    plt.plot(media_menos_desvio_padrao_x, desvio_padrao_y, 'g--', label='$𝜇-𝜎$')
    plt.legend()
    plt.title('Exemplo de distribuição Normal Padronizada')
    plt.show()


def distribuicao_exponencial(valores, beta):
    y = []
    for valor in valores:
        resultado = (1/beta) * (np.exp(-(valor/beta)))
        y.append(resultado)
    return y

x = list(np.linspace(0, 150, 1000))
y = distribuicao_exponencial(x, 30)

with sns.axes_style("whitegrid"):
    plt.plot(x, y)
    plt.legend()
    plt.title('Exemplo de distribuição Exponencial')
    plt.show()

No artists with labels found to put in legend.  Note that artists whose label start with an underscore are ignored when legend() is called with no argument.


def fatorial(x):
    valor = 1
    for i in range(1, x+1):
        valor *= i
    return valor


def distribuicao_gama(valores, alfa, beta):
    y = []
    for valor in valores:
        if valor > 0:
            resultado = (1/(fatorial(alfa-1) * (beta**alfa)))  * (valor**(alfa - 1) * np.exp(-(valor/beta)))
            y.append(resultado)
        else:
            resultado = 0
            y.append(resultado)
    return y

x1 = list(np.linspace(0, 30, 1000))
y1 = distribuicao_gama(x, 3, 1)
x2 = list(np.linspace(0, 30, 1000))
y2 = distribuicao_gama(x, 2, 1)
x3 = list(np.linspace(0, 30, 1000))
y3 = distribuicao_gama(x, 1, 1)
x4 = list(np.linspace(0, 30, 1000))
y4 = distribuicao_gama(x, 4, 1)
x5 = list(np.linspace(0, 30, 1000))
y5 = distribuicao_gama(x, 5, 1)
with sns.axes_style("whitegrid"):
    plt.plot(x1, y1, label='$𝛼=1, 𝛽=1$')
    plt.plot(x2, y2, label='$𝛼=2, 𝛽=1$')
    plt.plot(x3, y3, label='$𝛼=3, 𝛽=1$')
    plt.plot(x4, y4, label='$𝛼=4, 𝛽=1$')
    plt.plot(x5, y5, label='$𝛼=5, 𝛽=2$')
    plt.legend()
    plt.title('Exemplo de distribuição Gama')
    plt.show()


def distribuicao_qui_quadrado(valores, graus_liberdade):
    y = []
    for valor in valores:
        if valor > 0:
            resultado = (1/(fatorial((int(graus_liberdade/2)) -1 ) * (2**graus_liberdade/2)))  * (valor**(graus_liberdade/2 - 1) * np.exp(-(valor/2)))
            y.append(resultado)
        else:
            resultado = 0
            y.append(resultado)
    return y

x = list(np.linspace(0, 10, 1000))
y1 = distribuicao_qui_quadrado(x, 1)
y2 = distribuicao_qui_quadrado(x, 2)
y3 = distribuicao_qui_quadrado(x, 3)
with sns.axes_style("whitegrid"):
    plt.figure(figsize=(14, 5))
    plt.suptitle('Exemplo de distribuição qui-quadrado')
    ax1 = plt.subplot(1, 3, 1)
    ax2 = plt.subplot(1, 3, 2)
    ax3 = plt.subplot(1, 3, 3)
    ax1.plot(x, y1, label='graus de liberdade = 1')
    ax2.plot(x, y2, label='graus de liberdade = 2')
    ax3.plot(x, y3, label='graus de liberdade = 3')
    ax1.legend()
    ax2.legend()
    ax3.legend()
    plt.show()


def distribuicao_t_student(valores, graus_liberdade):
    y = []
    for valor in valores:
        parte1 = (fatorial(int(((graus_liberdade + 1)/2)-1))) / (fatorial((int(graus_liberdade /2)-1)) * (np.sqrt((np.pi*graus_liberdade))))  
        parte2 = (1 + ((valor**2)/graus_liberdade))**(-((graus_liberdade + 1)/2))
        resultado =  parte1 * parte2 
        y.append(resultado)
    return y

x1 = list(np.linspace(-10, 10, 1000))
y1 = distribuicao_t_student(x1, 4)
y2 = distribuicao_normal_padronizada(x1)
with sns.axes_style("whitegrid"):
    plt.plot(x1, y1, label='t de Student')
    plt.plot(x1, y2, label='Normal padrão')
    plt.legend()
    plt.show()


def distribuicao_f_snedecor(valores, graus_liberdade_1, graus_liberdade_2):
    y = []
    for valor in valores:
        parte1 = (fatorial(int(((graus_liberdade_1 + graus_liberdade_2)/2)-1))) / (fatorial((int(graus_liberdade_1 /2)-1)) * fatorial((int(graus_liberdade_2 /2)-1)))  
        parte2 = (graus_liberdade_1/graus_liberdade_2)**(graus_liberdade_1/2)
        parte3 = (valor**((graus_liberdade_1-2)/2)) / ((1 + (graus_liberdade_1*valor/graus_liberdade_2))**((graus_liberdade_1 + graus_liberdade_2)/2))
        resultado =  parte1 * parte2  * parte3
        y.append(resultado)
    return y

x1 = list(np.linspace(0, 3, 1000))
y1 = distribuicao_f_snedecor(x1, 3, 5)
with sns.axes_style("whitegrid"):
    plt.plot(x1, y1, label='F de Snedecor')
    plt.legend()
    plt.show()

Sumário

Conceito¶

Valor médio de uma variável aleatória contínua¶

Função de distribuição acumulada¶

Distribuições contínuas de probabilidade¶

Distribuição Uniforme¶

Distribuição normal¶

Distribuição exponencial¶

Distribuição gama¶

Distribuição Qui-Quadrado¶

Distribuição t de Student¶

Distribuição F de Snedecor¶

Referências¶