Interaja
 
conosco!

 


 
Compartilhe isto AGORA!

Amostragem probabilística

O processo mais comum de construção de amostras é a amostragem probabilística: parte-se da pressuposição que todos os elementos da população/universo possuem a mesma probabilidade de serem incluídos na amostra.

Por exemplo, podemos atribuir um número distinto a cada elemento da população e efetuar sucessivos sorteios até completarmos o tamanho da amostra. Esta seleção dos elementos da população que farão parte da amostra freqüentemente se baseia em programas computacionais (como folhas de cálculo) e/ou de calculadoras científicas que implementam a função RANDOM (ALEATORIZAÇÃO).

Este processo de amostragem probabilística equivale então a considerar que todos os elementos da população são homogêneos, e sua participação na amostra equivale a um sorteio de loteria.

O que são estratos?

Muitas vezes a população se divide, em sub-populações, subconjuntos ou estratos, sendo razoável supor que em cada estrato a variável de interesse (sendo estudada) apresente um comportamento substancialmente diverso. Por outro lado, pode-se supor que o comportamento é razoavelmente homogêneo dentro de cada estrato. Em tais casos, se o sorteio dos elementos da amostra for realizado sem se levar em consideração a existência dos estratos, pode acontecer que os diversos estratos não sejam convenientemente representados na amostra, o que influenciara o resultado pelas características dos estratos mais favorecidos pelo sorteio. Evidentemente, a tendência à ocorrência desta influência será tanto maior quanto menor for o tamanho da amostra. Para evitar este efeito, pode-se adotar uma amostragem estratificada.

A amostragem estratificada consiste essencialmente em pré-determinar quantos elementos da amostra serão retirados de cada estrato. A pré-determinação pode ser feita de várias formas, sendo as mais comuns chamadas de uniforme (onde se sorteia um número igual de elementos em cada estrato) e proporcional (onde o número de elementos sorteados em cada estrato é proporcional ao número de elementos no estrato).

A amostragem estratificada uniforme será recomendável se os estratos da população forem pelo menos aproximadamente do mesmo tamanho. Caso contrario, será preferível a estratificação proporcional pelo fato de fornecer uma amostra mais representativa da população.

Por exemplo, se formos estudar uma varíável de comportamento de adultos que dependa de seu estado civil (solteiro, casado, divorciado, etc.), é evidente que os estratos não são de tamanho uniforme. Se na faixa de idade sob estudo, 70% dos adultos são casados, 10% são solteiros e 20% estão em outras situações, então para construir, por exemplo, uma amostra composta por 800 indivíduos, sortearmos de forma probabilística, dentro de cada um dos estratos, 560 casados, 80 solteiros e 160 em outras situações.

A estratificação pode levar em conta mais de um critério: por exemplo, além do estado civil, poderiamos pré-determinar a estratificação da amostra levando em conta faixas etárias (já que dispomos de informação detalhada da distribuição dos indivíduos por faixa etária nos censos de população).

É importante observar, entretanto, que a precisão de uma amostra não depende de unicamente da dimensão da população, mas também da respectiva variabilidade. A variabilidade de um estrato é elevada, quando os seus elementos têm características muito heterogêneas. Tal situação implica que um estrato com maior variância deverá levar à seleção de um maior número de unidades na amostra, quando comparado com um estrato com a mesma dimensão populacional mas menor variância (maior homogeneidade).

Em resumo, quanto maior for o estrato, maior deve ser a amostra respectiva. Mas se a variabilidade dentro de um estrato for maior, maior deverá ser a respectiva sub-amostra. Este método otimiza a amostra aplicada a um universo estratificado, razão pela qual também é conhecida como distribuição estratificada otimizada.

Estes princípios gerais da teoria da amostragem possuem aplicação prática em várias situações, incluindo os comportamentos de consumo. A nível geográfico, por exemplo, os estratos mais urbanos apresentam comportamento de consumo mais heterogéneos que os estratos com maior índice de ruralidade, pelo que a uma amostragem desproporcional permite obter dados mais rigorosos, através de uma sobre-amostragem nas regiões mais urbanas.

Ponderação dos dados

A aplicação de uma amostragem desproporcional, em comparação com uma distribuição proporcional, reduz a margem de erro de cada estrato, mas implica que na análise final, que deve representar os resultados para a amostra toda, os cálculos conjuntos de dois ou mais estratos tenham que ser sujeitos a uma calibragem (ou ponderação).

Por exemplo, se um grupo representa 30% do universo, mas representa 40% da amostra total, por ser mais heterogêneo, os valores resultantes terão que ser ponderados usando a fração 30/40.

Aplicando estes fatores de ponderação para cada estrato, teremos a contribuiçao de cada estrato para os resultados finais de acordo com o seu peso real no mercado todo, e não da sua participação na amostra.