hashtag somos todos classe média

Deixe-me adivinhar: você respondeu que pertence à classe média. Como é que adivinhei? Bem, as probabilidades estavam do meu lado, e em 3 das 5 alternativas é referido um sub-estrato médio; o fato de estar a ler este blogue também indicia que você tem um grau de instrução relativamente elevado – e vários estudos apontam que educação e renda estão correlacionados, etc.

Mas não, na verdade se acertei foi simplesmente porque a maior parte das pessoas acha que é de classe média. Isso deve-se a um viés inerente à autopercepção de classe que, como sucede por vezes com as percepções, nem sempre corresponde perfeitamente à realidade. No caso da percepção de classe, isto verifica-se no Brasil, na Argentina e até um pouco por todo o mundo.

Para ajudar a explicar este viés, podemos adaptar ligeiramente o conceito de Privação Relativa, que o sociólogo Robert K. Merton desenvolveu para explicar o desvio social. Neste sentido, a auto percepção de classe social depende sobretudo da posição social relativa às pessoas que cada um vê como mais próximos e tende a enviesar-se ainda mais por pensarmos popularmente a divisão de classes como pobres, classe média e ricos1. Por isso, é natural que alguém que esteja entre os 10% com mais rendimentos ache que não é realmente rico.

Até porque haverá sempre alguém que parece ter mais recursos que nós: “como é que eu posso ser considerado rico se eu nem tenho um helicóptero/não moro em uma cobertura/não troco de carro todos os anos/não moro em uma cobertura/não tenho um helicóptero/não tenho um jato privado/não tenho uma ilha/etc”. Da mesma forma, alguém que faça parte dos 10% mais pobres entre as pessoas que possuem rendimentos considerem que não são assim tão pobres porque “afinal sempre têm rendimento/ vão tendo comida na mesa/não moram na rua/etc”.

Entende-se, então, já agora, por que é que tanta gente se surpreendeu – e se indignou – quando a Secretaria de Assuntos Estratégicos (SAE) afirmou que, em 2012, do estrato médio (“classe média”) faziam parte as pessoas com renda per capita entre R$ 291,00 e R$ 1.019,00 – talvez por isso, em 2014, a SAE passou a definir as classes a partir da renda domiciliar total.

Mas, apesar de pensar classes olhando apenas o rendimento é coisa de perturbar cientistas sociais por desconsiderar dimensões como status ocupacional, patrimônio e capitais social e cultural, por exemplo, a crescente difusão do termo Classe Média tem sido muito útil para o discurso político em todo o mundo: se toda a gente é classe média, dirigir a retórica seja para uma “classe média emergente” ou para uma “classe média que carrega o país nos ombros” tende a conquistar cada vez mais espaço aos temas clássicos como a educação, saúde e pobreza.

Como diria o britânico John Prescott: “agora somos todos classe média”.


1. Na verdade, são estratos, definidos por renda, e não classes, definidas por posição na estrutura social, mas vamos adotar a linguagem corrente para facilitar o entendimento.

comunicar avaliação para que seja lida, entendida e utilizada

Já falei aqui sobre a beleza dos dados e como a espacialização nos permite entender fenômenos que nos passariam despercebidos de outra forma, mas nunca falei de como a visualização de dados pode ser utilizada em avaliação.

Como escreveu Christie, “o uso de avaliação é a área mais discutida entre os avaliadores” e é uma questão tão antiga como a própria disciplina. Já se escreveram milhares de linhas sobre o tema e, por isso, em 1986 Cousin e Leithwood decidiram fazer um sumário dos motivos mais referidos como influenciadores do uso das avaliações. Em 2009 Johnson e colegas decidiram replicar o experimento.

Interessante notar que, embora os motivos identificados sejam praticamente os mesmos nos dois períodos, a preponderância de cada um variou. Flagrante exemplo é o da qualidade da comunicação, que passou de oitava caraterística mais citada em 1985 para segunda em 2005.

Mas desde 2005 muita coisa voltou a mudar. Em 2005 o Google tinha apenas começado a tornar-se algo mais que um mero site de pesquisa e tinha acabado de lançar o Gmail e o Maps; o Facebook ainda se chamava The Facebook. Desde 2005 vimos surgir várias das soluções tecnológicas de comunicação sem as quais não vivemos hoje: Youtube, Twitter, Dropbox, Evernote e Instagram. Em 2007, o Iphone revolucionou o mercado da comunicação móvel e o Kindle começou a convencer-nos de que se calhar há outras formas de ler. E o que pensou quando lhe disseram que o futuro era uma espécie de híbrido entre telefone e computador que não seria nem um nem outro? Hoje chamamos-lhe iPad. Mas eu entendi que algo tinha mudado quando os meus pais me pediram para ser amigo deles no Facebook.

A forma como comunicamos e absorvemos informação mudou drasticamente: temos acesso a cada vez mais informação mas temos cada vez menos tempo para dedicar a cada pedaço de informação. Será que o tradicional relatório de avaliação de 100-200 páginas ainda é a melhor forma de comunicar os resultados e recomendações de uma avaliação? É uma boa opção, mas provavelmente não é suficiente.

O público-alvo da avaliação não é uma pessoa, mas um grupo amplo com responsabilidades e interesses distintos: alguns querem acompanhar todo o trabalho de avaliação, outros preferem esperar pelo final do trabalho, alguns pretendem ler apenas os capítulos que entendem mais relevantes. É necessário, então, comunicar de forma adequada a cada grupo porque quanto maior e diverso for o grupo de leitores, maior a probabilidade de que a avaliação será utilizada.

Porém, tão ou mais relevante que ser lido é ser entendido. Quem trabalha com análise de dados sabe como por vezes é difícil comunicar algo que parece óbvio. Como Evergreen refere: “um gráfico é apenas o resultado do processo que ocorre no cérebro da pessoa que lê a informação crua”, mas esse processo nem sempre é óbvio – ou feito de forma correta.

A usabilidade de uma avaliação depende diretamente da sua legibilidade e do fato de ela ser entendida pelos diferentes leitores e isso pode ser alcançado de formas até menos rebuscadas do que o que normalmente se pensa: um trabalho de paginação e a transformação de uma tabela em um gráfico de barras, por exemplo, podem ser suficientes para aumentar o número de leitores e garantir que eles entendem o que lhes é dito. Ainda assim, e para quem quer ousar um pouco mais, há hoje várias soluções acessíveis e até gratuitas para mostrar mais que palavras. Para começar, e se se interessar por visualização de redes, porque não começar pelo NodeXL, por exemplo?

Visualização de Dados Georreferenciados, parte 1

Falamos há duas semanas da beleza da visualização de dados e de como, nesse processo, é possível encontrar evidências ou indícios que passariam despercebidos de outra forma. Vimos também que a visualização de dados pode assumir muitas formas e funciona muito para lá dos gráficos de pizza e, ao longo dos próximos posts, falaremos um pouco mais sobre isso. Hoje, começaremos a falar de visualização de dados associados a informações geográficas.


Exemplo clássico desta forma de visualização de dados é o mapa de cólera que John Snow desenvolveu em 1854, durante um surto de cólera em Londres. Em apenas três dias, tinham falecido 127 pessoas, todas elas na vizinhança da Broad Street. A hipótese mais comum era de que o surto seria provocado pela poluição ou por um “mau ar”, mas a proximidade geográfica entre os casos indiciava que a causa seria outra.

John Snow, que já em 1849 havia questionado essa hipótese, conseguiu demonstrar a sua teoria mapeando os casos de cólera. No mapa [consulte versão ampliada aqui], nota-se claramente a proximidade geográfica dos casos de cólera registrados e, no seu centro, o que viria a ser identificado como origem da epidemia: o poço de água da Broad Street.


Aprofundando a proposta de Bill Rankin, que tinha mapeado as fronteiras étnicas de Chicago, Dustin Cable desenhou um mapa racial dos Estados Unidos, colorindo um ponto por habitante. Recorrendo a dados do Censo de 2010, e com pontos de tamanho inferior a um pixel, Cable definiu não só as fronteiras raciais, mas deu um passo para a identificação de zonas de maior e menor integração racial, por considerar cores intermédias em caso de sobreposição. O mapa de Cable pode ser analisado com mais pormenor aqui.

a beleza da visualização de dados

Aprendemos desde cedo que quando o interlocutor não entende o que falamos é melhor fazer um desenho. Lição útil para comprar mel na Alemanha quando não se acerta na pronúncia ou para anotar direções no Japão quando não se entende as placas, mas também no trabalho, quando o cliente não entende conceitos estatísticos ou, como acontece vezes demais, tudo o que conhece sobre números é como os contar e falando em gráficos tudo acaba em pizza.

Ao mesmo tempo, a visualização de dados não só transforma números brutos em coisas relativamente bonitas, mas permite também descobrir ideias novas que passam muitas vezes despercebidas nas planilhas e nas tabelas, sejam elas as diferenças socioeconômicas entre regiões de uma mesma cidade, a história das potências mundiais ou a evolução da relação entre renda e esperança média de vida.

Para hoje, recomendamos “A Beleza da Visualização de Dados” (legendas em português):

Desmatamento no Brasil [2000-2012]

Resultado de uma parceria da Universidade de Maryland, Google, US Geological Survey e NASA, foi disponibilizado no dia 15 de novembro o primeiro mapa mundial de mudanças na floresta, que abrange o período de 2000 a 2012 e permite identificar, particularmente, a evolução do desmatamento. O artigo completo saiu na última edição da Science.


Desmatamento no Brasil entre 2000 e 2012

Olhando particularmente o caso do Brasil, identifica-se claramente que o estado Amazonas tem sido relativamente poupado do desmatamento desde 2000 [forest cover loss], sendo as excepções as fronteiras com Acre, Rondônia e Mato Grosso e as margens dos rios e das estradas nacionais. Seja pela inacessibilidade de grande parte do Estado, seja pela visibilidade do trabalho de várias organizações contra o desmatamento, a verdade é que o Amazonas sofreu nos últimos doze anos relativamente menos com o desmatamento que quase todos os restantes estados brasileiros.

Pelo contrário, os vizinhos Acre, Rondônia, Roraima, Mato Grosso e Pará – este último particularmente nas margens dos rios e estradas nacionais -, apresentam índices de desmatamento visivelmente altos. Mais, olhando aos índices de reflorestamento ou criação de nova floresta [forest cover gain], nota-se que quase nada da floresta que se perdeu foi reflorestada no período, ao contrário do que é visível, por exemplo, no Sul e Sudeste brasileiros.

Apesar disso, nota-se que o ritmo do desmatamento no Brasil abrandou no período de pesquisa [forrest loss year], ainda que não tenha sido suficiente para conter a perda de, em média, 2.101 km2 de floresta tropical no mundo por ano. Nesse sentido, os pesquisadores realçaram, entre outros fenómenos, os desmatamentos no Peru e Paraguai, aliás igualmente identificáveis na imagem.

Saúde Brasileira em Números: Onde Pesquisar?

Os dados secundários estatísticos são amplamente utilizados para embasar hipóteses e teorias acadêmicas, para ilustrar notícias e artigos de opinião nos media ou como argumento em discussões de café. Apesar disso, frequentemente esses dados são referidos fora do contexto em que foram produzidos e, por isso, acabam por dar azo a interpretações deturpadas.

Ao utilizar dados secundários cuja coleta é responsabilidade de terceiros, é necessário considerar o risco associado à possibilidade de haver displicência no processo de coleta o que, em consequência, coloca em causa a fiabilidade dos dados. Dessa forma, é fundamental utilizar apenas dados produzidos por fontes fidedignas.

Em post anterior indicamos as principais fontes de dados secundários sobre Educação, esta semana trataremos de outro tema fundamental para diagnósticos: a Saúde.

Como na Educação, também os dados sobre Saúde estão particularmente concentrados numa fonte: o Departamento de Informática do SUS (DATASUS). Infelizmente, e aqui ao contrário do que acontece na Educação, o sistema não merece referência nem pela sua organização nem pela sua usabilidade. Complementarmente, podem ser ainda consultados o Instituto Brasileiro de Geografia e Estatística (IBGE), apesar de não disponibilizar microdados das suas pesquisas sobre saúde, e a Organização Mundial de Saúde (OMS), embora os dados disponíveis sejam apenas de nível nacional e não tenha página em português.

Considerando, então, os dados do DATASUS, estes podem ser acedidos através do TABNET e, apesar de este se encontrar dividido por temas, em “Indicadores de Saúde” é possível encontrar os dados mais relevantes:

Indicadores e Dados Básicos (IDB): com dados sobre morbidade, mortalidade, fatores de risco e proteção, sobre recursos e cobertura de serviços, o IDB, ainda que com os obstáculos causados pela má usabilidade, é a ferramenta mais completa do site.
Sala de Situação, Cadernos de Informação de Saúde e Monitoramento de Mortalidade: ainda que mais limitados que os dados do IDB, o desenho das ferramentas foi bastante mais feliz e, para uma pesquisa mais superficial, permitem encontrar dados relevantes em menos tempo.

Educação Brasileira em Números: Onde Pesquisar?

Os dados secundários estatísticos são amplamente utilizados para embasar hipóteses e teorias acadêmicas, para ilustrar notícias e artigos de opinião nos media ou como argumento em discussões de café. Apesar disso, frequentemente esses dados são referidos fora do contexto em que foram produzidos e, por isso, acabam por dar azo a interpretações deturpadas.

Ao utilizar dados secundários, cuja coleta é responsabilidade de terceiros, é necessário considerar o risco associado à possibilidade de haver displicência no processo de coleta o que, em consequência, coloca em causa a fiabilidade dos dados. Dessa forma, é fundamental utilizar apenas dados produzidos por fontes fidedignas.

Ao longo das próximas semanas publicaremos as fontes de referência para a obtenção de dados estatísticos de vários tópicos sobre o Brasil. Esta semana, a Educação.

Os dados estatísticos sobre a Educação no Brasil estão bastante centralizados e são, na sua grande maioria, da responsabilidade do Instituto Nacional de Pesquisas Educacionais Anísio Teixeira (INEP), que os disponibiliza em diversos formatos: microdados, sinopses e consultas no próprio site. Complementariamente, sugerimos também a consulta dos dados do Fundo Nacional de Desenvolvimento de Educação (FNDE) e do Instituto Brasileiro de Geografia e Estatística (IBGE).

Instituto Nacional Estudos Pesquisas Educacionais Anísio Teixeira (INEP)

Microdados
Censo Educação Superior (1995-2011)
Censo Escolar (1995-2012)
Censo Profissionais do Magistério (2003)
Enade (2004-2011)
Enem (1998-2011)
Pesquisa de Ações Discriminatórias no Âmbito Escolar (2008)
Pnera (2004)
Prova Brasil (2007-2011)
Provão (1997-2003)
Saeb (1995-2011)

Sinopses
Educação Básica
Média de Alunos por Turma (2007-2010)
Média de Horas-Aula diária (2010)
Taxa de distorção idade-série (2006-2010)
Taxa de Rendimento (2007-2011)
Taxa de Não Resposta (2010-2011)
Educação Superior
Número de Cursos, Matrículas e Concluintes (1991-2010)

Consulta no Site
Índice de Desenvolvimento de Educação Básica (2005-2011)

Instituto Brasileiro de Geografia e Estatística (IBGE)

Censo Demográfico
Dados de Alfabetização (2010)

PNAD
Número Médio de Anos de Estudo (2005 a 2006)

Fundo Nac. Desenvolvimento Educação (FNDE)

Investimento na Educação
Valor ano/aluno e Receita Anual Prevista (2007-2011)