Uma das ferramentas sobre as quais mais se ouve falar neste Hackatão é o Google Refine, útil para colocar em ordem bancos de dados desorganizados. O programa altera formatos de dados, modifica diversos campos em poucos passos, agrupa informações semelhantes e monitora todas as ações de edição.
A ideia do programa é "lapidar" grandes planilhas de dados crus e torná-las compreensíveis e possíveis de serem trabalhadas. Ele visualiza o total de dados, identifica inconsistências e ajuda o usuário a consertá-las.
Por exemplo: uma base de dados que detalhe gastos dos vereadores construída a partir de diversas planilhas. Se uma das fontes de dados descreve o partido do político em questão pela sigla e a outra, dá o nome do partido por extenso, fica impossível filtrar os gastos por partido, pois o computador entende que sigla e nome são categorias diferentes.
A proposta do Google Refine é ajudar o programador a encontrar e resolver esses problemas. O programa é gratuito e deve ser baixado no computador - aí não é necessário fazer upload de dados.