dbdireto Inteligência para seus dados

Área restrita

Padronização de Dados

Oferecemos os serviços de padronização de banco de dados utilizando ferramenta própria desenvolvida com base nas características de idioma e endereçamento do Brasil e com o objetivo de ajudar nossos clientes a terem uma base de dados íntegra, padronizada e isenta de duplicidades, provendo maior qualidade às informações existentes em sua empresa.


A padronização do endereço é realizada a partir do cruzamento dos dados originais com tabelas que contém possíveis grafias que, após comparadas fonéticamente, serão substituídas pela grafia oficial utilizada pela companhia de Correios do Brasil.


Avaliações pessoais e subjetivas unidas a diferentes tipos de escrita e abreviações causam inconsistência e duplicidade de registros em sua base de dados. Para compreender as diversas grafias e identificar as duplicidades todas as palavras são codificadas com a utilização de algorítimos fonéticos, capazes de gerar um código único chamado de Match Code.


Match Code

Um código identificador é associado a cada campo do banco de dados e com base nas informações de nome, endereço e cidade um conjunto único de códigos é gerado para cada registro e serve como chave de pesquisa em todos os demais processos da qualificação de dados, como no caso de atribuição de número de documento (CPF/CNPJ) em registros a partir do nome ou da razão social.


Aplicações:


Padronização Correios

A padronização é realizada a partir do cruzamento fonético da banco de dados do cliente com o DNE - Diretório Nacional de Endereços dos Correios.


Cada endereço receberá um código fonético que será comparado com os códigos do DNE e qualquer diferença apontada na grafia dos logradouros, cidades ou estados será corrigida. Neste processo também é analisada a consoância do CEP com a cidade e o estado.


Controle de caixa alta e baixa, acentuação e abreviações


Deduplicação de registros

Entende-se por deduplicação o processo de verificação, marcação e exclusão de registros iguais em um banco de dados. Para a execução deste processo é necessária a utilização de algorítimos fonéticos para a geração do match code de todos os registros e de um algorítimo de comparação para a identificação dos casos de duplicidade.

A chave pode ser definida pelo usuário e incluir campos codificados nas etapas anteriores (nome, endereço) ou campos originalmente numéricos como CPF/CNPJ e telefone.

Visão única do cliente

Evite que um mesmo cliente seja visto como dois clientes distintos, com valores diferentes e recebendo ofertas incompatíveis.

Deduplicação de Clientes

Household

O processo de householding permite a identificação de duplicidade de indivíduos em um mesmo domicílio, oferecendo informações do agrupamento familiar e não apenas do comprador principal.


Estas informações oferecem um grande benefício às ações e campanhas de marketing direto por evitar que mais de uma mala direta seja enviada para o mesmo endereço e também apoio na estratégia de oferta de produtos nos quais não cabe mais de uma venda por domicílio.


Serão identificados em nosso banco de dados registros de forma a atender o critério de agrupamento desejado, seja por edificação, endereço completo ou sobrenome (familiar).


Por edificação: Será selecionado somente um indivíduo para cada edificação (edifício ou casa).

Por endereço: Será selecionado somente um indivíduo para cada endereço completo (logradouro, número e complemento).

Por sobrenome: Será selecionado somente um indivíduo com determinado sobrenonome (família).


Segue abaixo nossa tabela de preço por quantidade de dados a serem processados:

HIGIENIZAÇÃO E PADRONIZAÇÃO DE DADOS
QUANTIDADE CUSTO POR REGISTRO QUANTIDADE CUSTO POR REGISTRO
até 5.000 R$0,18 de 30.001 a 200.000 R$0,10
de 5.001 a 10.000 R$0,16 de 200.001 a 400.000 R$0,08
de 10.001 a 30.000 R$0,12 acima de 400.000 R$0,06