dbdireto Inteligência para seus dados

Área restrita

Higienização de Dados

Não desperdice tempo e dinheiro em suas ações e campanhas de mala direta e telemarketing.

Com nossas ferramentas é possível localizar palavras inválidas e/ou impróprias, atribuir o tipo de pessoa (PF ou PJ), o sexo (M, F ou I), realizar o processo de parser (quebra ou explosão das informações de nome próprio e endereço) e gerar códigos fonéticos que posteriormente serão utilizados na identificação de possíveis casos de duplicidade.


Metodologia:

A metodologia utilizada é composta por seis etapas, iniciando pela análise geral da estrutura da base de dados, em seguida passando pela importação dos dados para o sistema que aceita os mais diversos formatos de arquivo, a análise de consistência dos registros aplicando nesta fase as regras previamente definidas pelo cliente no formulário de parametrização, a deduplicação dos registros, o cálculo dos índices de sucesso de todos os atributos (Score) e por final a consolidação da base tratada e a exportação do arquivo no formato solicitado.


Dados tratados e validados:


Nome e Razão Social

Para a validação do nome e da razão social, é realizada a eliminação de caracteres considerados inválidos ( . , : ; º ª ), a conversão para caixa alta ou baixa e a substituição de letras com acentos e controle de abreviações de acordo com a parametrização, evitando possíveis problemas de impressão de etiquetas ou cartas personalizadas.

Para o nome também é realizado o parser, separação do nome em primeiro nome, nome do meio e sobrenome.

Nome e Razão Social

Endereços

Para a validação do endereço são considerados todos os seus atributos (CEP, tipo de logradouro, logradouro, número, bairro, cidade e UF), aplicando-se tratamentos específicos para cidades com características especiais como Palmas, Brasília, Baurú e Goiânia.


Os endereço a serem tratados são confrontadas com a base do DNE (Diretório Nacional de Endereços) dos Correios e caso haja alguma inconsistência será efetuada a recuperação dessa informação, corrigindo-a e separando-a por partícula (CEP, tipo de logradouro, logradouro, número, complemento, bairro, cidade e UF, além dos códigos fonéticos do logradouro e da cidade).

Endereço

Telefones

Ao excluir caracteres especiais, inválidos, espaços e aplicando algoritmos para separação do DDD e número, torna-se possível a validação e a correção de telefones confrontando com nosso dicionário de alterações de prefixos e sufixos dos últimos 10 anos. A atribuição do DDD também é possível vinculando o telefone a um endereço. As correções e atualizações de prefixos seguem as alterações promovidas pelas empresas de telefonia fixa e móvel e são confrontadas com as informações de prefixos válidos pela ANATEL.

Telefone

Endereço de e-mail

No processo de tratamento é realizada a validação estrutural* e literal dos endereços de e-mail, a remoção de caracteres inválidos como espaços, acentos, vírgulas e outros como também o cruzamento com o dicionário interno de domínios incluído em nossa ferramenta.


* login@domínio.atividade.país

E-mail

CPF e CNPJ

É realizada a validação estrutural do CPF ou CNPJ, retornando a informação quebrada em Raiz, Filial e Dígito.


Para os casos onde não se sabe o tipo de informação (se CPF ou CNPJ), nossa ferramenta aplica ambos os cálculos afim de identificar o tipo de documento. É possível que um mesmo número seja válido para ambos os tipos porém, verificando-se as informações em determinadas posições, o tipo correto será sugerido (quando possível) pela ferramenta.

CPF e CNPJ

Atribuição de sexo e tipo de pessoa:

É realizada a atribuição do sexo a partir de verificação do primeiro nome.


A atribuição do tipo de pessoa, Física ou Jurídica, é realizada através de uma relação de palavras-chave (SA, Ltda, Prefeitura, Banco, Indústria, Comércio, etc.).

Sexo

Após o tratamento da base, poderão ser gerados relatórios quantitativos para avaliação das correções.

Segue abaixo nossa tabela de preço por quantidade de dados a serem processados:

HIGIENIZAÇÃO E PADRONIZAÇÃO DE DADOS
QUANTIDADE CUSTO POR REGISTRO QUANTIDADE CUSTO POR REGISTRO
até 5.000 R$0,18 de 30.001 a 200.000 R$0,10
de 5.001 a 10.000 R$0,16 de 200.001 a 400.000 R$0,08
de 10.001 a 30.000 R$0,12 acima de 400.000 R$0,06