seabeck.pages.dev

Como validar estrutura de arquivo CSV com script?

Validar a estrutura de um arquivo CSV pode ser uma tarefa tediosa e propensa a erros se feita manualmente. Com um script automatizado, você garante consistência, rapidez e elimina falhas humanas. Este método é o mais eficaz porque combina flexibilidade e precisão, permitindo adaptar as regras de validação conforme a necessidade do seu projeto.

Pré-requisitos

Passo 1: Criar o script de validação

Primeiro, crie um arquivo Python chamado validar_csv.py. Este script lerá o CSV, verificará se a estrutura está conforme esperado e reportará quaisquer discrepâncias.

import csv
import sys

def validar_estrutura_csv(arquivo, colunas_esperadas):
    try:
        with open(arquivo, 'r', encoding='utf-8') as f:
            leitor = csv.reader(f)
            cabecalho = next(leitor)
            if cabecalho != colunas_esperadas:
                print(f"Erro: Estrutura inválida. Esperado: {colunas_esperadas}, encontrado: {cabecalho}")
                return False
            print("Estrutura do CSV está válida!")
            return True
    except Exception as e:
        print(f"Erro ao processar arquivo: {e}")
        return False

if __name__ == "__main__":
    if len(sys.argv) != 3:
        print("Uso: python validar_csv.py <arquivo.csv> <colunas_esperadas>")
        sys.exit(1)

    arquivo = sys.argv[1]
    colunas_esperadas = sys.argv[2].split(',')
    validar_estrutura_csv(arquivo, colunas_esperadas)

Passo 2: Executar o script

Para validar um arquivo CSV, execute o script passando o caminho do arquivo e a lista de colunas esperadas, separadas por vírgula. Por exemplo:

python validar_csv.py dados.csv nome,idade,email,telefone

Exemplo Prático

Considere o arquivo dados.csv com o seguinte conteúdo:

nome idade email telefone
João Silva 30 joao@email.com (11) 98765-4321
Ana Costa 25 ana@email.com (21) 97654-3210

Ao executar o script com os parâmetros corretos, a saída será:

Estrutura do CSV está válida!

Se o arquivo tiver uma coluna a mais ou a menos, o script reportará o erro e indicará a diferença entre o esperado e o encontrado.

Conclusão

Com este script, você automatiza a validação da estrutura de arquivos CSV em segundos, evitando erros manuais e garantindo que seus dados estejam sempre no formato correto para processamento posterior.