Validar a estrutura de um arquivo CSV pode ser uma tarefa tediosa e propensa a erros se feita manualmente. Com um script automatizado, você garante consistência, rapidez e elimina falhas humanas. Este método é o mais eficaz porque combina flexibilidade e precisão, permitindo adaptar as regras de validação conforme a necessidade do seu projeto.
Primeiro, crie um arquivo Python chamado validar_csv.py. Este script lerá o CSV, verificará se a estrutura está conforme esperado e reportará quaisquer discrepâncias.
import csv
import sys
def validar_estrutura_csv(arquivo, colunas_esperadas):
try:
with open(arquivo, 'r', encoding='utf-8') as f:
leitor = csv.reader(f)
cabecalho = next(leitor)
if cabecalho != colunas_esperadas:
print(f"Erro: Estrutura inválida. Esperado: {colunas_esperadas}, encontrado: {cabecalho}")
return False
print("Estrutura do CSV está válida!")
return True
except Exception as e:
print(f"Erro ao processar arquivo: {e}")
return False
if __name__ == "__main__":
if len(sys.argv) != 3:
print("Uso: python validar_csv.py <arquivo.csv> <colunas_esperadas>")
sys.exit(1)
arquivo = sys.argv[1]
colunas_esperadas = sys.argv[2].split(',')
validar_estrutura_csv(arquivo, colunas_esperadas)
Para validar um arquivo CSV, execute o script passando o caminho do arquivo e a lista de colunas esperadas, separadas por vírgula. Por exemplo:
python validar_csv.py dados.csv nome,idade,email,telefone
Considere o arquivo dados.csv com o seguinte conteúdo:
| nome | idade | telefone | |
|---|---|---|---|
| João Silva | 30 | joao@email.com | (11) 98765-4321 |
| Ana Costa | 25 | ana@email.com | (21) 97654-3210 |
Ao executar o script com os parâmetros corretos, a saída será:
Estrutura do CSV está válida!
Se o arquivo tiver uma coluna a mais ou a menos, o script reportará o erro e indicará a diferença entre o esperado e o encontrado.
Com este script, você automatiza a validação da estrutura de arquivos CSV em segundos, evitando erros manuais e garantindo que seus dados estejam sempre no formato correto para processamento posterior.