¿Cómo fusionar varios archivos txt usando Python, eliminar todas las líneas duplicadas y generar un nuevo archivo?
Coloque todos estos archivos txt en una carpeta
Abra cmd, vaya a la carpeta con varios archivos txt y ejecute el comando copiar *.txt all.txt
p>
Cree el script Python 1.py en la carpeta y copie el siguiente código en él #?coding=utf -8
#?using?python27
file_path ?=?'all.txt'
con?open(file_path,? r')?as?f:
card_informations?=?map(lambda?x:?x. strip().split('\t'),?f.readlines())
for?i?in?range(len(card_informations )):
número?= ?card_informations[i][0]
if?len(número)<10:
card_informations[i][0]?+=?' '0'?Agregar 0 a menos de 10
#?Eliminar duplicados
resultado?=?[]
para?i?in?card_informatios:
si?no?en?resultado:
resultado.append(i)
#?Escribir un nuevo archivo
con ?open('result.txt',?w+')?as?Después de ejecutar el script, habrá un archivo result.txt adicional en la carpeta, que contiene toda la información de la tarjeta después de la deduplicación.