Python. Алгоритм перебора двух списков, ищу идею
При прогоне дампа формируются N CSV файлов. Сохраняем их в качестве эталонных. При повторном прогоне снова формируется N CSV файлов. Передо мной стоит задача определить в последнем прогоне сформировались точно те же данные в файлах что и в эталонном ? Имена файлов формируются случайным образом, с включением даты-времени, для использования в сравнении не годятся. Усугубляет дело то что в каждом из списков имеются по несколько одинаковых по размеру файлов. Каким образом определить пару (а потом уже я сравню содержимое) ? В другом месте реализовывал так - сравнивал один файл 1 списка по очереди со всеми файлами 2 списка. Эмпирически вычислил порог разницы (10 отличий - дата, время, имя файла), разница ниже порога принималось за "пару", ну а выше - за "чужой" файл. Может есть более интересное и правильное решение ? Подкиньте идею, пож.