amarao (amarao_san) wrote,
amarao
amarao_san

cs-challenge

Дано: база sha1-хешей. Большая. 23 гб в распакованном виде (https://haveibeenpwned.com/Passwords)
Нужно: придумать структуру данных для хранения, которая бы была максимально компактной на диске, но при этом позволяла за o(log(n)) или что-то подобное ответить на вопрос "а был ли хэш" (т.е. есть ли данный хэш в базе)

Идеи:
1. Поиграться с бинарным деревом.
2. Использовать вероятностные структуры (забыл как называется - хитрый алгоритм, у которого есть вероятность дать false positive, но гарантируется отсутствие false negative).
Subscribe

  • Post a new comment

    Error

    default userpic

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 18 comments