amarao (amarao_san) wrote,
amarao
amarao_san

gattai

Мысли по поводу quality detection и name spliting:

1) Не имеет смысла разделять понятие "quality" и "random text" (unrecognized). Если там есть признаки качества, то они принимаются, если нет - то не принимаются и игнорируются.
2) Следует не просто считать вхождения, а разделять их по классам (типам). В настоящий момент 1280x768 HD будет давать больший вес, чем просто 1280х768, или HD - что неправильно. То же касается и других критериев качества.

В принципе, разделение по типам в перспективе даст возможность не просто выбирать лучшее, но и позволить пользователю указать, что есть лучшее (например, кто-то может предпочитать HD вместо FullHD или mp3 перед AC3).

PS Попробуйте определить, где тут CRC:

[RG] Doraemon 2005 - Episode 133 (20090123) [720x480][XviD-MP3-SUB][93827CA4].avi
Tags: gattai
Subscribe

  • Systemic approach

    У меня на работе на на почти все задачи обычно делаю шаг назад или на два и говорю "не, вместо вот этого "тут и сейчас" мы будем делать что-то…

  • С годами приходит мудрость

    Если мелкие конфиги на сервере, и хочется их скопировать на другой сервер, то не надо даже городить scp. Можно так: tar cz /etc/ceph/|base64…

  • (no subject)

    Prusti - писк восторга. https://www.youtube.com/watch?v=C9TTioH5JUg

  • Post a new comment

    Error

    default userpic

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 4 comments