Dataset Versioning with DVC¶
What's DVC?¶
DVC (Data Version Control) dapat dianggap seperti git untuk data. Dalam kerjanya DVC digunakan bersama-sama dengan git (github, gitlab, etc) untuk men-tracking perubahan pada data. Tentu kita juga dapat menggunakan hanya git saja untuk men-tracking perubahan pada data. Tetapi repository seperti Github/Gitlab tidak baik (layak) untuk menyimpan dan men-tracking data ber-giga-giga. Oleh karena itu, dibutuhkan DVC.
Dengan DVC kita dapat menyimpan data pada data storage dan men-tracking perubahannya menggunakan Github/Gitlab (ini kenapa harus digunakan bersama dengan git). Dengan demikian tidak membebani repository dengan data.