Skip to content

Dataset Versioning with DVC

What's DVC?

DVC (Data Version Control) dapat dianggap seperti git untuk data. Dalam kerjanya DVC digunakan bersama-sama dengan git (github, gitlab, etc) untuk men-tracking perubahan pada data. Tentu kita juga dapat menggunakan hanya git saja untuk men-tracking perubahan pada data. Tetapi repository seperti Github/Gitlab tidak baik (layak) untuk menyimpan dan men-tracking data ber-giga-giga. Oleh karena itu, dibutuhkan DVC.

Dengan DVC kita dapat menyimpan data pada data storage dan men-tracking perubahannya menggunakan Github/Gitlab (ini kenapa harus digunakan bersama dengan git). Dengan demikian tidak membebani repository dengan data.