差分編碼

差分编码英語:),又稱增量編碼,是指在序列式資料之間以數據差異形式儲存或傳送資料的方式(相對於儲存傳送完整檔案的方式)。差分編碼應用廣泛,如需要查看文件的歷史更改記錄(版本控制git等)、Windows中的遠程差分壓縮在线备份等場景均用到了差分编码。

差異儲存在稱為「delta」或「diff」的不連續檔案中。由於改變通常很小(平均佔全部大小的2%),差分編碼能大幅減少資料的重複。一連串獨特的delta檔案在空間上要比未編碼的相等檔案有效率多了。

差分編碼的簡單例子是儲存序列式資料之間的差異(而不是儲存資料本身):不存「2, 4, 6, 9, 7」,而是存「2, 2, 2, 3, -2」。單獨使用用處不大,但是在序列式數值常出現時可以幫助壓縮資料。

相關條目

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.