深度哈希的二值编码挺有意思的,适合大规模图像检索那类对速度要求高的任务。它的做法是把原始的特征向量压成二进制向量,既节省存储又提高检索效率。

顶层用了三个约束:尽量保留原始特征的表达能力、每一位尽量平均分布、各位之间尽量独立。听着挺绕,其实核心就是让二进制更有“表达力”,不只是瞎凑数字。

另外,SDH的扩展也蛮实用,尤其在监督场景下更能区分不同类别,效果比以前的方案强不少。你要做图像或视频检索,可以看看这套思路。

嗯,你要是还不太熟hash learning或者无监督/半监督这些概念,下面几个链接可以帮你快速理清楚:

无监督学习大纲聚类降维与特征提取半监督实战指南,建议按这个顺序读。

如果你手上正好有大批图像特征数据,想省空间又加速,那深度哈希编码这个方向蛮值得搞搞。