差分隐私的数据代码资源还挺香的,尤其是你关注数据安全、要搞数据发布的时候,简直就是刚需。
Google、Apple 早早就把差分隐私塞进了自家产品里,这玩意不是纸上谈兵。你要做数据挖掘,还得考虑用户隐私?那这份资源可以好好看下,涵盖了集中式模型到本地模型的技术路径,挺系统。
里面提到了像随机响应、BloomFilter、还有统计推断这些,你平时做众包数据时肯定能用得上,概念不绕,代码思路也清晰。像MapReduce
环境下的差分隐私 K-means 实现也有,做大数据的兄弟可以直接上。
建议你优先看看那篇 MapReduce 环境下支持差分隐私的 k-means 聚类方法,不光有思路,代码实现也还不错,响应也快。
如果你最近正好在用MATLAB或SPSS做建模,那另外几篇文章也别错过,比如 差分方程模型 MATLAB 代码 和 SPSS 推断性统计教程,直接套公式都行。
哦对了,记得别直接复制粘贴代码,改动下参数,不然隐私保护也不一定靠谱哈。