linux重复文件查找?

现场linux系统,数据量2P,好几个团队都在使用这些数据,几年下来存在大量重复数据,相同数据可能放在不同位置,或者修改啦一下文件属性,比如同一个数据,不同用户用不同软件对同一份数据进行打开阅读,导致文件部分属性修改,现在我的任务是查找这些重复数据出来,但是不直接删除,等数据所...显示全部

现场linux系统,数据量2P,好几个团队都在使用这些数据,几年下来存在大量重复数据,相同数据可能放在不同位置,或者修改啦一下文件属性,比如同一个数据,不同用户用不同软件对同一份数据进行打开阅读,导致文件部分属性修改,现在我的任务是查找这些重复数据出来,但是不直接删除,等数据所属用户确认后在进行删除。大家有什么好的软件或者脚本提供一个呢,谢谢

收起
参与20

查看其它 1 个回答y18511664518的回答

y18511664518y18511664518技术总监长城超云

推荐一个工具 dupeguru_se,题主可以试试。

金融其它 · 2017-09-01
  • 这个我百度到啦,但是他ubentu的现成的,redhat版本的我搞半天没搞明白怎么下载软件安装,英文太差啦,同时我也大概研究一下,他是基于md5的,不适合我的2pb哦。我现在是想的是写脚本对比文件大小和名字,不对比内容
    2017-09-05

回答者

y18511664518
技术总监长城超云
擅长领域: 数据库存储关系型数据库

y18511664518 最近回答过的问题

回答状态

  • 发布时间:2017-09-01
  • 关注会员:3 人
  • 回答浏览:2810
  • X社区推广