Herramientas y métodos para encontrar ficheros duplicados.
Un mismo fichero puede existir muchas veces en un mismo sistema si tiene un nombre diferente o si teniendo el mismo nombre está en ubicaciones diferentes.
Para determinar si un fichero está duplicado, se puede mirar
Primero compara los tamaños de los ficheros y firmas MD5, y después realiza una verificación byte-a-byte.
find . ! -empty -type f -exec md5sum {} + | sort | uniq -w32 -dD
Geeqie es un visor de imágenes para Linux que incorpora una herramienta para encontrar duplicados (solo imágenes) utilizando varios critorios: nombre el fichero, tamaño, dimensiones, contenido de la imagen, parecido visual.
Para usar esta herramienta, hay que ir a Archivo → Buscar duplicados.