SoftMaker logo

Más que bytes

Líbrese de archivos duplicados: estrategias y herramientas

Nunca es mala idea guardar varias copias de los archivos importantes. Sin embargo, esto puede hacer que tenga muchas más copias de las que realmente necesita, saturando su espacio de almacenamiento o simplemente estorbándole.

Deshacerse de los duplicados que le sobran no es tan fácil como parece. Antes de borrar los archivos, debe asegurarse de que realmente son innecesarios y no fijarse solo en que comparten el mismo nombre. Para eliminar los duplicados de forma segura, necesita dos cosas: un buen buscador de duplicados y una estrategia para sacarle el mejor provecho.

No todos los duplicados son malos

Permítame señalar brevemente que, en términos generales, los duplicados no solo son buenos: son esenciales. El propio Windows guarda múltiples copias de algunos archivos importantes, que no deben ser tocados. Aunque tener un archivo desktop.ini en cada carpeta de fotos pueda parecer redundante, en realidad sirven para algo.

Normalmente, será buena idea guardar tres copias de cada archivo que usted considere importante. Quizá haya oído hablar de la regla del 3-2-1 para las copias de seguridad: es sencillísima.

3 - Haga al menos tres copias de sus datos,
2 - almacene dos copias de seguridad en diferentes medios de almacenamiento, y
1 - guarde una copia de seguridad en un equipo diferente, lejos de sus otras copias de seguridad.

Parece sencillísimo, sí, pero puede ser difícil ponerlo en práctica.

Asumamos que se parece a mí y que ha tratado de seguir la regla del 3-2-1 de las copias de seguridad, luego dejó de hacerlo por un tiempo y ahora trata de recuperar el tiempo perdido. Seguramente esto se traduzca en que tenga muchas más copias de las que realmente necesita, y que además están por todas partes.

Yo, por ejemplo, me encontré de repente con más carpetas con duplicados potenciales de las que podía cribar a mano. Estaban repartidas en múltiples unidades, algunas de ellas internas, otras externas. Algunos duplicados eran restos de cuando vacié las memorias USB antes de prestarlas a los amigos, otros eran el resultado de un intento desesperado de rescatar datos de una unidad que fallaba.

También había una antigua carpeta con copias de seguridad de fotos que seguía una categorización que había abandonado tiempo atrás. También encontré tres colecciones de música muy poco manejables que rescaté de varios reproductores de audio portátiles antes de su retiro.

¿Qué haría usted con todo esto?

Fijar objetivos

Su situación específica será la que fije sus objetivos concretos para deshacerse de los duplicados.

Si se está quedando sin espacio de almacenamiento, querrá concentrarse únicamente en los archivos grandes: contenedores de copias de seguridad, vídeos, música y fotos (en orden descendente). Los documentos de oficina suelen ser demasiado pequeños para importar mucho aquí; incluso las fotos y los archivos de audio pueden no valer la pena cuando las unidades externas están abarrotadas de copias de seguridad de un sistema antiguo.

Si tiene un objetivo más específico, como por ejemplo, poner en orden sus carpetas de fotos o su extensa colección de música, sus prioridades serán diferentes: no solo busca duplicados exactos, sino también copias de fotos con poca resolución, así como copias antiguas e inferiores de sus álbumes favoritos que haya recodificado ya en un formato más moderno.

En cualquier caso, asegúrese de establecer sus prioridades antes de empezar. Podría llevarle lo suyo, así que aproveche el tiempo. Pocas cosas son más frustrantes que abandonar la caza de duplicados porque se ha vuelto demasiado tediosa, solo para volver a la tarea un par de meses más tarde con un vago recuerdo de lo que originalmente se propuso hacer.

Yo terminé haciendo una lista con mis necesidades específicas y mis objetivos: para limpiar mi disco duro magnético interno, necesito hacer antes espacio en mis discos externos, empezando por... A medida que avanzaba, fui actualizando la lista y marcando los puntos que ya había logrado. Esto me dio la sensación de estar progresando, lo cual es esencial para mantenerme motivado. ¡Ah! Y también escuché un montón de mi música favorita para hacer más amena la tarea.

Unas palabras de sabiduría

Antes de que empiece a borrar nada, asegúrese de que tiene tres copias de cada cosa. Lo digo en serio. Si es necesario, debería conseguir un disco externo nuevo para hacer una copia de seguridad de los datos que planea analizar antes de seguir adelante.

El siguiente consejo se basa en amargas experiencias personales.

Asegúrese de que solo copia sus datos: No mueva archivos de un disco a otro. Siempre copie primero, luego verifique que los archivos copiados sean efectivamente idénticos, y luego borre los originales. ¿Por qué destaco este punto? Bueno, he tenido un nuevo disco externo que se me murió justo después de haber copiado en él algunas grabaciones de audio irremplazables... Jamás me volverá a ocurrir.

Herramientas de vídeo como FastCopy y TeraCopy compararán las sumas de control de los archivos originales y las copias después de transferirlos. Alternativamente, puede verificar los archivos copiados utilizando una herramienta externa como Beyond Compare o WinMerge.

Escoja sus herramientas

Hay buscadores duplicados disponibles para Linux, macOS y Windows. Muchos son gratuitos, pero otros son dolorosamente caros. Mi recomendación es probar primero las opciones gratuitas para ver si satisfacen sus necesidades.

dupeGuru (Linux, macOS, Windows) es un veterano entre los buscadores de duplicados gratuitos: se remonta a 2004,y parece el adecuado. Tiene tres modos de funcionamiento: estándar, música e imágenes. El "modo estándar" encuentra duplicados binarios, es decir, archivos que coinciden en tamaño y contenido con los demás. El "modo música" compara las etiquetas de los archivos de audio, encontrando así también canciones duplicadas codificadas en diferentes formatos o a diferentes tasas de bits.

Aunque el "modo imagen" incluye un algoritmo de búsqueda de coincidencias, carece de un visor de imágenes integrado para permitir comparaciones inmediatas entre posibles duplicados. A los usuarios de Windows podrían interesarles también SimilarImages o VisiPics. Ambas herramientas son también gratuitas.

Si está buscando duplicados en carpetas o unidades diferentes, asegúrese de marcar una de ambas rutas como "referencia". Esto acelerará el proceso de eliminación porque la aplicación impedirá que se eliminen los archivos de la ruta de referencia. Sin embargo, si está buscando duplicados dentro del mismo directorio, debe mantener todas las rutas como "normales".

AllDup solo está disponible para Windows. También incluye métodos de búsqueda difusa de música e imágenes y la interfaz es un poco más moderna. La vista previa de la imagen interna está un poco escondida: tiene que elegir "Vista previa del archivo" en el menú de resultados de la búsqueda para abrirla.

Similarity se especializa en la comparación de vídeo y audio, y está disponible para macOS y Windows. La funcionalidad básica es gratuita, pero la mayoría de las funciones de ahorro de tiempo están reservadas a los clientes de pago, incluyendo la aceleración de OpenCL y la selección automática de duplicados. La versión prémium cuesta 20 $ durante el primer año y las renovaciones cuestan 10 $.

Las comparaciones en línea de buscadores de duplicados gratuitos suelen mencionar la herramienta exclusiva para Windows Auslogics Duplicate File Finder. La interfaz de la herramienta parece bastante amigable, pero su funcionalidad está severamente limitada: la herramienta de Auslogics solo encontrará duplicados binarios exactos. Además, el instalador intenta convencer a los usuarios para que compartan "información anónima", configura la aplicación para que se inicie cada vez que se inicia Windows e instala dos aplicaciones adicionales. En general, todo el asunto es más que nada una cartelera.

dupeGuru y AllDup son aceptables para archivos pequeños, pero sus algoritmos de comparación y gestión de la memoria pueden fallar con los archivos grandes; es decir, cualquier cosa de más de 1 GB. Al final terminé decantándome por una alternativa comercial. Duplicate Cleaner cuesta una tarifa única de 39 $ y ofrece una interfaz sencilla que identificará de forma fiable duplicados binarios, coincidencias cercanas y archivos de audio e imagen similares. También ha demostrado ser muy fiable en el manejo de archivos grandes. El único inconveniente es que su localización al alemán es mala - es mejor cambiar la interfaz de usuario al inglés.

Es fácil encontrar duplicados binarios

Dar con los duplicados binarios es relativamente sencillo. En lugar de comparar cada archivo bit a bit, la aplicación calcula sumas de verificación del contenido de sus archivos mediante un algoritmo hash. Calcular estos hash llevará un tiempo, cuanto más grande sea el archivo, más tiempo necesitará.

La mayoría de los buscadores de duplicados usan hash MD5 o SHA1: Aunque ambos estándares se consideran "rotos" para fines criptográficos, son rápidos y suficientemente buenos para las comparaciones de archivos. A menos que tenga razones para preocuparse de que alguien manipule deliberadamente los archivos de su disco duro para crear duplicados falsos, MD5 debería funcionarle.

Antes de dejar que un buscador de duplicados analice sus archivos, debería comprobar cuántos datos le está proporcionando. Para una comprobación rápida, los usuarios de Windows seleccionan la carpeta que se va a analizar en el Explorador de Windows, presionan Alt+Volver y comprueban la entrada "Tamaño" en el diálogo de propiedades.

Si su buscador de duplicados está a punto de procesar 500 GB de datos o más, no tiene sentido quedarse sentado mirando la barra de progreso: tómese un café, vuelva y calcule cuántas pausas para café más necesitará el software para calcular sus hash. Incluso podría decidir dejar que el buscador de duplicados haga lo suyo durante la noche y comprobar los resultados por la mañana.

Identificar música e imágenes duplicadas

Si cree que la comparación binaria se toma su tiempo, espere a que empiece a comparar imágenes y música. Comparar imágenes requiere muchos más recursos de computación que simples cálculos de sumas de comprobación. Por eso probablemente debería empezar con una comparación binaria (la más rápida) y luego intentar una comparación de imágenes excluyendo los metadatos EXIF (todavía bastante rápida) y finalmente ir a por las similitudes (tiempo de descanso para el café).

La comparación de los archivos de audio se puede hacer de manera similar: En Duplicate Cleaner Pro, primero opto por "Coincidir datos exactos de audio (ignorar etiquetas)" y luego procedo con "Audio similar - Comparar archivo completo". También estos modos requieren cierto tiempo, pero proporcionan los resultados más fiables. La opción "Coincidir solo etiquetas de audio" también puede funcionar (establezca "Artista similar", "Mismo título" y "Álbum similar"), pero los resultados dependen totalmente de lo bien que estén etiquetadas sus bibliotecas de música.

Limpieza digital: elimine las carpetas vacías

La mayoría de los limpiadores de duplicados tratan de limpiar después de haber realizado su tarea: si al borrar los duplicados quedan subcarpetas vacías, se ofrecerán a borrarlas también. Sin embargo, las carpetas anidadas suelen dejar restos.

La solución es un simple archivo por lotes o una herramienta especial. Me he aficionado al programa gratuito de Windows "Remove Empty Directories", que es rápido y proporciona la opción de crear listas blancas de las carpetas que quiera conservar.

Cómo evitar las repeticiones

Librarse de forma efectiva de sus duplicados puede llevarle días. Con los grandes duplicados binarios, son las propias comparativas las que consumen la mayoría del tiempo. Cuando se buscan imágenes redundantes, se consume mucho tiempo comprobando si se detectaron correctamente los duplicados por debajo del umbral del 90 %. Con los archivos de audio, las comparaciones pueden llevar más tiempo, pero el proceso de eliminación es bastante intuitivo.

Mi odisea personal de desduplicación me llevó más tiempo del que esperaba. Al terminar, tenía dos unidades vacías de 4 TB. En el transcurso de mi limpieza digital, también descubrí que tres discos externos estaban empezando a fallar. De no haber descubierto esto justo a tiempo, probablemente habría perdido algunos datos importantes.

Déjeme un comentario para hacerme saber cómo gestiona usted sus duplicados. ¿Utiliza estrategias diferentes a las mías que le han funcionado bien? ¿Qué herramientas usa?

Gracias.

El producto se ha añadido al carrito de compra.