Eliminar automáticamente las filas duplicadas en Excel

Excel es una aplicación versátil que ha crecido mucho más allá de sus versiones anteriores como simplemente una solución de hoja de cálculo. Empleada como conservadora de registros, libreta de direcciones, herramienta de pronóstico y mucho más, muchas personas incluso usan Excel de una forma que nunca fue la intención.

Si usa Excel mucho en casa o en la oficina, sabe que a veces los archivos de Excel pueden volverse difíciles de manejar debido a la gran cantidad de registros con los que está trabajando.

Afortunadamente, Excel tiene funciones integradas para ayudarlo a encontrar y eliminar registros duplicados. Desafortunadamente, hay algunas advertencias en el uso de estas funciones, por lo tanto, tenga cuidado o puede, sin saberlo, eliminar los registros que no pretendía eliminar. Además, los dos métodos a continuación eliminan instantáneamente los duplicados sin permitirle ver lo que se eliminó.

También mencionaré una forma de resaltar las filas que están duplicadas primero, para que pueda ver cuáles se eliminarán con las funciones antes de ejecutarlas. Debe usar una regla personalizada de formato condicional para resaltar una fila que está completamente duplicada.

Eliminar la función de duplicados

Supongamos que utiliza Excel para realizar un seguimiento de las direcciones y sospecha que tiene registros duplicados. Mira la hoja de cálculo de Excel de ejemplo a continuación:

Observe que el registro de "Jones" aparece dos veces. Para eliminar dichos registros duplicados, haga clic en Datos ficha en la cinta de opciones y busque la Eliminar duplicados función bajo el Herramientas de datos sección. Haga clic en Eliminar duplicados y se abre una nueva ventana.

Aquí debe tomar una decisión en función de si utiliza etiquetas de encabezado en la parte superior de sus columnas. Si lo haces, selecciona la opción etiquetada. Mis datos tienen encabezados. Si no usa etiquetas de encabezado, usará las designaciones de columna estándar de Excel, como la Columna A, la Columna B, etc.

Para este ejemplo, elegiremos la columna A solamente y haremos clic en DE ACUERDO botón. La ventana de opciones se cierra y Excel elimina el segundo registro "Jones".

Por supuesto, esto fue solo un ejemplo simple. Es probable que cualquier registro de dirección que mantengas usando Excel sea mucho más complicado. Supongamos, por ejemplo, que tiene un archivo de dirección similar a este.

Tenga en cuenta que aunque hay tres registros "Jones", solo dos son idénticos. Si utilizamos los procedimientos anteriores para eliminar registros duplicados, solo quedará una entrada "Jones". En este caso, debemos ampliar nuestros criterios de decisión para incluir el nombre y el apellido que se encuentran en las Columnas A y B, respectivamente.

Para ello, una vez más haga clic en el Datos pestaña en la cinta y luego haga clic en Eliminar duplicados. Esta vez, cuando aparezca la ventana de opciones, elija las columnas A y B. Haga clic en DE ACUERDO botón y observe que esta vez Excel eliminó solo uno de los registros de "Mary Jones".

Esto se debe a que le dijimos a Excel que eliminara los duplicados haciendo coincidir los registros basados ​​en las Columnas A y B en lugar de solo en la Columna A. Cuantas más columnas elija, más criterios deberán cumplirse antes de que Excel considere que un registro es un duplicado. Elija todas las columnas si desea eliminar las filas que están completamente duplicadas.

Excel le dará un mensaje que le indicará cuántos duplicados se eliminaron. ¡Sin embargo, no te mostrará qué filas fueron eliminadas! Desplácese hasta la última sección para ver cómo resaltar las filas duplicadas antes de ejecutar esta función.

Método de filtro avanzado

La segunda forma de eliminar duplicados es usar la opción de filtro avanzado. Primero, seleccione todos los datos en la hoja. A continuación, en la pestaña Datos de la cinta, haga clic en Avanzado en el Filtro de clasificación sección.

En el cuadro de diálogo que aparece, asegúrese de verificar Solo registros únicos caja.

Puede filtrar la lista en el lugar o puede copiar los elementos no duplicados a otra parte de la misma hoja de cálculo. Por alguna extraña razón, no puede copiar los datos a otra hoja. Si lo desea en otra hoja, primero elija una ubicación en la hoja actual y luego corte y pegue los datos en una hoja nueva.

Con este método, ni siquiera recibe un mensaje que indique cuántas filas se eliminaron. Las filas se eliminan y eso es todo.

Resaltar filas duplicadas en Excel

Si desea ver qué registros están duplicados antes de eliminarlos, debe hacer un poco de trabajo manual. Desafortunadamente, Excel no tiene una manera de resaltar las filas que están completamente duplicadas. Tiene una característica en formato condicional que resalta celdas duplicadas, pero este artículo trata sobre filas duplicadas.

Lo primero que deberá hacer es agregar una fórmula en una columna a la derecha de su conjunto de datos. La fórmula es simple: simplemente concatene todas las columnas de esa fila juntas.

= A1 y B1 y C1 y D1 y E1

En mi ejemplo a continuación, tengo datos en las columnas A a F. Sin embargo, la primera columna es un número de identificación, por lo que excluyo eso de mi fórmula a continuación. Asegúrese de incluir todas las columnas que tienen datos en los que desea verificar si hay duplicados.

Puse esa fórmula en la columna H y luego la arrastré hacia abajo para todas mis filas. Esta fórmula simplemente combina todos los datos de cada columna como una gran pieza de texto. Ahora, salte un par de columnas más e ingrese la siguiente fórmula:

= COUNTIF ($ H $ 1: $ H $ 34, $ H1)> 1

Aquí estamos usando la función COUNTIF y el primer parámetro es el conjunto de datos que queremos ver. Para mí, esta fue la columna H (que tiene la fórmula de combinación de datos) de la fila 1 a la 34. También es una buena idea deshacerse de la fila del encabezado antes de hacer esto.

También querrá asegurarse de usar el signo de dólar ($) delante de la letra y el número. Si tiene 1000 filas de datos y su fórmula de fila combinada está en la columna F, por ejemplo, su fórmula se vería así:

= COUNTIF ($ F $ 1: $ F $ 1000, $ F1)> 1

El segundo parámetro solo tiene el signo de dólar delante de la letra de la columna, por lo que está bloqueado, pero no queremos bloquear el número de fila. De nuevo, arrastrará esto hacia abajo para todas sus filas de datos. Debería verse así y las filas duplicadas deberían tener VERDADERO en ellas.

Ahora, vamos a resaltar las filas que tienen VERDADERO en ellas ya que esas son las filas duplicadas. Primero, seleccione la hoja de trabajo completa de datos haciendo clic en el pequeño triángulo en la intersección superior izquierda de filas y columnas. Ahora ve a la pestaña Inicio, luego haz clic en Formato condicional y haga clic en Nueva regla.

En el diálogo, haga clic en Usa una fórmula para determinar qué celdas formatear.

En la caja debajo Formato de valores donde esta fórmula es verdadera:, ingrese la siguiente fórmula, reemplazando PAG con su columna que tiene los valores VERDADERO o FALSO. Asegúrese de incluir el signo de dólar delante de la letra de la columna.

= $ P1 = VERDADERO

Una vez que haya hecho eso, haga clic en Formato y haga clic en la pestaña Rellenar. Elija un color y se usará para resaltar toda la fila duplicada. Haga clic en Aceptar y ahora debería ver que las filas duplicadas están resaltadas.

Si esto no funcionó para ti, vuelve a empezar y hazlo de nuevo lentamente. Debe hacerse exactamente para que todo esto funcione. Si pierde un solo símbolo $ en el camino, no funcionará correctamente.

Advertencias con la eliminación de registros duplicados

Por supuesto, existen algunos problemas para permitir que Excel elimine automáticamente los registros duplicados. Primero, debe tener cuidado de elegir muy pocas o demasiadas columnas para que Excel las utilice como criterio para identificar registros duplicados.

Muy pocos y puede borrar inadvertidamente los registros que necesite. Demasiado o incluyendo una columna de identificador por accidente y no se encontrarán duplicados.

En segundo lugar, Excel siempre asume que el primer registro único que aparece es el registro maestro. Se asume que todos los registros subsiguientes son duplicados. Esto es un problema si, por ejemplo, no pudo modificar una dirección de una de las personas en su archivo, sino que creó un nuevo registro.

Si el nuevo registro de dirección (correcto) aparece después del registro antiguo (desactualizado), Excel asumirá que el primer registro (desactualizado) será el maestro y eliminará cualquier registro posterior que encuentre. Esta es la razón por la que debe tener cuidado con lo liberal o conservador que le permite a Excel decidir qué es o no un registro duplicado.

Para esos casos, debe usar el método de duplicar resaltado que escribí y eliminar manualmente el registro duplicado apropiado.

Finalmente, Excel no le pide que verifique si realmente desea eliminar un registro. Usando los parámetros que elija (columnas), el proceso está completamente automatizado. Esto puede ser peligroso cuando tiene una gran cantidad de registros y confía en que las decisiones que tomó fueron correctas y le permite a Excel eliminar automáticamente los registros duplicados para usted.

Además, asegúrese de consultar nuestro artículo anterior sobre la eliminación de líneas en blanco en Excel. ¡Disfrutar!