Skip to main content

Удаление повторяющихся строк данных в Excel

Удаление дубликатов в Excel (Апрель 2025)

Удаление дубликатов в Excel (Апрель 2025)
Anonim
01 из 02

Удаление повторяющихся записей данных в Excel

Программы электронных таблиц, такие как Excel, часто используются в качестве баз данных для таких вещей, как запасы товаров, записи о продажах и списки рассылки.

Базы данных в Excel состоят из таблиц данных, которые обычно упорядочиваются в строки данных, называемых записями.

В записи данные в каждой ячейке или поле в строке связаны - например, имя компании, адрес и номер телефона.

Общая проблема, возникающая по мере роста базы данных, - это проблема дублирования записей или строк данных.

Это дублирование может произойти, если:

  • Целые записи вводятся в базу данных более одного раза, что приводит к двум или более идентичным записям
  • Несколько записей содержат одно или несколько полей - например, имя и адрес - содержащие одни и те же данные.

В любом случае дублирующиеся записи могут вызвать целый ряд проблем - например, рассылка нескольких копий документов тому же человеку, когда информация о базе данных используется при слиянии почты, поэтому рекомендуется проверять и удалять повторяющиеся записи на регулярной основа.

И хотя легко выбрать дубликаты записей в небольшом экземпляре, подобном изображенному на изображении выше, таблицы данных могут содержать сотни, если не тысячи записей, что затрудняет выбор дублирующих записей - особенно частично соответствующих записей.

Чтобы упростить выполнение этой задачи, Excel имеет встроенный инструмент данных, называемый, что неудивительно, Удалить дубликаты, который может использоваться для поиска и удаления идентичных, а также частично совпадающих записей.

Однако, как Удалить дубликаты инструмент разработан, идентичные и частично соответствующие записи должны рассматриваться отдельно.

Это связано с тем, что Удалить дубликаты диалоговое окно отображает имена полей для выбранной таблицы данных и вы выбираете, какие поля следует включать в поиск соответствующих записей:

  • Для идентичных записей найдите все поля - оставьте отметки рядом со всеми именами столбцов или полей;
  • Для частично совпадающих записей - отметьте галочки рядом только с полями, которые должны быть сопоставлены.

Имена полей и столбцов

Как уже упоминалось, Удалить дубликаты инструмент состоит из диалогового окна, в котором вы выбираете, какие соответствующие поля искать, проверяя нужные имена полей или столбцов.

Информация, отображаемая диалоговым окном - имена полей или буквы столбцов, зависит от того, содержит ли ваши данные ряд заголовков - или заголовки - в верхней части таблицы данных, как показано на изображении выше.

Если это так - убедитесь, что параметр в правой части диалогового окна - У моих данных есть заголовки - отключен, и Excel отобразит имена в этой строке как имена полей в диалоговом окне.

Если ваши данные не имеют строки заголовка, диалоговое окно отобразит соответствующие столбцы в диалоговом окне для выбранного диапазона данных.

Непрерывный диапазон данных

Для Удалить дубликаты инструмент для правильной работы, таблица данных должна быть непрерывным диапазоном данных - то есть она не должна содержать пустых строк, столбцов и, если вообще возможно, пустых ячеек, расположенных внутри таблицы.

Отсутствие пробелов в таблице данных является хорошей практикой, когда дело касается управления данными в целом, а не только при поиске дубликатов данных. Другие инструменты данных Excel, такие как сортировка и фильтрация, лучше всего работают, когда таблица данных является непрерывным диапазоном данных.

Удаление примера дублирования данных

На изображении выше таблица данных содержит две идентичные записи для А. Томпсон и две частично совпадающие записи для Р. Холт - где все поля совпадают, кроме номера ученика.

В приведенных ниже шагах подробно описано, как использовать Удалить дубликаты инструмент данных для:

  1. Удалите вторую из двух идентичных записей для А. Томпсон .
  2. Удалите вторую частично совпадающую запись для Р. Холт .

Открытие диалогового окна «Удалить дубликаты»

  1. Нажмите на любую ячейку, содержащую данные в образце базы данных.
  2. Нажмите Данные на ленте.
  3. Нажми на Удалить дубликаты , чтобы выделить все данные в таблице данных и открыть Удалить дубликаты диалоговое окно.
  4. Удалить дубликаты диалоговое окно отображает все заголовки столбцов или имена полей из нашего образца данных
  5. Флажки рядом с именами полей указывают, какие столбцы Excel будут пытаться сопоставить при поиске дубликатов записей
  6. По умолчанию при открытии диалогового окна все имена полей будут удалены

Поиск идентичных записей

  1. Поскольку мы ищем полностью идентичные записи в этом примере, мы оставим все заголовки столбцов
  2. Нажмите Хорошо

На этом этапе следует увидеть следующие результаты:

  • Диалоговое окно должно быть закрыто и заменено сообщением: 1 найденные и удаленные повторяющиеся значения; Осталось 7 уникальных значений.
  • Строка, содержащая дубликат А. Томпсон запись будет удалена из базы данных
  • Несмотря на то, что имеются две частично совпадающие записи для Р. Хол t, потому что не все сопоставленные поля - номер студента для двух записей отличается - Excel считает уникальную запись данных
02 из 02

Поиск и удаление частично совпадающих записей с удалением дубликатов

Проверка одного поля за раз

Поскольку Excel только удаляет записи данных, которые точно соответствуют выбранным полям данных, наилучшим способом поиска всех частично совпадающих записей данных является удаление галочки только для одного поля за раз, как это делается на следующих этапах.

Последующие поиски записей, которые совпадают во всех полях, кроме имени, возраста или программы, удаляют все возможные комбинации для частично совпадающих записей.

Поиск частично согласованных записей

  1. В случае необходимости нажмите на любую ячейку, содержащую данные в таблице данных
  2. Нажмите Данные на ленте.
  3. Нажми на Удалить дубликаты , чтобы выделить все данные в таблице данных и открыть Удалить дубликаты диалоговое окно.
  4. Выбраны все имена полей или заголовки столбцов для таблицы данных.
  5. Чтобы найти и удалить записи, которые не имеют соответствия в каждом поле, удалите галочку помимо тех имен полей, которые должен игнорировать Excel.
  6. В этом примере установите флажок рядом с Студенческий билет чтобы удалить галочку.
  7. Теперь Excel будет искать и удалять записи, имеющие соответствующие данные в Фамилия , начальный , а также программа поля.
  8. Нажмите Хорошо
  9. Диалоговое окно должно быть закрыто и заменено сообщением: 1 найденные и удаленные повторяющиеся значения; Осталось 6 уникальных значений.
  10. Строка, содержащая вторую запись для Р. Холт с идентификатором студента ST348-252 будут удалены из базы данных.
  11. Нажмите Хорошо закрыть окно сообщения

На этом этапе таблица данных примеров должна быть свободной от всех повторяющихся данных.