Loại bỏ hàng trùng lặp dữ liệu trong Excel

01 trên 02

Loại bỏ bản ghi dữ liệu trùng lặp trong Excel

Loại bỏ các bản sao - Tìm kiếm bản ghi giống hệt nhau theo tên trường. © Ted Tiếng Pháp

Các chương trình bảng tính như Excel thường được sử dụng làm cơ sở dữ liệu cho những thứ như phần kiểm kê, hồ sơ bán hàng và danh sách gửi thư.

Cơ sở dữ liệu trong Excel bao gồm các bảng dữ liệu thường được tổ chức thành các hàng dữ liệu được gọi là các bản ghi.

Trong một bản ghi, dữ liệu trong mỗi ô hoặc trường trong hàng có liên quan - chẳng hạn như tên, địa chỉ và số điện thoại của công ty.

Một vấn đề thường gặp xảy ra khi cơ sở dữ liệu tăng kích thước là bản ghi trùng lặp hoặc hàng dữ liệu.

Sự trùng lặp này có thể xảy ra nếu:

Dù bằng cách nào, bản ghi trùng lặp có thể gây ra toàn bộ sự cố - chẳng hạn như gửi nhiều bản sao tài liệu tới cùng một người khi thông tin cơ sở dữ liệu được sử dụng trong quá trình hợp nhất thư - vì vậy, nên quét và loại bỏ các bản ghi trùng lặp thường xuyên nền tảng.

Và trong khi dễ dàng chọn ra các bản ghi trùng lặp trong một mẫu nhỏ như trong hình ở trên, các bảng dữ liệu có thể dễ dàng chứa hàng trăm nếu không phải hàng nghìn hồ sơ gây khó khăn cho việc chọn ra các bản ghi trùng lặp.

Để làm cho việc thực hiện nhiệm vụ này dễ dàng hơn, Excel có một công cụ dữ liệu tích hợp được gọi là, không đáng ngạc nhiên, loại bỏ các bản sao , có thể được sử dụng để tìm và loại bỏ các bản ghi trùng khớp cũng như khớp một phần.

Tuy nhiên, cách công cụ Loại bỏ trùng lặp được thiết kế, các bản ghi trùng khớp và khớp một phần phải được xử lý riêng.

Điều này là do hộp thoại Loại bỏ trùng lặp hiển thị tên trường cho bảng dữ liệu đã chọn và bạn chọn trường cần bao gồm trong tìm kiếm bản ghi khớp:

Tên trường so với chữ cái cột

Như đã đề cập, công cụ Remove Duplicates bao gồm một hộp thoại nơi bạn chọn các trường phù hợp để tìm kiếm bằng cách kiểm tra các tên trường hoặc cột mong muốn.

Thông tin mà hộp thoại hiển thị - tên trường hoặc chữ cái cột - phụ thuộc vào việc liệu dữ liệu của bạn có chứa một hàng tiêu đề - hay tiêu đề - ở đầu bảng dữ liệu như được thấy trong hình trên.

Nếu có - hãy đảm bảo tùy chọn ở phía bên tay phải của hộp thoại - Dữ liệu của tôi có tiêu đề - được chọn và Excel sẽ hiển thị tên trong hàng này dưới dạng tên trường trong hộp thoại.

Nếu dữ liệu của bạn không có hàng tiêu đề, hộp thoại sẽ hiển thị các chữ cái cột thích hợp trong hộp thoại cho phạm vi dữ liệu đã chọn.

Phạm vi dữ liệu liền kề

Để công cụ Remove Duplicates hoạt động đúng, bảng dữ liệu phải là một dải dữ liệu liền kề - nghĩa là nó không có bất kỳ hàng trống, cột nào và nếu có thể, không có ô trống nào nằm trong bảng.

Không có khoảng trống trong bảng dữ liệu là một thực hành tốt khi nói đến quản lý dữ liệu nói chung và không chỉ khi tìm kiếm dữ liệu trùng lặp. Các công cụ dữ liệu khác của Excel - chẳng hạn như sắp xếp và lọc - hoạt động tốt nhất khi bảng dữ liệu là một dải dữ liệu liền kề nhau.

Xóa ví dụ bản ghi dữ liệu trùng lặp

Trong hình trên, bảng dữ liệu chứa hai bản ghi giống hệt nhau cho A. Thompson và hai bản ghi khớp một phần cho R. Holt - nơi tất cả các trường khớp với số học sinh.

Các bước được liệt kê bên dưới nêu chi tiết cách sử dụng công cụ Xóa dữ liệu trùng lặp để:

  1. Loại bỏ thứ hai của hai hồ sơ giống hệt nhau cho A. Thompson.
  2. Loại bỏ bản ghi khớp thứ hai một phần cho R. Holt.

Mở hộp thoại loại bỏ trùng lặp

  1. Nhấp vào bất kỳ ô nào chứa dữ liệu trong cơ sở dữ liệu mẫu.
  2. Nhấp vào tab Dữ liệu trên ruy-băng.
  3. Nhấp vào biểu tượng Xóa bản sao để đánh dấu tất cả dữ liệu trong bảng dữ liệu và để mở hộp thoại Xóa các mục trùng lặp .
  4. Hộp thoại Remove Duplicates hiển thị tất cả các tiêu đề cột hoặc tên trường từ mẫu dữ liệu của chúng tôi
  5. Dấu kiểm bên cạnh tên trường cho biết cột Excel sẽ cố gắng khớp trong khi tìm kiếm bản ghi trùng lặp
  6. Theo mặc định, khi hộp thoại mở tất cả các tên trường được chọn tắt

Tìm bản ghi giống hệt nhau

  1. Vì chúng tôi đang tìm kiếm các bản ghi hoàn toàn giống hệt nhau trong ví dụ này, chúng tôi sẽ để lại tất cả các tiêu đề cột được chọn
  2. Nhấp vào OK

Tại thời điểm này, bạn sẽ thấy các kết quả sau:

02 trên 02

Tìm và loại bỏ các bản ghi trùng khớp một phần với Xóa các bản sao

Xóa các bản sao - Tìm kiếm các bản ghi khớp một phần theo tên trường. © Ted Tiếng Pháp

Kiểm tra một trường tại một thời điểm

Vì Excel chỉ xóa các bản ghi dữ liệu khớp chính xác cho các trường dữ liệu đã chọn, cách tốt nhất để tìm tất cả các bản ghi dữ liệu khớp một phần là xóa dấu kiểm chỉ cho một trường tại một thời điểm, như được thực hiện trong các bước dưới đây.

Các tìm kiếm tiếp theo cho các bản ghi khớp với tất cả các trường ngoại trừ tên, tuổi hoặc chương trình sẽ xóa tất cả các kết hợp có thể cho các bản ghi khớp một phần.

Tìm bản ghi khớp một phần

  1. Nhấp vào bất kỳ ô nào chứa dữ liệu trong bảng dữ liệu nếu cần
  2. Nhấp vào tab Dữ liệu trên ruy-băng .
  3. Nhấp vào biểu tượng Xóa bản sao để đánh dấu tất cả dữ liệu trong bảng dữ liệu và để mở hộp thoại Xóa các mục trùng lặp .
  4. Tất cả các tên trường hoặc tiêu đề cột cho bảng dữ liệu được chọn.
  5. Để tìm và xóa các bản ghi không có kết quả phù hợp trong mọi trường, hãy xóa dấu kiểm bên cạnh các tên trường mà Excel sẽ bỏ qua.
  6. Đối với ví dụ này, nhấp vào hộp kiểm bên cạnh tiêu đề cột ID sinh viên để xóa dấu kiểm.
  7. Excel bây giờ sẽ chỉ tìm kiếm và xóa các bản ghi có dữ liệu phù hợp trong các trường Họ , Tên , và Chương trình .
  8. Nhấp vào OK
  9. Hộp thoại sẽ đóng và được thay thế bằng một thông báo cho biết: tìm thấy và xóa 1 giá trị trùng lặp; 6 giá trị duy nhất vẫn còn.
  10. Hàng có chứa bản ghi thứ hai cho R. Holt với ID sinh viên của ST348-252 sẽ bị xóa khỏi cơ sở dữ liệu.
  11. Nhấp vào OK để đóng hộp tin nhắn

Tại thời điểm này, bảng dữ liệu ví dụ sẽ không có tất cả dữ liệu trùng lặp.