01 trên 02
Loại bỏ bản ghi dữ liệu trùng lặp trong Excel
Các chương trình bảng tính như Excel thường được sử dụng làm cơ sở dữ liệu cho những thứ như phần kiểm kê, hồ sơ bán hàng và danh sách gửi thư.
Cơ sở dữ liệu trong Excel bao gồm các bảng dữ liệu thường được tổ chức thành các hàng dữ liệu được gọi là các bản ghi.
Trong một bản ghi, dữ liệu trong mỗi ô hoặc trường trong hàng có liên quan - chẳng hạn như tên, địa chỉ và số điện thoại của công ty.
Một vấn đề thường gặp xảy ra khi cơ sở dữ liệu tăng kích thước là bản ghi trùng lặp hoặc hàng dữ liệu.
Sự trùng lặp này có thể xảy ra nếu:
- Toàn bộ các bản ghi được nhập vào cơ sở dữ liệu nhiều hơn một lần dẫn đến hai hoặc nhiều bản ghi giống hệt nhau
- Nhiều bản ghi có một hoặc nhiều trường - chẳng hạn như tên và địa chỉ - chứa cùng một dữ liệu.
Dù bằng cách nào, bản ghi trùng lặp có thể gây ra toàn bộ sự cố - chẳng hạn như gửi nhiều bản sao tài liệu tới cùng một người khi thông tin cơ sở dữ liệu được sử dụng trong quá trình hợp nhất thư - vì vậy, nên quét và loại bỏ các bản ghi trùng lặp thường xuyên nền tảng.
Và trong khi dễ dàng chọn ra các bản ghi trùng lặp trong một mẫu nhỏ như trong hình ở trên, các bảng dữ liệu có thể dễ dàng chứa hàng trăm nếu không phải hàng nghìn hồ sơ gây khó khăn cho việc chọn ra các bản ghi trùng lặp.
Để làm cho việc thực hiện nhiệm vụ này dễ dàng hơn, Excel có một công cụ dữ liệu tích hợp được gọi là, không đáng ngạc nhiên, loại bỏ các bản sao , có thể được sử dụng để tìm và loại bỏ các bản ghi trùng khớp cũng như khớp một phần.
Tuy nhiên, cách công cụ Loại bỏ trùng lặp được thiết kế, các bản ghi trùng khớp và khớp một phần phải được xử lý riêng.
Điều này là do hộp thoại Loại bỏ trùng lặp hiển thị tên trường cho bảng dữ liệu đã chọn và bạn chọn trường cần bao gồm trong tìm kiếm bản ghi khớp:
- Đối với các bản ghi giống nhau, hãy tìm kiếm tất cả các trường - để lại dấu kiểm bên cạnh tất cả các tên cột hoặc trường;
- Đối với các bản ghi khớp một phần - hãy để dấu kiểm bên cạnh chỉ những trường cần khớp.
Tên trường so với chữ cái cột
Như đã đề cập, công cụ Remove Duplicates bao gồm một hộp thoại nơi bạn chọn các trường phù hợp để tìm kiếm bằng cách kiểm tra các tên trường hoặc cột mong muốn.
Thông tin mà hộp thoại hiển thị - tên trường hoặc chữ cái cột - phụ thuộc vào việc liệu dữ liệu của bạn có chứa một hàng tiêu đề - hay tiêu đề - ở đầu bảng dữ liệu như được thấy trong hình trên.
Nếu có - hãy đảm bảo tùy chọn ở phía bên tay phải của hộp thoại - Dữ liệu của tôi có tiêu đề - được chọn và Excel sẽ hiển thị tên trong hàng này dưới dạng tên trường trong hộp thoại.
Nếu dữ liệu của bạn không có hàng tiêu đề, hộp thoại sẽ hiển thị các chữ cái cột thích hợp trong hộp thoại cho phạm vi dữ liệu đã chọn.
Phạm vi dữ liệu liền kề
Để công cụ Remove Duplicates hoạt động đúng, bảng dữ liệu phải là một dải dữ liệu liền kề - nghĩa là nó không có bất kỳ hàng trống, cột nào và nếu có thể, không có ô trống nào nằm trong bảng.
Không có khoảng trống trong bảng dữ liệu là một thực hành tốt khi nói đến quản lý dữ liệu nói chung và không chỉ khi tìm kiếm dữ liệu trùng lặp. Các công cụ dữ liệu khác của Excel - chẳng hạn như sắp xếp và lọc - hoạt động tốt nhất khi bảng dữ liệu là một dải dữ liệu liền kề nhau.
Xóa ví dụ bản ghi dữ liệu trùng lặp
Trong hình trên, bảng dữ liệu chứa hai bản ghi giống hệt nhau cho A. Thompson và hai bản ghi khớp một phần cho R. Holt - nơi tất cả các trường khớp với số học sinh.
Các bước được liệt kê bên dưới nêu chi tiết cách sử dụng công cụ Xóa dữ liệu trùng lặp để:
- Loại bỏ thứ hai của hai hồ sơ giống hệt nhau cho A. Thompson.
- Loại bỏ bản ghi khớp thứ hai một phần cho R. Holt.
Mở hộp thoại loại bỏ trùng lặp
- Nhấp vào bất kỳ ô nào chứa dữ liệu trong cơ sở dữ liệu mẫu.
- Nhấp vào tab Dữ liệu trên ruy-băng.
- Nhấp vào biểu tượng Xóa bản sao để đánh dấu tất cả dữ liệu trong bảng dữ liệu và để mở hộp thoại Xóa các mục trùng lặp .
- Hộp thoại Remove Duplicates hiển thị tất cả các tiêu đề cột hoặc tên trường từ mẫu dữ liệu của chúng tôi
- Dấu kiểm bên cạnh tên trường cho biết cột Excel sẽ cố gắng khớp trong khi tìm kiếm bản ghi trùng lặp
- Theo mặc định, khi hộp thoại mở tất cả các tên trường được chọn tắt
Tìm bản ghi giống hệt nhau
- Vì chúng tôi đang tìm kiếm các bản ghi hoàn toàn giống hệt nhau trong ví dụ này, chúng tôi sẽ để lại tất cả các tiêu đề cột được chọn
- Nhấp vào OK
Tại thời điểm này, bạn sẽ thấy các kết quả sau:
- Hộp thoại sẽ đóng và được thay thế bằng một thông báo cho biết: tìm thấy và xóa 1 giá trị trùng lặp; 7 giá trị duy nhất vẫn còn.
- Hàng có chứa bản sao A. Bản ghi Thompson sẽ bị xóa khỏi cơ sở dữ liệu
- Mặc dù có hai bản ghi đối sánh một phần cho R. Holt, vì không phải tất cả các trường đều khớp nhau - số học sinh của hai bản ghi khác nhau - Excel coi đó là bản ghi dữ liệu duy nhất
02 trên 02
Tìm và loại bỏ các bản ghi trùng khớp một phần với Xóa các bản sao
Kiểm tra một trường tại một thời điểm
Vì Excel chỉ xóa các bản ghi dữ liệu khớp chính xác cho các trường dữ liệu đã chọn, cách tốt nhất để tìm tất cả các bản ghi dữ liệu khớp một phần là xóa dấu kiểm chỉ cho một trường tại một thời điểm, như được thực hiện trong các bước dưới đây.
Các tìm kiếm tiếp theo cho các bản ghi khớp với tất cả các trường ngoại trừ tên, tuổi hoặc chương trình sẽ xóa tất cả các kết hợp có thể cho các bản ghi khớp một phần.
Tìm bản ghi khớp một phần
- Nhấp vào bất kỳ ô nào chứa dữ liệu trong bảng dữ liệu nếu cần
- Nhấp vào tab Dữ liệu trên ruy-băng .
- Nhấp vào biểu tượng Xóa bản sao để đánh dấu tất cả dữ liệu trong bảng dữ liệu và để mở hộp thoại Xóa các mục trùng lặp .
- Tất cả các tên trường hoặc tiêu đề cột cho bảng dữ liệu được chọn.
- Để tìm và xóa các bản ghi không có kết quả phù hợp trong mọi trường, hãy xóa dấu kiểm bên cạnh các tên trường mà Excel sẽ bỏ qua.
- Đối với ví dụ này, nhấp vào hộp kiểm bên cạnh tiêu đề cột ID sinh viên để xóa dấu kiểm.
- Excel bây giờ sẽ chỉ tìm kiếm và xóa các bản ghi có dữ liệu phù hợp trong các trường Họ , Tên , và Chương trình .
- Nhấp vào OK
- Hộp thoại sẽ đóng và được thay thế bằng một thông báo cho biết: tìm thấy và xóa 1 giá trị trùng lặp; 6 giá trị duy nhất vẫn còn.
- Hàng có chứa bản ghi thứ hai cho R. Holt với ID sinh viên của ST348-252 sẽ bị xóa khỏi cơ sở dữ liệu.
- Nhấp vào OK để đóng hộp tin nhắn
Tại thời điểm này, bảng dữ liệu ví dụ sẽ không có tất cả dữ liệu trùng lặp.