Các khóa ứng cử viên cơ sở dữ liệu đôi khi trở thành khóa chính
Một khóa ứng cử viên là một sự kết hợp các thuộc tính có thể được sử dụng duy nhất để xác định một bản ghi cơ sở dữ liệu mà không đề cập đến bất kỳ dữ liệu nào khác. Mỗi bảng có thể có một hoặc nhiều ứng cử viên. Một trong các khóa ứng cử viên này được chọn làm khóa chính của bảng. Một bảng chỉ chứa một khóa chính, nhưng nó có thể chứa một số khóa ứng cử viên. Nếu một khóa ứng viên gồm có hai hoặc nhiều cột, thì nó được gọi là khóa tổng hợp.
Thuộc tính của Khóa Ứng viên
Tất cả các khóa ứng viên đều có một số thuộc tính chung. Một trong các thuộc tính là trong suốt vòng đời của khóa ứng cử viên, thuộc tính được sử dụng để nhận dạng phải giữ nguyên. Khác là giá trị không thể rỗng. Cuối cùng, khóa ứng cử viên phải là duy nhất.
Ví dụ: để nhận dạng duy nhất mỗi nhân viên, một công ty có thể sử dụng số An Sinh Xã Hội của nhân viên. Như bạn có thể thấy, có những người có cùng tên, họ và vị trí, nhưng không có hai người nào có cùng số An sinh Xã hội.
Số an sinh xã hội | Tên đầu tiên | Họ | Chức vụ |
---|---|---|---|
123-45-6780 | Craig | Jones | Giám đốc |
234-56-7890 | Craig | Beal | Liên kết |
345-67-8900 | Sandra | Beal | Giám đốc |
456-78-9010 | Trina | Jones | Liên kết |
567-89-0120 | Sandra | thợ rèn | Liên kết |
Ví dụ về khóa ứng cử viên
Một số loại dữ liệu dễ dàng tự cho vay như ứng viên:
- Số sách chuẩn quốc tế — ISBN xác định duy nhất sách và phương tiện có liên quan. Việc phát hành ISBN được quản lý chặt chẽ bởi những người giữ cửa trong ngành và ISBN thường không bao giờ được nhà xuất bản sử dụng lại.
- Số tài khoản ngân hàng — Hầu hết các ngân hàng không tái chế số tài khoản.
- Số sê-ri — Mặc dù số sê-ri không bị chi phối giữa các ngành, trong bối cảnh của một nhà cung cấp duy nhất, một số sê-ri phải luôn là duy nhất.
- Số giấy phép lái xe — Thông thường, những con số này không bị trùng lặp. Tuy nhiên, một người di chuyển từ tiểu bang này sang tiểu bang khác có thể có nhiều hơn một số DL.
- ID nhà cung cấp quốc gia — Các bác sĩ và các nhà cung cấp dịch vụ y tế được cấp phép khác đều có ít nhất một NPI duy nhất cho họ, do Bộ Y tế và Dịch vụ Nhân sinh Hoa Kỳ cấp.
Tuy nhiên, một số loại thông tin có vẻ như ứng cử viên tốt thực sự chứng minh có vấn đề:
- Số điện thoại — Hầu hết các nhà cung cấp dịch vụ đều tái chế số điện thoại và thuê bao cá nhân có thể có nhiều số điện thoại cùng một lúc.
- Mã giá phổ biến — UPC là duy nhất, nhưng chủ sở hữu khối UPC có thể tái chế sản phẩm theo ý muốn.
- Số hồ sơ y tế — MRN thường được cấp ở cấp bệnh viện, không có bất kỳ hướng dẫn quốc gia nào về
- Số an sinh xã hội — Mặc dù chúng độc đáo về mặt lý thuyết, các SSN được tái chế và gian lận SSN là đủ phổ biến để làm cho số nhận dạng này có vấn đề trên các tập dữ liệu lớn. (Trong bối cảnh chủ sử dụng lao động xác minh SSN, thách thức này không phải là vấn đề.)