Ngôn ngữ đánh dấu là gì?

Khi bạn bắt đầu khám phá thế giới thiết kế web, chắc chắn bạn sẽ được giới thiệu một số từ và cụm từ mới mẻ đối với bạn. Một trong những thuật ngữ mà bạn có thể sẽ nghe là "đánh dấu" hoặc có thể là "ngôn ngữ đánh dấu". Cách "đánh dấu" khác với "mã" và tại sao một số chuyên gia web dường như sử dụng các thuật ngữ này thay thế cho nhau? Hãy bắt đầu bằng cách xem chính xác "ngôn ngữ đánh dấu" là gì.

Hãy xem 3 ngôn ngữ đánh dấu

Gần như tất cả các từ viết tắt trên Web có một "ML" trong nó là một "ngôn ngữ đánh dấu" (ngạc nhiên lớn, đó là những gì "ML" là viết tắt của). Ngôn ngữ đánh dấu là các khối xây dựng được sử dụng để tạo các trang web hoặc tất cả các hình dạng và kích cỡ.

Trên thực tế, có nhiều ngôn ngữ đánh dấu khác nhau trên thế giới. Đối với thiết kế và phát triển web, có ba ngôn ngữ đánh dấu cụ thể mà bạn có thể sẽ gặp phải. Đây là HTML, XML và XHTML .

Ngôn ngữ đánh dấu là gì?

Để xác định đúng thuật ngữ này - một ngôn ngữ đánh dấu là một ngôn ngữ chú thích văn bản để máy tính có thể thao tác văn bản đó. Hầu hết các ngôn ngữ đánh dấu đều có thể đọc được bởi vì các chú thích được viết theo cách để phân biệt chúng với chính văn bản. Ví dụ, với HTML, XML và XHTML, các thẻ đánh dấu là . Bất kỳ văn bản nào xuất hiện trong một trong các ký tự đó đều được coi là một phần của ngôn ngữ đánh dấu và không phải là một phần của văn bản được chú thích.

Ví dụ:


Đây là một đoạn văn bản được viết bằng HTML

Ví dụ này là một đoạn HTML. Nó được tạo thành từ một thẻ mở (

), một thẻ đóng () và văn bản thực sự sẽ được hiển thị trên màn hình (đây là văn bản chứa giữa hai thẻ). Mỗi thẻ bao gồm ký hiệu "nhỏ hơn" và "lớn hơn" để chỉ định nó như một phần của đánh dấu.

Khi bạn định dạng văn bản được hiển thị trên máy tính hoặc màn hình thiết bị khác , bạn cần phân biệt giữa văn bản và hướng dẫn cho văn bản. "Đánh dấu" là hướng dẫn hiển thị hoặc in văn bản.

Đánh dấu không phải là máy tính có thể đọc được. Chú thích được thực hiện trong bản in hoặc trong một cuốn sách cũng được coi là đánh dấu. Ví dụ, nhiều học sinh trong trường sẽ nêu bật một số cụm từ nhất định trong sách giáo khoa của họ. Điều này cho biết rằng văn bản được đánh dấu quan trọng hơn văn bản xung quanh. Màu đánh dấu được coi là đánh dấu.

Đánh dấu trở thành ngôn ngữ khi quy tắc được mã hóa về cách viết và sử dụng đánh dấu đó. Cùng một học sinh đó có thể có "ngôn ngữ đánh dấu ghi chú" của riêng mình nếu chúng được mã hóa các quy tắc như "highlighter màu tím cho các định nghĩa, highlighter màu vàng là chi tiết kỳ thi, và ghi chú bút chì trong lề là cho các nguồn lực bổ sung."

Hầu hết các ngôn ngữ đánh dấu được xác định bởi một cơ quan bên ngoài để sử dụng bởi nhiều người khác nhau. Đây là cách ngôn ngữ đánh dấu cho Web hoạt động. Chúng được xác định bởi W3C, hoặc World Wide Web Consortium .

HTML — Ngôn ngữ đánh dấu siêu văn bản

Ngôn ngữ đánh dấu HTML hoặc HyperText là ngôn ngữ chính của Web và ngôn ngữ phổ biến nhất mà bạn sẽ làm việc với tư cách là nhà thiết kế web / nhà phát triển.

Trong thực tế, nó có thể là ngôn ngữ đánh dấu duy nhất bạn sử dụng trong công việc của bạn.

Tất cả các trang web được viết bằng một hương vị của HTML. HTML xác định cách hình ảnh , đa phương tiện và văn bản được hiển thị trong trình duyệt web. Ngôn ngữ này bao gồm các yếu tố để kết nối tài liệu của bạn (siêu văn bản) và làm cho tài liệu web của bạn tương tác (chẳng hạn như với biểu mẫu). Nhiều người gọi HTML là "mã trang web", nhưng trong thực tế, nó thực sự chỉ là một ngôn ngữ đánh dấu. Không hạn nào là sai và bạn sẽ nghe mọi người, kể cả các chuyên gia web, sử dụng hai thuật ngữ này thay thế cho nhau.

HTML là ngôn ngữ đánh dấu chuẩn được xác định. Nó dựa trên SGML (Ngôn ngữ đánh dấu tổng quát chuẩn).

Nó là một ngôn ngữ sử dụng thẻ để xác định cấu trúc của văn bản của bạn. Các phần tử và thẻ được xác định bởi ký tự .

Mặc dù HTML là ngôn ngữ đánh dấu phổ biến nhất được sử dụng trên Web hiện nay, nhưng nó không phải là lựa chọn duy nhất để phát triển web. Khi HTML được phát triển, ngày càng phức tạp và các thẻ kiểu và nội dung được kết hợp thành một ngôn ngữ. Cuối cùng, W3C quyết định rằng cần phải tách biệt giữa kiểu trang web và nội dung. Thẻ chỉ định nội dung một mình sẽ vẫn còn trong HTML trong khi các thẻ xác định kiểu không được sử dụng để ủng hộ CSS (Cascading Style Sheets).

Phiên bản HTML được đánh số mới nhất là HTML5. Phiên bản này đã thêm nhiều tính năng hơn vào HTML và loại bỏ một số mức độ nghiêm ngặt đã được áp đặt bởi XHTML (nhiều hơn về ngôn ngữ đó ngay).

Cách mà HTML được phát hành đã bị thay đổi với sự gia tăng của HTML5. Ngày nay, các tính năng và thay đổi mới được thêm vào mà không cần phải có phiên bản mới, được đánh số được phát hành. Phiên bản mới nhất của ngôn ngữ được gọi đơn giản là "HTML".

XML — Ngôn ngữ đánh dấu eXtensible

Ngôn ngữ đánh dấu eXtensible là ngôn ngữ mà một phiên bản khác của HTML được dựa trên. Giống như HTML, XML cũng dựa trên SGML. Nó ít nghiêm ngặt hơn SGML và nghiêm ngặt hơn HTML thuần túy. XML cung cấp khả năng mở rộng để tạo nhiều ngôn ngữ khác nhau.

XML là ngôn ngữ để viết các ngôn ngữ đánh dấu. Ví dụ, nếu bạn đang làm việc trên phả hệ, bạn có thể tạo các thẻ bằng cách sử dụng XML để định nghĩa cha, mẹ, con gái và con trai trong XML của bạn như thế này: .

Ngoài ra còn có một số ngôn ngữ được chuẩn hóa đã được tạo bằng XML: MathML để xác định toán học, SMIL để làm việc với đa phương tiện, XHTML và nhiều ngôn ngữ khác.

Ngôn ngữ đánh dấu siêu văn bản XHTML — eXtended

XHTML 1.0 là HTML 4.0 được định nghĩa lại để đáp ứng tiêu chuẩn XML . XHTML đã được thay thế trong thiết kế web hiện đại với HTML5 và những thay đổi đã đến từ đó. Bạn không thể tìm thấy bất kỳ trang web mới nào sử dụng XHTML, nhưng nếu bạn đang làm việc trên một trang web cũ hơn nhiều, bạn vẫn có thể gặp phải XHTML ở đó trong tự nhiên.

Không có nhiều khác biệt lớn giữa HTML và XHTML , nhưng đây là những gì bạn sẽ thấy:

Bài báo gốc của Jennifer Krynin. Biên tập bởi Jeremy Girard vào 7/5/17.