DTD - Khối xây dựng XML
Các khối xây dựng chính của cả tài liệu XML và HTML đều là các phần tử.
Khối xây dựng của tài liệu XML
Nhìn từ quan điểm DTD, tất cả các tài liệu XML được tạo thành bởi các khối xây dựng sau:
- Các yếu tố
- Thuộc tính
- Thực thể
- PCDATA
- CDATA
Các yếu tố
Các phần tử là các khối xây dựng chính của cả tài liệu XML và HTML.
Ví dụ về các phần tử HTML là "body" và "table". Ví dụ về các phần tử XML có thể là "ghi chú" và "thông báo". Các phần tử có thể chứa văn bản, các phần tử khác hoặc để trống. Ví dụ về các phần tử HTML trống là "hr", "br" và "img".
Ví dụ:
<body>some text</body>
<message>some text</message>
Thuộc tính
Các thuộc tính cung cấp thêm thông tin về các phần tử .
Các thuộc tính luôn được đặt bên trong thẻ mở của một phần tử. Các thuộc tính luôn đi kèm với các cặp tên / giá trị. Phần tử "img" sau có thông tin bổ sung về tệp nguồn:
<img src="computer.gif" />
Tên của phần tử là "img". Tên của thuộc tính là "src". Giá trị của thuộc tính là "computer.gif". Vì bản thân phần tử trống nên nó được đóng bởi dấu "/".
Thực thể
Một số ký tự có ý nghĩa đặc biệt trong XML, chẳng hạn như dấu ít hơn (<) xác định phần bắt đầu của thẻ XML.
Hầu hết các bạn đều biết thực thể HTML: "& nbsp;". Thực thể "không ngắt khoảng cách" này được sử dụng trong HTML để chèn thêm một khoảng trống vào tài liệu. Các thực thể được mở rộng khi tài liệu được phân tích cú pháp bởi trình phân tích cú pháp XML.
Các thực thể sau được xác định trước trong XML:
Entity References | Character |
---|---|
< | < |
> | > |
& | & |
" | " |
' | ' |
PCDATA
PCDATA có nghĩa là dữ liệu ký tự được phân tích cú pháp.
Hãy nghĩ về dữ liệu ký tự như văn bản được tìm thấy giữa thẻ bắt đầu và thẻ kết thúc của một phần tử XML.
PCDATA là văn bản SẼ được phân tích bởi trình phân tích cú pháp . Văn bản sẽ được trình phân tích cú pháp kiểm tra các thực thể và đánh dấu .
Các thẻ bên trong văn bản sẽ được coi là đánh dấu và các thực thể sẽ được mở rộng.
Tuy nhiên, dữ liệu ký tự được phân tích cú pháp không được chứa bất kỳ ký tự &, <, hoặc> nào; những thứ này cần được đại diện bởi & amp; & lt; và & gt; các thực thể, tương ứng.
CDATA
CDATA có nghĩa là dữ liệu ký tự.
CDATA là văn bản sẽ KHÔNG được phân tích cú pháp bởi trình phân tích cú pháp . Các thẻ bên trong văn bản sẽ KHÔNG được coi là đánh dấu và các thực thể sẽ không được mở rộng.