برای اینکه صفحه HTML صحیح نمایش داده شود، مرورگر وب باید بداند که آن صفحه از چه مجموعه کاراکتری (character set) استفاده کرده است.
HTML Encoding چیست؟
ASCII اولین Character Encoding استاندارد بود. ASCII دارای 128 کاراکتر الفبایی بود که میتوانست در اینترنت مورد استفاده قرار گیرد: اعداد (0 تا 9)، حروف انگلیسی (A تا Z)، برخی کاراکتر های خاص مثل ! $ + - ( ) @ < >.
ISO-8859-1 اولین مجوعه کاراکتر (character set) پیش فرض برای HTML 4 بود. این مجموعه کاراکتر از 256 کد کاراکترهای مختلف پشتیبانی میکرد.
ANSI (Windows-1252) مجموعه کاراکتر اوریجینال ویندوزی بود. ANSI مثل ISO-8859-1 بود، با این تفاوت که ANSI، 32 کاراکتر اضافه تر داشت.
از آنجایی که ANSI و ISO-8859-1 مثل هم بودند، HTML 4 از UTF-8 نیز پشتیبانی میکرد.
UTF-8 مجموعه کاراکتر پیش فرض HTML 5 است. این مجموعه کاراکتر تقریبا تمامی کارکترها و سمبل ها در جهان را پوشش میدهد.
اتریبیوت charset
برای اینکه صفحه HTML صحیح نمایش داده شود، مرورگر وب باید بداند که آن صفحه از چه مجموعه کاراکتری (character set) استفاده کرده است. اینکار با تگ انجام میشود.
<meta charset="UTF-8">