100% کامل شده تا

کدگذاری (مجموعهٔ کاراکترها در اچ‌تی‌ام‌ال)

از موتو کد، دانشنامهٔ برنامه‌نویسی


برای نمایش صحیح یک صفحه HTML، مرورگر باید بداند از کدام کاراکتر استفاده کند.


از ASCII تا UTF-8

ASCII اولین استاندارد کدگذاری کاراکترها بود. ASCII 128 کاراکتر الفبایی مختلف تعریف می‌کند که می‌توانند در اینترنت استفاده شوند: اعداد (9–0)، حروف انگلیسی (A-Z) و بعضی از کاراکترهای خاص مانند:  ! $ + - ( ) @ < > . [۱]

ISO-8859-1 مجموعه کاراکترهای پیش‌فرض برای HTML 4 بود. این مجموعه کاراکتر از 256 کد کاراکتر مختلف پشتیبانی می‌کند. HTML 4 همچنین از UTF-8 پشتیبانی می‌کند.

ANSI (Windows-1252) مجموعهٔ اصلی کاراکترهای ویندوز بود. ANSI شبیه ISO-8859-1 بود به جز اینکه ANSI دارای 32 کاراکتر اضافی است.

توانایی‌های HTML5 توانست توسعه دهندگان وب را تشویق کند تا از مجموعه کاراکترهای UTF-8 استفاده کنند که تقریباً تمام کاراکترها و نمادهای جهان را پوشش می‌دهد!



ویژگی charset در HTML

برای نمایش صحیح یک صفحه HTML، مرورگر وب باید مجموعه کاراکتر مورد استفاده در صفحه را بداند.

این مجموعه در برچسب <meta> مشخص می‌شود:

<meta charset="UTF-8">




تفاوت‌های بین مجموعه‌های کاراکتر

جدول زیر تفاوت‌های بین مجموعه کاراکترهای توصیف شده در بالا را نمایش می‌دهد:

عدد ASCII ANSI 8859 UTF-8 تعریف
32 فاصله (Space)
33 ! ! ! ! علامت تعجب (exclamation mark)
34 " " " " علامت نقل‌قول (quotation mark)
35 # # # # نماد عدد (number sign)
36 $ $ $ $ نماد دلار (dollar sign)
37 % % % % نماد درصد (percent sign)
38 & & & & امپرسند (Ampersand)
39 ' ' ' ' آپاستروفی (Apostrophe)
40 ( ( ( ( پرانتز چپ (left parenthesis )
41 ) ) ) ) پرانتز راست (right parenthesis)
42 * * * * ستاره (Asterisk)
43 + + + + نماد مثبت (plus sign)
44 , , , , ویرگول (Comma)
45 - - - - خط ربط - منفی (hyphen-minus)
46 . . . . نقطه (full stop)
47 / / / / ممیز (Solidus)
48 0 0 0 0 عدد صفر (digit zero)
49 1 1 1 1 عدد یک (digit one)
50 2 2 2 2 عدد دو (digit two)
51 3 3 3 3 عدد سه (digit three)
52 4 4 4 4 عدد چهار (digit four)
53 5 5 5 5 عدد پنج (digit five)
54 6 6 6 6 عدد شش (digit six)
55 7 7 7 7 عدد هفت (digit seven)
56 8 8 8 8 عدد هشت (digit eight)
57 9 9 9 9 عدد نه (digit nine)
58 : : : : دو نقطه (Colon)
59 ; ; ; ; نقطه ویرگول (Semicolon)
60 < < < < علامت کوچکتر (less-than sign)
61 = = = = علامت مساوی (equals sign)
62 > > > > علامت بزرگتر (greater-than sign)
63 ? ? ? ? علامت سؤال (question mark)
64 @ @ @ @ آت ساین (commercial at)
65 A A A A حرف بزرگ A (Latin capital letter A)
66 B B B B حرف بزرگ B (Latin capital letter B)
67 C C C C حرف بزرگ C (Latin capital letter C)
68 D D D D حرف بزرگ D (Latin capital letter D)
69 E E E E حرف بزرگ E (Latin capital letter E)
70 F F F F حرف بزرگ F (Latin capital letter F)
71 G G G G حرف بزرگ G (Latin capital letter G)
72 H H H H حرف بزرگ H (Latin capital letter H)
73 I I I I حرف بزرگ I (Latin capital letter I)
74 J J J J حرف بزرگJ (Latin capital letter J)
75 K K K K حرف بزرگ K (Latin capital letter K)
76 L L L L حرف بزرگ L (Latin capital letter L)
77 M M M M حرف بزرگ M (Latin capital letter M)
78 N N N N حرف بزرگ N (Latin capital letter N)
79 O O O O حرف بزرگ O (Latin capital letter O)
80 P P P P حرف بزرگ P (Latin capital letter P)
81 Q Q Q Q حرف بزرگ Q (Latin capital letter Q)
82 R R R R حرف بزرگ R (Latin capital letter R)
83 S S S S حرف بزرگ S (Latin capital letter S)
84 T T T T حرف بزرگ T (Latin capital letter T)
85 U U U U حرف بزرگ U (Latin capital letter U)
86 V V V V حرف بزرگ V (Latin capital letter V)
87 W W W W حرف بزرگ W (Latin capital letter W)
88 X X X X حرف بزرگ X (Latin capital letter X)
89 Y Y Y Y حرف بزرگ Y (Latin capital letter Y)
90 Z Z Z Z حرف بزرگ Z (Latin capital letter Z)
91 [ [ [ [ براکت چپ (left square bracket)
92 \ \ \ \ ممیز معکوس (reverse solidus)
93 ] ] ] ] براکت راسن (right square bracket)
94 ^ ^ ^ ^ کلاهک (circumflex accent)
95 _ _ _ _ زیر خط (low line)
96 ` ` ` ` grave accent
97 a a a a حرف کوچک لاتین a (Latin small letter a)
98 b b b b حرف کوچک لاتین b (Latin small letter b)
99 c c c c حرف کوچک لاتین c (Latin small letter c)
100 d d d d حرف کوچک لاتین d (Latin small letter d)
101 e e e e حرف کوچک لاتین e (Latin small letter e)
102 f f f f حرف کوچک لاتین f (Latin small letter f)
103 g g g g حرف کوچک لاتین g (Latin small letter g)
104 h h h h حرف کوچک لاتین h (Latin small letter h)
105 i i i i حرف کوچک لاتین i (Latin small letter i)
106 j j j j حرف کوچک لاتین j (Latin small letter j)
107 k k k k حرف کوچک لاتین k (Latin small letter k)
108 l l l l حرف کوچک لاتین l (Latin small letter l)
109 m m m m حرف کوچک لاتین m (Latin small letter m)
110 n n n n حرف کوچک لاتین n (Latin small letter n)
111 o o o o حرف کوچک لاتین o (Latin small letter o)
112 p p p p حرف کوچک لاتین p (Latin small letter p)
113 q q q q حرف کوچک لاتین q (Latin small letter q)
114 r r r r حرف کوچک لاتین r (Latin small letter r)
115 s s s s حرف کوچک لاتین s (Latin small letter s)
116 t t t t حرف کوچک لاتین t (Latin small letter t)
117 u u u u حرف کوچک لاتین u (Latin small letter u)
118 v v v v حرف کوچک لاتین v (Latin small letter v)
119 w w w w حرف کوچک لاتین w (Latin small letter w)
120 x x x x حرف کوچک لاتین x (Latin small letter x)
121 y y y y حرف کوچک لاتین y (Latin small letter y)
122 z z z z حرف کوچک لاتین z (Latin small letter z)
123 { { { { آکولاد چپ (left curly bracket)
124 | | | | خط عمودی (vertical line)
125 } } } } آکولاد راست (right curly bracket)
126 ~ ~ ~ ~ مدک (Tilde)
127 DEL
128 نماد یورو (euro sign)
129 استفاده نشده (NOT USED)
130 نقل‌قولی تکی (single low-9 quotation mark)
131 ƒ حرف لاتین کوچک f (Latin small letter f with hook)
132 علامت نقل‌قول دوتایی (double low-9 quotation mark)
133 سه نقطه (horizontal ellipsis)
134 خنجر (Dagger)
135 خنجر دوتایی (double dagger)
136 ˆ modifier letter circumflex accent
137 per mille sign
138 Š Latin capital letter S with caron
139 علامت نقل‌قول تکی اشاره به چپ (single left-pointing angle quotation mark)
140 ΠLatin capital ligature OE
141 NOT USED
142 Ž Latin capital letter Z with caron
143 NOT USED
144 NOT USED
145 علامت نقل‌قول تکی چپ (left single quotation mark)
146 علامت نقل‌قول تکی راسن (right single quotation mark)
147 علامت نقل‌قول دوتایی چپ (left double quotation mark)
148 علامت نقل‌قول دوتایی راست (right double quotation mark)
149 bullet
150 خط تیره (en dash)
151 em dash
152 ˜ small tilde
153 نماد علامت تجاری (trade mark sign)
154 š Latin small letter s with caron
155 علامت نقل‌قول تکی اشاره به راست (single right-pointing angle quotation mark)
156 œ Latin small ligature oe
157 NOT USED
158 ž Latin small letter z with caron
159 Ÿ Latin capital letter Y with diaeresis
160 no-break space
161 ¡ ¡ ¡ علامت تعجب معکوس (inverted exclamation mark)
162 ¢ ¢ ¢ نماد سنت (cent sign)
163 £ £ £ نماد پوند (pound sign)
164 ¤ ¤ ¤ نماد پول رایج (currency sign)
165 ¥ ¥ ¥ نماد یِن (yen sign)
166 ¦ ¦ ¦ خط شکسته (broken bar)
167 § § § نماد بخش (section sign)
168 ¨ ¨ ¨ دو نقطه (Diaeresis)
169 © © © علامت کپی‌رایت (copyright sign)
170 ª ª ª feminine ordinal indicator
171 « « « علامت نقل دوتایی اشاره به راست (left-pointing double angle quotation mark)
172 ¬ ¬ ¬ not sign
173 soft hyphen
174 ® ® ® علامت ثبت شده (registered sign)
175 ¯ ¯ ¯ macron
176 ° ° ° نماد درجه (degree sign)
177 ± ± ± نماد مثبت منفی (plus-minus sign)
178 ² ² ² بالانویس (توان) 2 (superscript two)
179 ³ ³ ³ بالانویس (توان) 3 (superscript three)
180 ´ ´ ´ acute accent
181 µ µ µ علامت میکرو (micro sign)
182 نماد پاراگراف (pilcrow sign)
183 · · · نقطه میانی (middle dot)
184 ¸ ¸ ¸ cedilla
185 ¹ ¹ ¹ بالانویس (توان) 1 (superscript one)
186 º º º masculine ordinal indicator
187 » » » علامت نقل‌قول دوتایی اشاره به راست (right-pointing double angle quotation mark)
188 ¼ ¼ ¼ کسری یک‌چهارم (vulgar fraction one quarter)
189 ½ ½ ½ کسری یک‌دوم (vulgar fraction one half)
190 ¾ ¾ ¾ کسری سه‌چهارم (vulgar fraction three quarters)
191 ¿ ¿ ¿ علامت سؤال معکوس (inverted question mark)
192 À À À حرف لاتین بزرگ A با grave (Latin capital letter A with grave)
193 Á Á Á حرف لاتین بزرگ A با پریم (Latin capital letter A with acute)
194 Â Â Â حرف لاتین بزرگ A با کلاهک (Latin capital letter A with circumflex)
195 Ã Ã Ã حرف لاتین بزرگ A با تیلده (Latin capital letter A with tilde)
196 Ä Ä Ä حرف لاتین بزرگ A با دو نقطه (Latin capital letter A with diaeresis)
197 Å Å Å حرف لاتین بزرگ A با یک حلقه (Latin capital letter A with ring above)
198 Æ Æ Æ Latin capital letter AE
199 Ç Ç Ç Latin capital letter C with cedilla
200 È È È Latin capital letter E with grave
201 É É É Latin capital letter E with acute
202 Ê Ê Ê Latin capital letter E with circumflex
203 Ë Ë Ë Latin capital letter E with diaeresis
204 Ì Ì Ì Latin capital letter I with grave
205 Í Í Í Latin capital letter I with acute
206 Î Î Î Latin capital letter I with circumflex
207 Ï Ï Ï Latin capital letter I with diaeresis
208 Ð Ð Ð Latin capital letter Eth
209 Ñ Ñ Ñ Latin capital letter N with tilde
210 Ò Ò Ò Latin capital letter O with grave
211 Ó Ó Ó Latin capital letter O with acute
212 Ô Ô Ô Latin capital letter O with circumflex
213 Õ Õ Õ Latin capital letter O with tilde
214 Ö Ö Ö Latin capital letter O with diaeresis
215 × × × multiplication sign
216 Ø Ø Ø Latin capital letter O with stroke
217 Ù Ù Ù Latin capital letter U with grave
218 Ú Ú Ú Latin capital letter U with acute
219 Û Û Û Latin capital letter U with circumflex
220 Ü Ü Ü Latin capital letter U with diaeresis
221 Ý Ý Ý Latin capital letter Y with acute
222 Þ Þ Þ Latin capital letter Thorn
223 ß ß ß Latin small letter sharp s
224 à à à Latin small letter a with grave
225 á á á Latin small letter a with acute
226 â â â Latin small letter a with circumflex
227 ã ã ã Latin small letter a with tilde
228 ä ä ä Latin small letter a with diaeresis
229 å å å Latin small letter a with ring above
230 æ æ æ Latin small letter ae
231 ç ç ç Latin small letter c with cedilla
232 è è è Latin small letter e with grave
233 é é é Latin small letter e with acute
234 ê ê ê Latin small letter e with circumflex
235 ë ë ë Latin small letter e with diaeresis
236 ì ì ì Latin small letter i with grave
237 í í í Latin small letter i with acute
238 î î î Latin small letter i with circumflex
239 ï ï ï Latin small letter i with diaeresis
240 ð ð ð Latin small letter eth
241 ñ ñ ñ Latin small letter n with tilde
242 ò ò ò Latin small letter o with grave
243 ó ó ó Latin small letter o with acute
244 ô ô ô Latin small letter o with circumflex
245 õ õ õ Latin small letter o with tilde
246 ö ö ö Latin small letter o with diaeresis
247 ÷ ÷ ÷ division sign
248 ø ø ø Latin small letter o with stroke
249 ù ù ù Latin small letter u with grave
250 ú ú ú Latin small letter u with acute
251 û û û Latin small letter with circumflex
252 ü ü ü Latin small letter u with diaeresis
253 ý ý ý Latin small letter y with acute
254 þ þ þ Latin small letter thorn
255 ÿ ÿ ÿ Latin small letter y with diaeresis


مجموعه کاراکتر ASCII

ASCII مقادیر 0 تا 31 (و 127) را برای کنتزل کاراکترها استفاده می‌کند.

ASCII از مقادیر 32 تا 126 برای حروف، ارقام و نمادها استفاده می‌کند.

ASCII از مقادیر 128 تا 255 استفاده نمی‌کند.



مجموعه کاراکتر ANSI (Windows-1252)

ANSI در مورد مقادیر 0 تا 127 شبیه ASCII است.

ANSI یک برای مقادیر 128 تا 159 مجموعه کاراکتر اختصاصی دارد.

ANSI در مورد مقادیر 160 تا 255 شبیه UTF-8 است.



مجموعه کاراکتر ISO-8859-1

8859–1 در مورد مقادیر 0 تا 127 مشابه ASCII است.

8859–1 از مقادیر 128 تا 159 استفاده نمی‌کند.

8859–1 در مورد مقادیر 160 تا 255 مشابه UTF-8 است.



مجموعه کاراکتر UTF-8

از مقدار 0 تا 127، UTF-8 شبیه ASCII است.

UTF-8 از مقادیر 128 تا 159 استفاده نمی‌کند.

از مقدار 160 تا 255، UTF-8 شبیه ANSI و 8859–1 است.

UTF-8 از مقدار 256 با بیش از 10000 کاراکتر مختلف ادامه می‌یابد.

برای مطالعه دقیق‌تر مرجع کامل مجموعه کاراکترهای HTML ما را مطالعه کنید.

منابع آموزشی




به‌روزرسانی شده: ۳۷ روز پیش