ฟอรั่ม | ล่าสุดการพัฒนาเว็บบทเรียน
×

HTML ชุดอักขระ

HTML ชุดอักขระ HTML ASCII HTML ANSI HTML ISO-8859 HTML สัญลักษณ์ HTML UTF-8

HTML UTF-8

Latin ขั้นพื้นฐาน Latin เสริม Latin ขยาย A Latin ขยาย B ปรับปรุงตัวอักษร ออกเสียงวรรณยุกต์ กรีกและชาวอียิปต์โบราณ Cyrillic ขั้นพื้นฐาน Cyrillic เสริม

HTML สัญลักษณ์

เครื่องหมายวรรคตอนทั่วไป Currency สัญลักษณ์ Letterlike สัญลักษณ์ ลูกศร ผู้ประกอบการทางคณิตศาสตร์ ภาพวาดกล่อง องค์ประกอบของบล็อก รูปทรงเรขาคณิต Misc สัญลักษณ์ Dingbats

HTML หน่วยงาน

HTML4 หน่วยงาน HTML5 หน่วยงาน A HTML5 หน่วยงาน B HTML5 หน่วยงาน C HTML5 หน่วยงาน D HTML5 หน่วยงาน E HTML5 หน่วยงาน F HTML5 หน่วยงาน G HTML5 หน่วยงาน H HTML5 หน่วยงาน I HTML5 หน่วยงาน J HTML5 หน่วยงาน K HTML5 หน่วยงาน L HTML5 หน่วยงาน M HTML5 หน่วยงาน N HTML5 หน่วยงาน O HTML5 หน่วยงาน P HTML5 หน่วยงาน Q HTML5 หน่วยงาน R HTML5 หน่วยงาน S HTML5 หน่วยงาน T HTML5 หน่วยงาน U HTML5 หน่วยงาน V HTML5 หน่วยงาน W HTML5 หน่วยงาน X HTML5 หน่วยงาน Y HTML5 หน่วยงาน Z

 

HTML ชุดตัวอักษร


ในการแสดงหน้าเว็บ HTML ได้อย่างถูกต้อง, เบราว์เซอร์จะต้องรู้ว่าสิ่งที่ชุดอักขระ (การเข้ารหัสตัวอักษร) ที่จะใช้


HTML ชุดตัวอักษร

การเข้ารหัสอักขระที่ถูกต้องเพื่อใช้ใน HTML คืออะไร?

สำหรับ HTML5, การเข้ารหัสอักขระเริ่มต้นเป็น UTF-8

นี้ไม่ได้รับเสมอกรณีThe character encoding for the early web was ASCII. การเข้ารหัสตัวอักษรสำหรับเว็บต้นเป็น ASCII

ต่อมาจาก HTML 2.0 เพื่อ HTML 4.01, ISO-8859-1 ได้รับการพิจารณามาตรฐาน

กับ XML และ HTML5, UTF-8 มาถึงในที่สุดและแก้ไขปัญหามากการเข้ารหัสตัวอักษร

ด้านล่างเป็นคำอธิบายสั้น ๆ ของมาตรฐานการเข้ารหัสอักขระ


ในการเริ่มต้น: ASCII

ข้อมูลคอมพิวเตอร์ (ตัวเลขข้อความและรูปภาพ) จะถูกเก็บเป็นคนไบนารีและศูนย์ (01000101) ในอุปกรณ์อิเล็กทรอนิกส์

ที่จะสร้างมาตรฐานการจัดเก็บตัวเลขและตัวอักษรที่รหัสมาตรฐานอเมริกันสำหรับการแลกเปลี่ยนข้อมูล (ASCII) ถูกสร้างขึ้นIt defined a unique binary 7-bits number for each storable character to support the numbers from 0-9, the upper/lower case English alphabet (az, AZ), and some special characters like ! มันกำหนดไบนารีจำนวน 7 บิตไม่ซ้ำกันสำหรับตัวละครแต่ละตัวสามารถจัดเก็บได้เพื่อสนับสนุนตัวเลข 0-9, บน / กรณีที่ต่ำกว่าอักษรภาษาอังกฤษ (az, AZ) และบางตัวอักษรพิเศษเช่น!$ + - () @ <>

ตั้งแต่ ASCII ใช้หนึ่งไบต์ (7 บิตสำหรับตัวละครและเป็นหนึ่งในบิตสำหรับการควบคุมการส่งความเท่าเทียมกัน) ก็จะเป็นตัวแทนของ 128 ตัวอักษรที่แตกต่างกันIn addition 32 of these characters were reserved for other control purposes. นอกจากนี้ใน 32 ของตัวละครเหล่านี้ถูกสงวนไว้สำหรับวัตถุประสงค์ในการควบคุมอื่น ๆ

จุดอ่อนที่ใหญ่ที่สุดกับ ASCII คือการที่มันได้รับการยกเว้นตัวอักษรที่ไม่ใช่ภาษาอังกฤษ

ASCII ยังคงอยู่ในการใช้อย่างแพร่หลายในวันนี้โดยเฉพาะอย่างยิ่งในระบบคอมพิวเตอร์เมนเฟรมขนาดใหญ่

เพื่อให้ดูใกล้ชิดโปรดศึกษาของเรา อ้างอิง ASCII สมบูรณ์


ใน Windows: ANSI

ANSI (เรียกอีกอย่างของ Windows 1252) เป็นตัวอักษรเริ่มต้นการตั้งค่าใน Windows ถึง Windows 95

ANSI เ​​ป็นส่วนขยายไป ASCII กับตัวละครต่างประเทศเพิ่มIt uses a full byte (8-bits) to represent 256 different characters. มันใช้ไบต์เล่ม (8 บิต) เพื่อเป็นตัวแทนของ 256 ตัวอักษรที่แตกต่างกัน

ตั้งแต่ ANSI ได้รับตัวอักษรเริ่มต้นการตั้งค่าใน Windows ก็คือการสนับสนุนจากเบราว์เซอร์

เพื่อให้ดูใกล้ชิดโปรดศึกษาของเรา ANSI อ้างอิงที่สมบูรณ์


ใน HTML 4: ISO-8859-1

เนื่องจากประเทศส่วนใหญ่ใช้ตัวอักษร ASCII นอก, การเข้ารหัสตัวอักษรเริ่มต้นในมาตรฐาน HTML 2.0 ได้เปลี่ยนไปเป็น ISO-8859-1

ISO-8859-1 เป็นส่วนขยายไป ASCII กับตัวละครต่างประเทศเพิ่มLike ANSI, it uses a full byte to represent twice as many characters than ASCII. เช่น ANSI จะใช้ไบต์เต็มรูปแบบเพื่อเป็นตัวแทนของตัวละครสองเท่ากว่า ASCII

บันทึกเมื่อตรวจสอบเบราว์เซอร์มาตรฐาน ISO-8859-1 ในหน้าเว็บปกติแล้วพวกเขาเริ่มต้นกับ ANSI เ​​พราะ ANSI เ​​ป็นเหมือน ISO-8859-1 ยกเว้น ANSI ที่มี 32 ตัวอักษรพิเศษ

หากหน้าเว็บ HTML 4 ใช้ตัวตั้งที่แตกต่างจากมาตรฐาน ISO-8859-1 ก็ควรจะระบุไว้ใน <meta> แท็กที่ชอบ:

ตัวอย่าง

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">

บันทึก

ตัวอักษรเริ่มต้นที่กำหนดไว้สำหรับ HTML5 เป็น UTF-8
ทั้งหมด HTML 4 โปรเซสเซอร์ที่สนับสนุน UTF-8 และทุก HTML5 และ XML โปรเซสเซอร์ที่สนับสนุนทั้ง UTF-8 และ UTF-16

เพื่อให้ดูใกล้ชิดโปรดศึกษาของเรา สมบูรณ์อ้างอิงมาตรฐาน ISO-8859-1


ใน HTML5: Unicode UTF-8

เพราะชุดตัวอักษรดังกล่าวข้างต้นมีจำนวน จำกัด และไม่สามารถใช้งานในสภาพแวดล้อมที่พูดได้หลายภาษาที่ Unicode Consortium พัฒนามาตรฐาน Unicode

ครอบคลุมมาตรฐาน Unicode (เกือบ) ทุกตัวอักษร, เครื่องหมายวรรคตอนและสัญลักษณ์ในโลก

Unicode ช่วยให้การประมวลผล, การจัดเก็บและการขนส่งของข้อความเป็นอิสระจากแพลตฟอร์มและภาษา

การเข้ารหัสตัวอักษรเริ่มต้นใน HTML5 เป็น UTF-8

เพื่อให้ดูใกล้ชิดโปรดศึกษาของเรา Unicode อ้างอิงที่สมบูรณ์