ปัญหา Encoding และ UNICODE(UTF-8)
มกราคม 4, 2007 at 2:19 am | In สู่เส้นทางดิจิตอล | 2 Commentsปัญหา encoding คือ ปัญหาที่เห็นข้อมูลบนเว็บเป็นภาษาต่างด้าว ลักษณะเป็น
&#nnnn; เรียงต่อกันแทนคำที่เราพิมพ์!
ทำให้อ่าน(ภาษาไทย)ไม่ออก
สาเหตุเกิดจาก:
การบังคับให้บราวเซอร์แสดงเป็นภาษาที่ผู้เข้าชมต้องการให้โดยอัตโนมัติ(เช่น
ภาษาไทย) โดยกำหนดให้เป็นตัวอักษรหลัก(charset- character set) ได้แก่ iso-8859-1
สำหรับภาษา Western European languages เช่น ภาษาอังกฤษ(English), tis-620
สำหรับภาษาไทย เป็นต้น แต่บราวเซอร์ไม่เปลี่ยน charset
ไปตามภาษาที่ต้องการอย่างอัตโนมัติ
ปัญหาเกิดขึ้นจาก:
1. บราวเซอร์
ส่วนใหญ่บราวเซอร์สมัยใหม่(เช่น Internet Explorer)
จะทำการเปลี่ยนตัวอักษรที่ไม่มีอยู่ใน character set ขณะนั้นให้เป็นตัวอักษรแบบ
UNICODE(utf-8) แทน(ที่เห็นเป็นลักษณะ &#nnnn; เรียงต่อกัน)
2.
เมื่อไหร่ที่ บราวเซอร์ทั้งหลาย! หันมาสนับสนุนการทำงานของ UNICODE อย่างจริงๆจังๆ
ปัญหาดังกล่าวก็จะหมดไปเอง(รวมทั้งเรื่องการ Search
ด้วย!!!)
ปัจจุบันหลายเว็บเริ่มใช้ UTF-8 กันบ้างแล้ว
<meta
http-equiv=”Content-Type” content=”text/html;
charset=UTF-8″>
จากเดิม TIS-620, Windows-874
<meta
http-equiv=”Content-Type” content=”text/html;
charset=TIS-620″>
<meta http-equiv=”Content-Type”
content=”text/html; charset=Windows-874″>
ลิงค์เกี่ยวข้อง
:
http://linux.thai.net/~sfalpha/thai-howto/Thai-HOWTO.html#th_locale_charset
http://www.cl.cam.ac.uk/~mgk25/unicode.html
http://www.unicode.org/help/display_problems.html
http://software.thai.net/tis-620/
2 ความเห็น »
RSS feed สำหรับความเห็นต่อเรื่องนี้ TrackBack URI
ใส่ความเห็น
บลอกที่ WordPress.com . | Theme: Pool by Borja Fernandez.
Entries and comments feeds.
Thanks krub. It’s very useful.
ความเห็น โดย alwayslek — มกราคม 4, 2007 #
ที่เว็บ sanook เค้าใช้งานได้ อันนี้เป็นเพราะ server รองรับ หรืออย่างไรครับ
http://news.sanook.com/พลอย-น่วม-อ้างตกบันได-751431.html
ความเห็น โดย Suvarnabhoomi — พฤษภาคม 18, 2009 #