ให้เรตสมาชิก: 5 / 5

ดาวใช้งานดาวใช้งานดาวใช้งานดาวใช้งานดาวใช้งาน
 

UTF-8

     คือ รหัสภาษานานาชาติ หรือ Unicode

 

UTF-8
UTF-8

 

     เป็นการเข้ารหัสชุดอักขระที่ใช้ชุดข้อมูล 1 ถึง 4 byte เพื่อแทนตัวอักษรเกือบทั้งโลก โดยใช้หลักการใช้ชุดข้อมูลแบบความยาวไม่คงที่ แทนตัวอักขระเป็นชุดๆไป UTF-8 มีข้อดีตรงที่ว่า ใน 1 หน้าเว็บนั้น เราสามารถแสดงผลร่วมกันได้ ในหน้านั้นจะมีภาษาไทย อังกฤษ จีน ญี่ปุ่น ซาอุ สวีเดน ฯลฯ มันจะแสดงผลร่วมกันเลยได้ 1 หน้า แต่ถ้าเราเลือกเป็น TIS-620 ตรงภาษาอื่นๆมันจะอ่านไม่ออก เพราะรหัสนี้มีแค่ภาษาไทย กับ อังกฤษ

     UTF-8 เป็นที่นิยมมากเพียงแต่เราไม่ค่อยจะได้เห็นมันแบบโดยตรง จริงๆแล้ว UTF-8 อยู่รอบตัวเราตลอด อย่างเช่น ชื่อไฟล์ภาษาไทยที่อยู่บน Windows นั้นเป็น UTF-8 แต่เราไม่รู้ตัว Google ก็ทำงานแบบ UTF-8 โดยที่เราไม่รู้ตัว 

 

ข้อดีของ UTF-8

  • รองรับได้หลายภาษา
  • ภาษาโปรแกรมมิ่งหลายๆภาษารองรับ UTF-8
  • สามารถเข้ากันได้ดีกับ ASCII
  • สามารถแปลงเป็น Charset ชนิดอื่นไม่ยุ่งยากโดยใช้ ICONV
  • สามารถแปลงลำดับอักษรภาษาไทยได้ 100%

 

ข้อเสียของ UTF-8

  • มีปัญหาการทำงานกับฟังก์ชั่นในบางภาษา
  • เสียเวลาในการเขียนโปรแกรมแปลงฐานข้อมูล และไฟล์ ให้เป็น UTF-8 
  • ต้องขยายความกว้าง Field เกือบทุก Field ที่เป็น Varchar เพื่อรองรับ UTF-8

 

ข้อมูลอ้างอิง : http://www.softmelt.com/article.php?id=573

https://iaee.wordpress.com/2007/08/29/ความแตกต่างระหว่าง-utf-8-กับ-tis/