เทคโนโลยีสารสนเทศ ช่วงชั้นที่ 3
2.8 การแทนข้อมูล
28/29

 

      จากที่กล่าวมาแล้วว่า สารสนเทศคือข้อมูลที่ได้ผ่านการประมวลผล การประมวลผลข้อมูลส่วนใหญ่จะใช้เครื่องคอมพิวเตอร์ช่วยเพื่อความรวดเร็วและแม่นยำ ดังนั้นข้อมูลที่เก็บรวบรวมมาเพื่อให้คอมพิวเตอร์ประมวลผลจะต้องอยู่ในรูปแบบที่คอมพิวเตอร์เข้าใจ จึงจำเป็นต้องหาวิธีการแทนข้อมูลซึ่งเป็นชุดของตัวอักขระ

      การทำงานของเครื่องคอมพิวเตอร์ใช้สัญญาณอิเล็กทรอนิกส์ซึ่งมีสองสถานะคือปิดและเปิด จึงมีการกำหนดให้ใช้ตัวเลข 0 และ 1 แทนสถานะทั้งสอง และมีการกำหนดรหัสแทนอักขระด้วยชุดของตัวเลขซึ่งประกอบด้วยเลข 0 และ 1 ซึ่งเป็นตัวเลขในระบบเลขฐานสอง (binary digit)

      แต่ละหลักของจำนวนในระบบเลขฐานสองเราเรียกว่าบิต (bit) ใน 1 บิต จะแทนข้อมูลได้ 2 แบบคือ 0 และ 1 และถ้าใช้ตัวเลขฐานสอง 4 บิต จะแทนอักขระได้ทั้งหมด 24 หรือ 16 แบบ ดังนี้

0000 0001 0010 0011
0100 0101 0110 0111
1000 1001 1010 1011
1100 1101 1110 1111

       ตัวเลขฐานสอง 8 บิตหรือ 1 ไบต์สามารถใช้แทนรหัสต่างๆ ได้ถึง 28 หรือ 256 แบบ เช่น



0100 0001 ใช้แทนตัวอักขระ A
0100 0010 ใช้แทนตัวอักขระ B


       แต่รหัสตัวอักขระภาษาอังกฤษทั้งหมดมีจำนวนรวมกันไม่เกิน 128 ตัว ดังนั้นสำนักงานมาตรฐานผลิตภัณฑ์อุตสาหกรรมจึงได้กำหนดรหัสภาษาไทยเพิ่มเติม เพื่อใช้ในงานสารสนเทศเป็นภาษาไทยได้ เช่น รหัส 1010 0001 ใช้แทนตัวอักขระ ก

      รหัสที่ใช้แทนตัวอักขระที่เป็นมาตรฐานแบบหนึ่ง เรียกว่า รหัสแอสกี (American Standard Code for Information Interchange : ASCII)