จากที่กล่าวมาแล้วว่า
สารสนเทศคือข้อมูลที่ได้ผ่านการประมวลผล การประมวลผลข้อมูลส่วนใหญ่จะใช้เครื่องคอมพิวเตอร์ช่วยเพื่อความรวดเร็วและแม่นยำ
ดังนั้นข้อมูลที่เก็บรวบรวมมาเพื่อให้คอมพิวเตอร์ประมวลผลจะต้องอยู่ในรูปแบบที่คอมพิวเตอร์เข้าใจ
จึงจำเป็นต้องหาวิธีการแทนข้อมูลซึ่งเป็นชุดของตัวอักขระ
การทำงานของเครื่องคอมพิวเตอร์ใช้สัญญาณอิเล็กทรอนิกส์ซึ่งมีสองสถานะคือปิดและเปิด
จึงมีการกำหนดให้ใช้ตัวเลข 0 และ 1 แทนสถานะทั้งสอง
และมีการกำหนดรหัสแทนอักขระด้วยชุดของตัวเลขซึ่งประกอบด้วยเลข
0 และ 1 ซึ่งเป็นตัวเลขในระบบเลขฐานสอง (binary digit)
แต่ละหลักของจำนวนในระบบเลขฐานสองเราเรียกว่าบิต
(bit) ใน 1 บิต จะแทนข้อมูลได้ 2 แบบคือ 0 และ 1 และถ้าใช้ตัวเลขฐานสอง
4 บิต จะแทนอักขระได้ทั้งหมด 24 หรือ 16 แบบ ดังนี้
0000 0001 0010
0011
0100 0101 0110 0111
1000 1001 1010 1011
1100 1101 1110 1111 |
ตัวเลขฐานสอง
8 บิตหรือ 1 ไบต์สามารถใช้แทนรหัสต่างๆ ได้ถึง 28 หรือ
256 แบบ เช่น
0100 0001 ใช้แทนตัวอักขระ
A
0100 0010 ใช้แทนตัวอักขระ B |
แต่รหัสตัวอักขระภาษาอังกฤษทั้งหมดมีจำนวนรวมกันไม่เกิน
128 ตัว ดังนั้นสำนักงานมาตรฐานผลิตภัณฑ์อุตสาหกรรมจึงได้กำหนดรหัสภาษาไทยเพิ่มเติม
เพื่อใช้ในงานสารสนเทศเป็นภาษาไทยได้ เช่น รหัส 1010
0001 ใช้แทนตัวอักขระ ก
รหัสที่ใช้แทนตัวอักขระที่เป็นมาตรฐานแบบหนึ่ง
เรียกว่า รหัสแอสกี (American
Standard Code for Information Interchange : ASCII)
|