ความก้าวหน้าของเทคโนโลยีสารสนเทศในปัจจุบันทำให้แต่ละวันมีการผลิตข้อมูลขึ้นมาจำนวนมากข้อมูลบางส่วนจะถูกนำมาประมวลผลเพื่อนำไปประยุกต์ใช้ในด้านต่างๆตัวอย่างเช่นข้อมูลจากเว็บไซค์ที่มีจำนวนเพิ่มขึ้นอย่ารวดเร็วในแต่ละวัน ซึ่งสามารถใช้ประโยชน์จากข้อมูลเหล่านี้ได้เพียงค้นหาข้อความรูปภาพ หรือวีดิทัศน์ ที่ตรงกับความสนใจเท่านั้น
แต่ไม่สามารถนำข้อมูลเหล่านี้มาประมวลผลและแสดงความรู้ที่แฝงอยู่ได้อย่างมีประสิทธิผล
ข้อมูล (Data) คือ สิ่งที่ใช้อธิบายคุณลักษณะของวัตถุ
เหตุการณ์ กิจกรรม โดยบันทึก จากการสังเกต การทดลอง
หรือการสำรวจด้วยการแทนรูปแบบใดรูปแบบหนึ่ง เช่น บันทึกไว้เป็นตัวเลข ข้อความ
รูปภาพ และสัญลักษณ์
ตัวอย่างข้อมูลที่พบเห็นในชีวิตประจำวัน
สารสนเทศ (Information) คือ
ผลลัพธ์ที่ได้จากการนำข้อมูลมาประมวลผล เพื่อให้ได้สิ่งที่เป็นประโยชน์ในการนำไปใช้งานมากขึ้น
เช่น ส่วนสูงของนักเรียนหญิงและนักเรียนชายแต่ละคนในชั้นเรียนเป็นข้อมูล
จะสามารถสร้างสารสนเทศจากข้อมูลเหล่านี้ได้หลายแบบ
เพื่อนำไปใช้ในจุดประสงค์ที่แตกต่างกัน ตัวอย่างเช่น การนำข้อมูลเหล่านี้ไปเรียบเรียงตามลำดับจากมากไปหาน้อย
หรือ การหาค่าเฉลี่ยของส่วนสูงของนักเรียน
เพื่อให้นักเรียนได้เห็นความแตกต่างของข้อมูลและสารสนเทศอย่างชัดเจนมากขึ้น
ตัวอย่างข้อมูลส่วนสูงรายปีของนักเรียน
จากตัวอย่างข้างต้นจะเห็นได้ว่าการสร้างสารสนเทศซึ่งในที่นี้คือส่วนสูงเฉลี่ยของนักเรียนในชั้นมัธยมศึกษาปีที่1จะสามารถถูกนำไปใช้เพื่อวิเคราะห์และตอบคำถามว่าส่วนสูงของนักเรียนมีการเปลี่ยนแปลงอย่างไรตลอด
20 ปีที่ผ่านมา ซึ่งสารสนเทศเหล่านี้จะถูกนำไปใช้เพื่อสนับสนุนการตัดสินใจ
ตัวอย่างการนำข้อมูลมาประมวลผลเพื่อประกอบการตัดสินใจ
ความรู้(Knowledge)เป็นคำที่มีความหมายกว้างและใช้กันโดยทั่วไปในด้านวิทยาการคอมพิวเตอร์หรือวิศวกรรมคอมพิวเตอร์กล่าวถึงความรู้ไว้ในหลายแง่มุม
แต่ความหมายในแง่มุมหนึ่งที่สอดคล้องกับข้อมูลและสารสนเทศความรู้คือสิ่งที่ประกอบด้วยข้อมูลและสารสนเทศที่ถูกจัดรูปแบบและประมวลผลเพื่อนำไปประยุกต์ใช้ในปัญหาที่ต้องการนำข้อมูลและสารสนเทศเหล่านี้ไปแก้ไข
นอกจากนี้ยังมีนิยามของความรู้อีกด้านหนึ่งที่เกี่ยวข้องกับเรื่องของข้อมูลและสารสนเทศคือความรู้ที่แฝงอยู่ในข้อมูลเป็นสิ่งที่สามารถสกัดจากสารสนเทศที่มีรูปแบบน่าสนใจเป็นจริงสำหรับข้อมูลใหม่หรือข้อมูลที่ไม่เคยเห็นก่อน
กระบวนการค้นพบความรู้ในฐานข้อมูล
การจัดการความรู้
(Knowledge
management)
ในการบริหารองค์กรสิ่งหนึ่งที่เกิดขึ้นแต่ไม่สามารถประเมินคุณค่าเป็นตัวเงินได้คือความรู้ที่ได้จากการปฏิบัติงาน
เนื่องจากในการทำงานการแก้ปัญหาการแสวงหาความรู้ การนำความรู้มาปรับใช้
จะต้องใช้ความรู้และทักษะเฉพาะอย่าง เพื่อทำงานให้ลุล่วงไปได้
ซึ่งการจะทำให้พนักงานสามารถปฏิบัติงานได้อย่างราบรื่นนั้น
จะต้องใช้การอบรมเพื่อสร้างความรู้รวมถึงสร้างทักษะให้กับพนักงาน
ซึ่งความรู้นั้นจัดเป็นทุนทางปัญญา (intellectual capital)
ตัวอย่างการจัดการความรู้ในองค์กร
ลักษณะของข้อมูลที่ดี ความถูกต้องของข้อมูล เป็นลักษณะสำคัญยิ่งของข้อมูลถ้าข้อมูลไม่ถูกต้องแล้ เราจะไม่สามารถได้ผลลัพธ์ที่ถูกต้องได้เลย
ซึ่งประเด็นเป็นเรื่องสำคัญที่เกิดขึ้นโดนเฉพาะอย่างยิ่งกับข้อมูลที่มีขนาดใหญ่
และไม่มีการตรวจสอบ เช่น ข้อมูลในโลกอินเตอร์เน็ต
ซึ่งจำเป็นต้องได้รับการตรวจสอบก่อนจะนำมาใช้เสมอ
ตัวอย่างภาพข้อมูลเสียงที่เก็บจากไมโครโฟน
ความสมบูรณ์ครบถ้วนในการนำไปใช้งาน ข้อมูลบางประเภทหากไม่ครบถ้วน
จัดเป็นข้อมูลที่ด้อยคุณภาพได้เช่นกัน เช่น ข้อมูลประวัติคนไข้
หากไม่มีหมู่เลือดของคนไข้ จะไม่สามารถใช้ได้ในกรณีที่ผู้ร้องขอข้อมูลต้องการข้อมูลหมู่เลือดของคนไข้
หรือข้อมูลที่อยู่ของลูกค้า ที่กรอกผ่านแบบฟอร์ม
ถ้ามีแต่ชื่อและนามสกุลโดยไม่มีข้อมูลบ้านเลขที่ ถนน แขวง/ตำบล เขต/อำเภอ
หรือจังหวัด ข้อมูลเหล่านั้นก็ไม่สามารถนำมาใช้งานได้
ตัวอย่างหน้าจอของเว็บไซค์ที่ต้องป้อนข้อมูลสองครั้ง
เพื่อป้องกันความผิดพลาด
ความถูกต้องตามเวลา ในบางกรณีข้อมูลผูกกันอยู่กับเงื่อนไขของเวลา
ซึ่งถ้าผิดจากเงื่อนไขของเวลาไปแล้ว ข้อมูลนั้นอาจลดคุณภาพลงไป
หรือแม้กระทั่งอาจไม่สามารถใช้ได้ เช่น ข้อมูลการใช้ยาของคนไข้ในโรงพยาบาล
ในทางการแพทย์แล้ว ข้อมูลนี้จะต้องถูกใส่เข้าไปในฐานข้อมูลที่คนไข้ได้รับยา เพื่อให้แพทย์คนอื่นๆ
ได้ทราบว่า คนไข้ได้รับยาชนิดนี้เข้าไปแล้ว แต่ข้อมูลเรื่องการให้ยาของคนไข้นี้
ตัวอย่างข้อมูลการให้ยาคนไข้ในโรงพยาบาล
ความสอดคล้องกันของข้อมูลในกรณีที่ข้อมูลมาจากหลายแหล่งจะเกิดปัญหาขึ้นในเรื่องของความสอดคล้องกันของข้อมูล
เช่น ในบริษัทแห่งหนึ่งซึ่งเก็บข้อมูลที่อยู่ของลูกค้า
หากต้องการนำข้อมูลไปควบรวมกับบริษัทอีกแห่งหนึ่งซึ่งมีข้อมูลของลูกค้าอยู่เช่นกัน
แต่ข้อมูลในการจัดส่งเอกสารของบริษัทแห่งแรก เป็นที่อยู่ของที่พักอาศัยของลูกค้า
ในขณะที่ข้อมูลในบริษัทที่สองเป็นที่อยู่ของสถานที่ทำงานของลูกค้า
ข้อมูลจากทั้งสองบริษัทเป็นข้อมูลที่ถูกต้อง สอดคล้องตามเวลาทั้งคู่
แต่ถ้าต้องการเก็บข้อมูลที่อยู่ของลูกค้าเพียงที่อยู่เดียว ก็จะเกิดปัญหาขึ้นได้
ตัวอย่างของการไม่สอดคล้องกันของข้อมูล
การจัดเก็บข้อมูล
เมื่อเห็นความสำคัญของข้อมูลแล้ว ทำอย่างไรจึงจะเก็บรักษาข้อมูลเหล่านั้นให้คงอยู่
รวมถึงทำให้สามารถประมวลผลข้อมูลนั้นได้อย่างรวดเร็วโดยมากแล้วจะรวมไว้ในระบบฐานข้อมูล
ซึ่งนำมาใช้ในการจัดเก็บ การเข้าถึงและการประมวลผล
ข้อดีในการนำฐานข้อมูลไปใช้ในองค์กรหรือหน่วยงาน เช่น
-การจัดเก็บอย่างมีประสิทธิภาพ สามารถลดภาระการเก็บเอกสารที่เป็นกระดาษได้
รวมถึงการทำซ้ำเพื่อสำรองข้อมูล สามารถทำได้สะดวกและรวดเร็ว
-การตอบสนองต่อความต้องการได้อย่างรวดเร็ว เช่น
ข้อมูลประวัติการบำรุงรักษารถยนต์และข้อมูลประวัติคนไข้
ผู้ใช้ที่ต้องการนำข้อมูลเหล่านี้ไปใช้งาน สามารถเข้าถึงระบบฐานข้อมูลและนำข้อมูลที่ต้องการไปใช้ได้
ข้อดีในการนำฐานข้อมูลไปใช้งานในองค์กร
ลำดับชั้นของข้อมูลในฐานข้อมูล
ก่อนที่จะกล่าวถึงลำดับขั้นตอนของข้อมูลในฐานข้อมูลสิ่งแรกที่ต้องกล่าวถึงก่อน
คือ ลำดับขั้นตอนล่างสุดของการแทนข้อมูล นั่นคือ การแทนข้อมูลด้วยตัวเลขฐานสอง
ซึ่งประกอบด้วยตัวเลขสองตัวคือ ’0′และ ’1′ในทางคอมพิวเตอร์
จะเรียกว่าตัวเลขฐานสองหนึ่งหลักนี้ว่า 1 บิต (bit)
ซึ่งถือว่าเป็นหน่วยเล็กที่สุดของข้อมูล และหากนำบิตมาต่อกันจำนวน 8 บิต
จะเรียกว่า 1 ไบต์ (byte)
ตัวอย่างการแทนข้อมูลทางคอมพิวเตอร์
-เขตของข้อมูล(field) เมื่อนำข้อมูลระดับบิตมาเรียงต่อกันเพื่อแทนข้อมูลใดๆที่ต้องการเก็บในฐานข้อมูล
เราจะจัดข้อมูลที่เป็นบิตนี้มารวมกันเพื่อแทนความหมายบางอย่างหน่วยที่ย่อยที่สุดที่มีความหมายในฐานข้อมูลนี้เรียกว่า
เขตข้อมูล โดยเขตข้อมูลอาจแทนข้อมูลดังตัวอย่างต่อไปนี้
-จำนวนเต็ม(integer) คอมพิวเตอร์ส่วนใหญ่จะเก็บตัวเลขขนาด32บิตซึ่งขนาดของตัวเลขนี้อาจเปลี่ยนแปลงไปตามเทคโนโลยีของเครื่องคอมพิวเตอร์
ตัวเลข 2 ฐานขนาด 32 บิต สามารถแทนตัวเลข
-จำนวนทศนิยม (decimalnumber) ในคอมพิวเตอร์
จะเก็บตัวเลขทศนิยม โดยใช้ระบบโฟลทพิงพอยต์ (floating point) ซึ่งการเก็บในลักษณะนี้ ไม่มีการกำหนดตำแหน่งตายตัวสำหรับตำแหน่งของจุด โดยทั่วไปการเก็บข้อมูลตัวเลขจะมีสองขนาด
คือ 32 บิตอละ 64 บิต
-ข้อความ (text) ในการแทนข้อความนั้น
จะต้องเปลี่ยนข้อความให้เป็นรหัสซึ่งในการแทนตัวอักขระแต่ละตัวเสียก่อน
ตามมาตรฐานโดยทั่วไปจะใช้เป็นรหัสแอสกี (ASCII code)
-วันเวลา (date/time) ข้อมูลที่เป็นเวลา เช่น วันที่เริ่มใช้งาน
วันลงทะเบียน และเวลาที่ซื้อสินค้า มีความแตกต่างจากข้อมูลประเภทอื่น
ดังนั้นจึงต้องมีชนิดของข้อมูลเป็นวันเวลา
เพื่อรองรับเขตของข้อมูลที่ต้องการเก็บข้อมูลเป็นวันเวลา
-ไฟล์ (file) เขตข้อมูลบางประเภทใช้เก็บไฟล์รูปภาพหรือไฟล์อื่นๆ
ซึ่งเขตของข้อมูลประเภทนี้จะเป็นเขตข้อมูลขนาดใหญ่
โดยปกติแล้วจะมีความยาวมากกว่าเขตข้อมูลประเภทอื่นๆ
โดยเขตข้อมูลนี้จะเก็บข้อมูลในลักษณะเป็นบิตเรียงต่อกัน
ทะเบียน (record) คือ
กลุ่มของเขตข้อมูลที่มีความสัมพันธ์กัน โดยเขตข้อมูลแต่ละส่วนอาจจะเป็นข้อมูลต่างชนิดกัน
ระเบียนแต่ละระเบียนจะประกอบด้วยโครงสร้างเขตข้อมูลที่เหมือนกัน
ตัวอย่างระเบียน
ตาราง (table) คือ
กลุ่มของระเบียน ซึ่งเขตข้อมูลในแต่ละระเบียนจะเก็บข้อมูลที่มีความสัมพันธ์กัน
ในตารางจะเก็บข้อมูลหลายๆระเบียน แต่ละระเบียนจะมีโครงสร้างเหมือนกันในตาราง
นอกจากจะเก็บข้อมูล
ตัวอย่างตารางข้อมูลนักเรียน
ฐานข้อมูล (database) เป็นที่รวมของตารางหลายๆ
ตารางเข้าไว้ด้วยกัน ตารางแต่ละตารางจะมีความสัมพันธ์กันโดยใช้เขตของข้อมูลที่เก็บข้อมูลซึ่งเหมือนกันเป็นตัวเชื่อมโยงระหว่างกัน
บางตารางอาจเป็นตารางที่เก็บข้อมูลไว้เฉพาะของตนเองโดยไม่เกี่ยวข้องกับตารางอื่นๆ
ในขณะที่บางตารางต้องเชื่อมโยงกับเขตข้อมูลของตารางอื่นๆ
ตัวอย่างฐานข้อมูลซึ่งส่วนหนึ่งใช้เก็บข้อมูลนักเรียน