คำว่า Big Data มักจะสื่อถึงชุดข้อมูลที่มีขนาดใหญ่ ซึ่งอาจจะแบ่งย่อยออกเป็นข้อมูล 3 รูปแบบคือ

  1. ข้อมูลเชิงโครงสร้าง (structured data) คือตารางข้อมูลที่มีการจัดเรียงอย่างมีรูปแบบชัดเจนและเป็นระเบียบ สามารถนำมาใช้วิเคราะห์ได้เลย เช่น ข้อมูลที่เก็บไว้ในโปรแกรม spreadsheet อย่าง Microsoft Excel
  2. ข้อมูลกึ่งโครงสร้าง (semi-structured data) คือข้อมูลที่ถูกจัดเก็บอย่างมีรูปแบบในระดับหนึ่งและข้อมูลที่สามารถค้นหา (search) หรือแท็ก (tag) ได้ เช่น เว็บเพจที่มีการระบุชื่อเพจ คำสำคัญในเพจ และวันที่อัพเดทข้อมูล
  3. ข้อมูลที่ไม่มีโครงสร้างแน่นอน (Unstructured data) มักจะหมายถึงข้อความยาวๆ ข้อความเสียง รูปภาพ และวิดีโอ

          บางองค์กรอาจจะสามารถใช้ประโยชน์จากข้อมูลที่ไม่ได้ใหญ่มาก แต่มีความสำคัญ สามารถนำมาใช้วิเคราะห์ เพื่อให้เกิดความเข้าใจเชิงลึก (insight) ทำให้ได้มาซึ่งความรู้ความเข้าใจใหม่ๆ ที่ไม่สามารถเห็นได้อย่างตรงไปตรงมา หรือเป็นข้อมูลที่รวบรวมจัดเก็บไว้ตลอดกระบวนการเชิงธุรกิจ ที่สามารถนำมาวิเคราะห์ร่วมกันได้เห็นภาพชัดเจน เช่น การจัดระบบข้อมูลเกี่ยวกับการผลิต รวบรวมข้อมูลไว้ทุกปัจจัย ตั้งแต่ข้อมูลวัตถุดิบ ถึงข้อมูลของเครื่องจักรแต่ละกระบวนการ ไปจนถึงข้อมูลผลผลิต และการขนส่ง ทำให้สามารถวิเคราะห์ข้อมูลได้ตลอดทั้งกระบวนการ

          โดยทั่วไปลักษณะพื้นฐานของ Big Data จะมีอยู่ 3 ประการคือ ปริมาณ (Volume), ความหลากหลาย (Variety) และ ความเร็ว (Velocity) แต่วันนี้เราจะมาพูดถึงคุณลักษณะที่เพิ่มขึ้นมาอีก 3 ประการ ที่ทำให้ข้อมูลขนาดใหญ่ (Big Data) นี้มีคุณภาพสูงขึ้น และเหมาะที่จะนำมาใช้ในการวิเคราะห์เพื่อให้ได้มาซึ่งความเข้าใจเชิงลึก

Big data ที่มีคุณภาพสูงควรมีลักษณะพื้นฐานอยู่ 6 ประการหลักๆ (6 Vs) ดังนี้

1. ปริมาณ (Volume) หมายถึง ปริมาณของข้อมูลควรมีจำนวนมากพอ ทำให้เมื่อนำมาวิเคราะห์แล้วจะได้ insights ที่ตรงกับความเป็นจริง เช่น การที่เรามีข้อมูลอายุ เพศ ของลูกค้าส่วนใหญ่ ทำให้เราสามารถหา demographic profile ทั่วไปของลูกค้าที่ถูกต้องได้ ถ้าเรามีข้อมูลลูกค้าแค่ส่วนน้อย ค่าที่ประมาณออกมาอาจจะไม่ตรงกับความเป็นจริง

2. ความหลากหลาย (Variety) หมายถึง รูปแบบของข้อมูลควรหลากหลายแตกต่างกันออกไป ทั้งแบบโครงสร้าง, กึ่งโครงสร้าง, ไม่มีโครงสร้าง ทำให้เราสามารถนำมาวิเคราะห์ประกอบกัน จนได้ได้ insights ครบถ้วน

3. ความเร็ว (Velocity) หมายถึง คุณลักษณะข้อมูลที่ถูกสร้างขึ้นอย่างรวดเร็วต่อเนื่องและทันเหตุการณ์ ทำให้เราสามารถวิเคราะห์ข้อมูลแบบ real-time นำผลลัพธ์มาทำการตัดสินใจและตอบสนองได้อย่างทันท่วงที เช่น ข้อมูล GPS ที่ใช้ติดตามตำแหน่งของรถ อาจจะนำมาวิเคราะห์โอกาสที่ทำให้เกิดอุบัติเหตุ และออกแบบระบบป้องกันอุบัติเหตุได้

4. ความถูกต้อง (Veracity) หมายถึง มีความน่าเชื่อถือของแหล่งที่มาข้อมูลและความถูกต้องของชุดข้อมูล มีกระบวนการในการตรวจสอบและยืนยันความถูกต้องของข้อมูล ซึ่งมีความเกี่ยวเนื่องโดยตรงกับผลลัพท์การวิเคราะห์ข้อมูล

5. คุณค่า (Value) หมายถึง ข้อมูลมีประโยชน์และมีความสัมพันธ์ในเชิงธุรกิจ ซึ่งต้องเข้าใจก่อนว่าไม่ใช่ทุกข้อมูลจะมีประโยชน์ในการเก็บและวิเคราะห์ ข้อมูลที่มีประโยชน์จะต้องเกี่ยวข้องกับวัตถุประสงค์ทางธุรกิจ เช่นถ้าต้องการเพิ่มขีดความสามารถในการแข่งขันในตลาดของผลิตภัณฑ์ที่ขาย ข้อมูลที่มีประโยชน์ที่สุดน่าจะเป็นข้อมูลผลิตภัณฑ์ของคู่แข่ง

6. ความแปรผันได้ (Variability) หมายถึง ข้อมูลสามารถในการเปลี่ยนแปลงรูปแบบไปตามการใช้งาน หรือสามารถคิดวิเคราะห์ได้จากหลายแง่มุม และรูปแบบในการจัดเก็บข้อมูลก็อาจจะต่างกันออกไปในแต่ละแหล่งของข้อมูล

คุณลักษณะเหล่านี้ทำให้การจัดการ Big Data เป็นเรื่องยาก แต่ในขณะเดียวกันก็เป็นโอกาสให้องค์กรสร้างความได้เปรียบเหนือคู่แข่งด้วยการพัฒนาขีดความสามารถในการวิเคราะห์ข้อมูล

หากองค์กรของคุณต้องการเริ่มโครงการวิเคราะห์ข้อมูลเพื่อเพิ่มประสิทธิภาพในธุรกิจของคุณ ทางเพอเซ็ปทรามีผู้เชี่ยวชาญที่จะช่วยให้คำปรึกษาและลงมือทำวิสัยทัศน์ของคุณให้จับต้องได้ ดูข้อมูลการติดต่อเราได้ที่หน้า Contact us.

Categories: Knowledge

Leave a Reply

Your email address will not be published. Required fields are marked *