Data mining คืออะไร ช่วยวิเคราะห์ข้อมูลทางธุรกิจได้อย่างไร

Data Mining

ในโลกปัจจุบันที่ผู้บริโภคมีความต้องการสินค้าหลากหลายรูปแบบ จึงเป็นที่มาให้เกิดการก่อตั้งธุรกิจต่างๆ เพื่อรองรับความต้องการเหล่านั้น ธุรกิจประเภทเดียวกันต่างผู้ประกอบการ  เกิดขึ้นไม่จำกัดทั้งภายในพื้นที่เดียวกัน ต่างพื้นที่กัน ภายในประเทศเดียวกัน หรือคนละประเทศ

เมื่อมีสิ่งที่เหมือนๆ กัน เป้าหมายเดียวกัน ย่อมเกิดคำว่าแข่งขันต่อสู้ เพื่อให้ธุรกิจของตนเข้าถึงลูกค้าได้มากสุด สร้างผลกำไรและอยู่ได้อย่างต่อเนื่อง พื้นฐานหนึ่งที่จะต้องมีเพื่อการคิดค้นกลยุทธ์ทางธุรกิจ นั่นก็คือข้อมูลความต้องการของผู้บริโภค และการที่จะรวบรวมข้อมูลจำนวนมากที่มีอยู่ทั่วทุกมุมโลกมาวิเคราะห์สร้างกลยุทธ์ทางการค้าจำเป็นต้องใช้เวลาค่อนข้างนาน

ด้วยความก้าวหน้าของเทคโนโลยีที่ก้าวกระโดดไปอย่างรวดเร็ว ทำให้ผู้บริโภคสามารถค้นหาสิ่งที่ต้องการได้อย่างรวดเร็วเช่นกัน ผู้ประกอบการที่ใช้เวลานานในการรวบรวมข้อมูล คิดค้นกลยุทธ์ ก็อาจจะทำให้เข้าถึงกลุ่มลูกค้าได้ช้ากว่าผู้ประกอบการรายอื่นๆ

ดังนั้นเพื่อให้เกิดความรวดเร็วในการพัฒนาธุรกิจ จึงจำเป็นต้องมีตัวช่วยที่สามารถใช้รวบรวมข้อมูล วิเคราะห์ธุรกิจที่ทำอยู่ เพื่อสร้างกลยุทธ์และโมเดลทางธุรกิจได้ ตัวช่วยนั้นเรียกว่า Data Mining

Data Mining คืออะไร

คือกระบวนการจัดเรียงข้อมูลขนาดใหญ่ให้เป็นรูปแบบ มีการวิเคราะห์ความสัมพันธ์ระหว่างข้อมูล เพื่อใช้ในการแก้ปัญหา ปรับปรุงแนวทางดำเนินการทางธุรกิจ หรือเรียกได้อีกอย่างว่า การค้นหาความรู้ในฐานข้อมูล (Knowledge Discovery in database (KDD))

ประเภทของข้อมูลที่ใช้

  1. Relational Database เป็นฐานข้อมูลจัดเก็บในรูปแบบตาราง ที่แสดงความสัมพันธ์ด้วย ER Model
  2. Data Warehouse เป็นฐานข้อมูลที่มาจากหลายแหล่ง รวบรวมมาไว้ที่เดียวกัน ให้เป็นรูปแบบเดียวกัน
  3. Transactional Database เป็นฐานข้อมูลแต่ละรายการ เก็บในรูปแบบเหตุการณ์ต่างๆ
  4. Advanced Database เป็นฐานข้อมูลที่จัดเก็บในรูปแบบอื่นๆ เช่น Text file, Multimedia, Web

กระบวนการ

Data Mining จะมีกระบวนการมาตรฐานที่เรียกว่า “Cross-Industry Standard Process for Data Mining” หรือ CRISP-DM มีขั้นตอนดังนี้

1. Business understanding

เริ่มต้นด้วยการทำความเข้าใจวัตถุประสงค์ของธุรกิจที่มี  ระบุปัญหาที่เกิดขึ้น กำหนดแผน แล้วแปลงข้อมูลที่มีให้เป็นรูปแบบที่เหมาะต่อการนำมาใช้วิเคราะห์และวางแผนแนวโน้มทางธุรกิจ

2. Data understanding

ทำการรวบรวมข้อมูลแต่ละแหล่ง ตรวจสอบข้อมูลว่าเป็นข้อมูลที่ถูกต้องและมีความน่าเชื่อถือ รายละเอียดข้อมูล พิจารณาจำนวนข้อมูลที่เหมาะสมต่อการนำไปใช้ในวิเคราะห์

3. Data preparation

ทำการแปลงข้อมูลที่ได้ (Raw data) ให้เป็นข้อมูลที่จะนำไปวิเคราะห์ต่อได้ โดยแบ่งได้เป็น 3 ขั้นตอนดังนี้

  1. Data selection เริ่มต้นด้วยการกำหนดเป้าหมาย วิเคราะห์ แล้วทำการเลือกข้อมูลที่สามารถนำไปใช้ในการวิเคราะห์
  2. Data cleaning ตรวจสอบข้อมูลที่ได้มาว่าสมบูรณ์ครบถ้วน ถูกต้องหรือไม่ รวมทั้งจัดการข้อมูลที่ซ้ำกันให้เหลือเพียงชุดเดียว
  3. Data Transformation แปลงข้อมูลให้อยู่ในรูปแบบที่พร้อมใช้สำหรับวิเคราะห์ เช่น แปลงข้อความเป็นตัวเลข แปลงข้อมูลเป็นรูปแบบช่วงตามต้องการ

4. Modeling

ทำการสร้าง Prediction model หรือการจำลองข้อมูลเพื่อวิเคราะห์ข้อมูล ประเมินความถูกต้องของ Model ที่สร้าง หากยังไม่เป็นไปตามที่กำหนด ก็จำเป็นต้องย้อนกลับไปที่ขั้นตอน Data preparation อีกครั้ง

5. Evaluation

หลังทำการสร้าง Model ทางธุรกิจได้แล้ว ควรมีการประเมินประสิทธิภาพของ Model ว่าตอบโจทย์ที่จะนำไปใช้จริงได้หรือไม่ อาจจัดทำผลเปรียบเทียบในรูปแบบกราฟต่างๆ เพื่อให้เห็นภาพได้ชัดเจนมากขึ้น

6. Deployment and Monitoring

นำข้อมูลที่ได้จากการวิเคราะห์สร้าง Model ไปใช้งานจริง ด้วยวิธีการ Machine Learning เพื่อวิเคราะห์ตลาด เรียกว่า Market Basket Analysis ได้ข้อมูลจาก POS (Point-Of-Sales) และสื่อสารให้เข้าใจด้วยวิธี Data visualization มีเครื่องมือที่ใช้เช่น Power BI, Google data studios

2 เทคนิคที่ใช้

Descriptive Modeling: เป็นรูปแบบการวิเคราะห์ข้อมูลโดยใช้สถิติเบี้องต้น เพื่อทำความเข้าใจข้อมูลที่มีอยู่ รวมไปถึงการตรวจสอบและการจัดการข้อมูลที่ซ้ำซ้อน และนำข้อมูลที่ไม่ได้ใช้งานออกด้วย แบ่งได้เป็น 3 อย่างคือ

  • Association

เป็นการค้นหาความสัมพันธ์ระหว่างข้อมูลโดยอ้างอิงจากเหตุการณ์ที่เกิดขึ้น เช่น ลูกค้ามีการสั่งซื้อสินค้าจากร้านขายเครื่องมือที่ใช้ภายในบ้าน เรานำข้อมูลการซื้อสินค้ามาวิเคราะห์ต่อว่าลูกค้าซื้อสินค้าอะไร ถ้าซื้อมากกว่า 1 อย่าง มีความสัมพันธ์กันอย่างไร แล้วนำมาสินค้ามาจับคู่หรือรวมกลุ่มเพื่อสร้าง promotion ดึงดูดลูกค้า

  • Clustering

เป็นการแยกข้อมูล โดยการนำมาจัดกลุ่มสิ่งที่คล้ายกันหรือใกล้เคียงกัน เพื่อนำไปใช้วิเคราะห์ข้อมูลที่จะเกิดในอนาคต เช่น จัดกลุ่มตามอายุ เพศ วิเคราะห์การใช้จ่าย แล้วทำการจัด campaign เพื่อให้เหมาะกับกลุ่ม

  • Time series

เป็นการคาดการณ์สิ่งที่จะเกิดในช่วงเวลาอนาคต เช่น พื้นที่หนึ่งมีคนอาศัยเพิ่มขึ้นเรื่อยๆ ในอีก 3 ปีข้างหน้าก็อาจจะมีการสร้างตลาดหรือร้านค้าเพื่อรองรับความต้องการซื้อสินค้า

Predictive Modeling: เป็นการใช้ข้อมูลเก่าและปัจจุบันมาวิเคราะห์เชิงสถิติ เพื่อทำนายสิ่งที่จะเกิดขี้นในอนาคต แบ่งได้เป็น 3 อย่างคือ

1) Classification คือการแยกประเภทของข้อมูล โดยแบ่งได้เป็น

  • Decision Tree เป็นการจำลองการตัดสินใจ รูปแบบเปรียบเทียบเหมือนโครงสร้างต้นไม้ โดยมีโจทย์ตั้งต้น (Parent node) แยกไปเป็นโจทย์ย่อย ๆ (Child node) วิเคราะห์คำตอบของโจทย์ ทำการแยกไปเรื่อยๆ จนกระทั่งได้ผลการตัดสินใจสุดท้าย (Leaf node)
  • Naïve Bayes เป็นการนำข้อมูลที่มีอยู่ มาแปลงเป็นตัวเลขตามความน่าจะเป็น เพื่อวิเคราะห์ความน่าจะเป็นของสิ่งที่ยังไม่เกิด คาดการณ์จากสิ่งที่เกิดขึ้นมาก่อนแล้ว
  • Neural Network เป็นกระบวนการหนึ่งใน Machine Learning ที่เชื่อมต่อโครงสร้างข้อมูลแบ่ง layer เหมือนสมองมนุษย์ โดยสร้างแบบจำลองความสัมพันธ์ระหว่างข้อมูล input และ output เช่น การค้นหา Logo แบรนด์สินค้า จากวัตถุที่อยู่บนรูปภาพ

2) Regression

คล้ายกับ Classification แต่เป็นการประมาณค่าจำนวนหรือปริมาณที่เป็นตัวเลข โดยดูแนวโน้มจากข้อมูลเก่าที่ผ่านมา กำหนดเป็นตัวแปรเป็นตัวแปรอิสระและตัวแปรตาม วิเคราะห์ผลออกมาในรูปแบบ graph เช่น มีลูกค้า 10 คนในปีที่ผ่านมา มียอดขาย 1 แสนบาท ถ้าปีนี้มีลูกค้า 20 คน อาจจะมียอดขาย 2 แสน หรือมากกว่านั้น

จากเทคนิคต่างๆ ที่กล่าวมา ล้วนต้องอาศัยทักษะทางด้านการคำนวณและทักษะที่เกี่ยวกับระบบคอมพิวเตอร์ สรุปได้ดังนี้

  • Statistics เพื่อวิเคราะห์ข้อมูล สามารถเชื่อมโยงความสัมพันธ์ของข้อมูลได้ ใช้โปรแกรมทางสถิติเพื่อคำนวณหาผลลัพธ์ได้
  • AI เพื่อจัดการข้อมูลจำนวนมากในเวลารวดเร็ว ช่วยลดเวลาในการประมวลผล
  • Programming language สามารถใช้ภาษาบางอย่างเช่น Python ในการสร้างคำสั่งเฉพาะ เพื่อตอบโจทย์การวิเคราะห์
  • Machine Learning หากมีความเข้าใจตรรกะของระบบ ก็จะทำให้การจัดการข้อมูลเป็นไปได้ง่ายขึ้น
  • Database ใช้ความรู้ด้าน SQL เพื่อทำการการดึงข้อมูลจากหลายแหล่งมาวิเคราะห์
  • Data Visualization เป็นการใช้ทักษะในการสร้างผลลัพธ์เพื่อใช้นำเสนอในรูปแบบด่างๆ เช่น กราฟ แผนที่ ตารางแบบต่างๆ เพื่อนำไปใช้วิเคราะห์ข้อมูลเชิงลึกให้เข้าใจง่ายขึ้น

ตัวอย่างการใช้ Data mining สำหรับธุรกิจแต่ละประเภท

ธุรกิจการขาย

มีระบบ POS (Point-of-Sale) ช่วยจัดการสิ่งต่างๆ ในร้านค้า เช่นการคิดเงิน ออกใบเสร็จ เช็คสต๊อก สรุปรายรับรายจ่ายของร้านค้า ช่วยให้สามารถตรวจสอบข้อมูลการเงิน รวมไปถึงวิเคราะห์พฤติกรรมผู้บริโภค เพื่อนำไปพัฒนาปรับปรุงกลยุทธ์ทางการตลาด

การตลาด

แต่ละแบรนด์จะมีการสร้างแคมเปญออนไลน์ เพื่อทำการดึงดูดลูกค้าให้เข้ามาเลือกซื้อสินค้าที่เปิดตัวใหม่ เช่น IKEA สร้าง IKEA Place เพื่อให้เลือกช้อปปิ้งสินค้า มีแคมเปญลดราคาสินค้าหรือจัดชุดสินค้าในราคาถูกกว่าราคาชิ้นเดียว

ธุรกิจโรงงานและการผลิต

จะมีการคาดการณ์เวลาที่ต้องทำการซ่อมบำรุงเครื่องจักรตามอายุการใช้งาน และราคาที่ต้องใช้เพื่อการซ่อมเครื่องจักรแต่ละชนิด

ในส่วนการผลิดก็ช่วยในการวิเคราะห์ต้นทุนการผลิตและเวลาที่ใช้ในการผลิตสินค้าแต่ละชนิด คาดการณ์ตลาดที่สนใจ เพื่อให้สามารถผลิตสินค้าได้ต่อเนื่อง

ธุรกิจโรงพยาบาล

ใช้ในการวิเคราะห์อาการของโรคที่เกิด เพื่อหาแนวทางในการป้องกันและรักษาได้เหมาะสม

โดยสรุป ไม่ว่าจะเป็นธุรกิจรูปแบบใดก็ตาม ก็ล้วนจำเป็นต้องอาศัยหลักการวิเคราะห์ข้อมูล เพื่อช่วยให้ธุรกิจสามารถดำเนินไปได้อย่างต่อเนื่องตามความต้องการของผู้บริโภค นอกจากนี้ก็ยังช่วยป้องกันปัญหาในอนาคตที่อาจส่งผลกระทบต่อธุรกิจได้

ที่มา

Data Mining คืออะไร สำคัญอย่างไรกับธุรกิจ

Introduction to data mining

รู้จักกับเหมืองข้อมูล

เหมืองข้อมูล

Introduction to data warehouse, datamining and machine learning

    wpChatIcon