วันพฤหัสบดีที่ 20 มกราคม พ.ศ. 2554

CLASS IX


Data Management (cont)

Data Warehouses  จะเป็นการดึงข้อมูลมาจาก Data Base เฉพาะหัวข้อที่เกี่ยวข้อง เพื่อนำมาใช้ในการวิเคราะห์ข้อมูล โดยมีการนำเสนอในรูปแบบต่างๆ ตามลักษณะของการใช้บริหาร เช่น Drill Downs เป็นการให้ข้อมูลในภาพรวมก่อน แต่สามารถเข้าถึงข้อมูลเชิงลึกได้ หากสนใจในหัวข้อนั้นๆ


ลักษณะของ Data Warehouse
                        Organization กรองข้อมูลจากแหล่งข้อมูล (Data Base ) เข้าไปสู่ระบบเดียวกัน โดยแบ่งข้อมูลต่างๆ ตามหัวข้อ
                        Consistency คัดกรองข้อมูลให้มีรูปแบบและอัพเดตที่ตรงกัน ป้องกันไม่ให้มีข้อมูลซ้ำซ้อน หรือผิดพลาดส่งต่อไปยังส่วนงานอื่นๆ
                        Time Variant ระยะเวลาในการจัดเก็บข้อมูล 5 – 10 ปี ทำให้สามารถวิเคราะห์ข้อมูลเป้ฯแนวโน้ม (Trend) ที่อาจจะเกิดขึ้นในอนาคตได้

Major Benefits of Data Warehouses
1. ข้อมูลที่ได้เป็นระบบ รวดเร็วและทันต่อการใช้งาน
2. ข้อมูลถูกรวบรวมไว้ในที่เดียวกัน ทำให้ผู้ใช้งานสามารถเข้าถึงข้อมูลได้ง่ายขึ้น

        Meta data เป็น Data ของ Data ซึ่งก็คือเป็น Data ที่ใช้อธิบาย Data ที่อยู่ใน Data Warehouse โดย Meta data จะอธิบายว่ามีการ move ข้อมูลมาจาก Database ไหน และ Summarize อะไรไปยังไงบ้าง

        The Data Mart เป็น Small scale ของ Data Warehouse เนื่องจากเดิมข้อมูลทั้งหมดจะอยู่ใน Enterprise Data Warehouse แล้วระบบอาจจะเกิดการ Overload เวลาที่มีคนใช้พร้อมกันมากๆ จึงเกิด Data Mart ขึ้น ซึ่ง Data Mart จะมี 2 แบบ คือ
        1. แบบ Replicated จะมี Enterprise Data Warehouse ก่อน แล้วค่อย Replicate บางส่วนที่ต้องการมาเป็น Data Mart
        2. แบบ Stand-alone data marts เกิดจากกรณีที่องค์กรยังไม่พร้อมทำ Enterprise Data Warehouse จึงเริ่มที่การทำ Data Mart เป็นของตัวเองไปก่อน พอถึงจุดที่ทุกฝ่ายพร้อม ค่อยเอา Data Mart มารวมกัน

       Data Cube 
คือ Multidimensional Databases เพื่อ ให้สามารถมองภาพของข้อมูลนั้นได้หลายมิติมากขึ้น โดยมีจุดเด่น คือ สามารถตัดข้อมูลเป็นแต่ละส่วน เพื่อเลือกส่วนของข้อมูลที่ต้องการวิเคราะห์ ได้ ทำให้เห็นปัญหาที่ชัดเจนขึ้น หลายมิติ หลายมุมมองมากขึ้น ซึ่งสามารถ Slice และ Dice ออกมาได้

Business Intelligence

คือ การรวมกันของโครงสร้างระบบ เครื่องมือต่างๆ ระบบฐานข้อมูลและ Application ที่ช่วยในการวิเคราะห์ข้อมูลให้มีประสิทธิภาพมากยิ่งขึ้น ประกอบไปด้วย 3 องค์ประกอบ ดังนี้
1.       Reporting and Analysis 
ส่วนออกรายงานให้แก่ผู้ใช้ ซึ่งมีตัวอย่างรูปแบบของการออกรายงานต่างๆ เช่น
Enterprise Reporting System - จัดทำรายเป็นข้อมูล ที่เตรียมให้สำหรับผู้บริหารนำไปใช้ในการวิเคราะห์ต่างๆ
งานทั้งในรูปแบบปกติ และรูปแบบที่สามารถปรับแก้เองได้
Dashboards การรายงานข้อมูล Visual Display โดยแบ่งออกเป็น 3 ระดับ ได้แก่ Operation Dashboard, Tactical Dashboard และ Strategic Dashboard 
Scorecard  เป็นรายงานสำหรับผู้บริหารในระดับ strategic ป็นกระบวนการสำหรับการตรวจสอบและควบคุม โดยนำหลักมาจาก Balance Scorecard มาใช้
หมายเหตุ Balance Scorecard (BSC) การวัดผลในมุมมองต่างๆ โดยมี KPI เสมอ ตัวอย่าง KPI เป็นตัววัดผล
2.       Analytics
                กระบวนการวิเคราะห์ข้อมูลที่ได้จากแหล่งต่างๆ เช่น Business Performance Management (BPM) Online Analytical Processing (OLTP) 
3.       Data Mining
                การแยกข้อมูลเพื่อพยากรณ์แนวโน้มที่อาจจะเกิดขึ้น หรือการค้นหาข้อมูลที่เป็นประโยชน์ในอดีตในสิ่งที่เราไม่รู้ โดยทำกับบริษัทที่มี Database ขนาดใหญ่ ข้อมูลจำนวนมาก เพื่อให้เกิดประโยชน์ในการค้นหา
                โดยกระบวนการของ Mining เริ่มต้นที่ การรวบรวมข้อมูลจากที่ต่างๆ ทั้ง Warehouse และแหล่งอื่น แล้วทำ ECTL (Extract, Clean, Transform, Load) แล้วจึงวิเคราะห์และประมวลผล จากนั้นจึงแปรผลข้อมูล เพื่อให้สามารถนำไปใช้ได้ง่ายยิ่งขึ้น 

รูปแบบของ Data Mining
                เป็นการค้นหาความรู้ใหม่ๆ เพื่อให้เกิดความเข้าใจ และนำไปปฏิบัติได้ เป็นการทำให้ข้อมูลที่มีอยู่เป็นจำนวนมากใน Databases กลายเป็นข้อมูลที่มีประโยชน์ต่อการตัดสินใจ ผ่านการใช้เครื่องมือช่วยในการวิเคราะห์ ซึ่งประกอบด้วย 5 รูปแบบ ได้แก่
·        Clustering เป็นการจัดกลุ่มข้อมูล โดยทำการ plot ข้อมูล แล้วดูจุดที่กลุ่มข้อมูลกระจุกตัวรวมกัน
·        Classification เป็นการจัดกลุ่มข้อมูลแบ่งตามเกณฑ์คุณลักษณะต่างๆ โดยมีสมมติฐานล่วงหน้า
·        Association เป็นผลสืบเนื่องที่เกิดขึ้น เช่น หากลูกค้าเปิดบัญชีออมทรัพย์ ต่อไปก็มีความเป็นไปได้ที่จะทำบัตร ATM ด้วย เป็นต้น
·        Sequence Discovery เป็นผลที่เกิดตามหลังมา
·        Prediction การ Forecast เป็นการคาดการณ์ล่วงหน้า (forecast)

Balance Scorecard (BSC)
      การวัดผลในมุมมองต่างๆโดยมี KPI ในด้าน financial, customer, internal process และ learning มาช่วยวัดผลการดำเนินงาน
Business Value of BI: คือการวัดมูลค่าการใช้ Business Intelligence ให้เกิดประโยชน์ต่อองค์กร
Online Analytical Processing (OLTP): เป็น software technology ที่ช่วยระบุปัญหา 


วันพฤหัสบดีที่ 13 มกราคม พ.ศ. 2554

CLASS VIII

Data management

ระบบ (System) คือ การใส่ input เข้าไปใน process ให้เกิด output ตามวัตถุประสงค์ที่กำหนดไว้ ซึ่งวัตถุประสงค์จะเป็นตัวกำหนดว่า input ประกอบดัวยอะไรบ้าง ดังนั้นหากใส่ input ต่างกัน input ก็จะต่างกันด้วย
Data management
ข้อมูล(Data) สารสนเทศ(Information) และ ความรู้(Knowledge)
            ข้อมูล (Data) คือ ข้อเท็จจริง ซึ่งหาได้จากแหล่งข้อมูลต่างๆ หรือสิ่งรอบๆตัว ไม่ว่าจะเป็นคน สัตว์ สิ่งของ หรือ เหตุการณ์ต่างๆ
            สารสนเทศ (Information) คือ ข้อมูล(Data)ที่ ได้ผ่านการประมวลผล ด้วยวิธีการที่เหมาะสม และต้องมีความถูกต้องในการประมวลผล จนได้ผลลัพธ์ตรงตามความต้องการ อยู่ในรูปแบบที่สามารถนำไปใช้ประโยชน์ ในเวลาที่ต้องการของผู้ใช้
            ความรู้ (Knowledge) คือ สารสนเทศ(Information) ที่ ผ่านกระบวนการคิดเปรียบเทียบ มีการเชื่อมโยงกับความรู้อื่น จนเกิดความเข้าใจ และสามารถนำความเข้าใจนั้นไปใช้ประโยชน์ในการตัดสินใจในสถานการณ์ต่างๆได้

ระบบสารสนเทศ (Information System) 
เป็นระบบที่ทำหน้าที่รวบรวมข้อมูลเพื่อนำมาประมวลผล วิเคราะห์ เพื่อ สร้างสารสนเทศสำหรับวัตถุประสงค์เฉพาะด้าน และนำเสนอสารสนเทศให้กับผู้ที่ต้องการ ซึ่งเป็นผู้ที่มีสิทธิได้รับสารสนเทศ รวมทั้ง การจัดเก็บบันทึกข้อมูลที่นำเข้ามาสู่ระบบเพื่อการใช้งานในอนาคต จะเห็นได้ว่า สิ่งที่เราเก็บเป็นข้อมูล ไม่ใช่สารสนเทศ ดังนั้น เราจึงต้องเรียนรู้เกี่ยวกับ data management

Data Management

 การจัดการข้อมูลนั้นมีความยากด้วยหลายสาเหตุ ได้แก่
1.       จำนวนข้อมูลเพิ่มมากขึ้น เราไม่สามารถเก็บทุกอย่างได้
2.       ข้อมูลจะเกิด ณ จุดที่งานเกิดและมีการกระจายตัวในองค์กร
3.       ข้อมูลมีความซ้ำซ้อนจากการกระจายตามแผนกและไม่มีกลไกในการสร้างหรือเก็บข้อมูลที่ดีเพียงพอ
4.       อาจจะต้องมีการใช้ข้อมูลจากแหล่งภายนอกมาช่ายในการตัดสินใจ
5.       การจัดการข้อมูลอยู่บนพื้นฐาน 3 ประการ ได้แก่ Security Quality และ Critical
·        ข้อมูลเป็นทรัพยากรขององค์กร ระบบฐานข้อมูลเป็น infrastructure ไม่ใช่ IS

ขั้นตอนของ Data management
1. Data profiling ข้อมูลที่จัดเก็บเบื้องต้น ได้แก่ ใครเป็นผู้สร้าง ใครใช้ เก็บที่ไหน อย่างไร
2. Data quality management
การพัฒนา ปรับปรุงคุณภาพของข้อมูล
3. Data integration
การรวบรวมข้อมูลจากหลายแห่ง
4. Data augmentation
การเพิ่มคุณค่าของข้อมูล

Data Life Cycle Process
·        เก็บรวบรวมข้อมูล
·        เก็บข้อมูลไว้ใน Database เป็นการชั่วคราว จากนั้นจึงทำการผ่านกระบวนการเพื่อจัดเก็บข้อมูลไว้ใน Data warehouse
·        ผู้ใช้เข้ามาดึงข้อมูลใน Data warehouse เพื่อนำไปใช้ในการวิเคราะห์

Data Processing
·         Transactional  เป็นการประมวลผลข้อมูลขั้นพื้นฐาน ระดับปฏิบัติการ  Transaction Processing System (TPS) จะถูกจัดการเป็นลำดับขั้น และถูกจัดการโดยส่วนกลาง
·         Analytical เป็น การเอาข้อมูลมาใช้ประมวลผลอีกครั้งเพื่อการตัดสินใจระดับสูงขึ้นไป นำข้อมูลเหล่านี้ไปใช้วิเคราะห์ต่อ โดยตัวอย่างของเครื่องมือที่ใช้ในการวิเคราะห์  เช่น OLAP EIS DSS
การดึงข้อมูลมาจาก Database อาจทำให้ระบบ TPS ทำงานล่าช้า เนื่องจาก Database ขึ้นอยู่กับ TPS ดังนั้นองค์กรจึงสร้าง Data warehouseเพื่อแยก Operational process และ Analytical process ออกจากกัน

Data Warehouse
·         - Input     เป็นข้อมูลที่ดึงมาจาก TPS อาจเป็น Internal หรือ External หรือ Personal Data ก็ได้ หลังจากนั้นก็นำมาเก็บใน Data Warehouse เป็นข้อมูลที่จัดใหม่ในมุมมองเพื่อวิเคราะห์
·        -  Processing     เป็นกระบวนการ Process ข้อมูลให้ได้ Output อาจเป็น DSS EIS หรือ  Data Mining ก็ได้
·        -  Output    -     Web Browser

ประโยชน์ของ data warehouse
สามารถเข้าถึงข้อมูลได้เร็ว
     สามารถเข้าถึงข้อมูลได้ง่าย และบ่อย

Characteristics of Data Warehouse
1.       Organization เอาข้อมูลมาจัดเป็น Format ตาม Subject
2.       Consistency เนื่องจากข้อมูลมีความไม่สม่ำเสมอกัน เช่น เพศ หญิง ชาย ญ ช 1  0 ต้องทำให้ consist กันก่อนใน warehouse
3.       Time Variant
4.       Non-volatile ข้อมูลไม่มีการ update แต่มีการ refresh
5.       Relational
6.       Client/server

 องค์กรที่เหมาะจะใช้ Data warehouse มีลักษณะดังนี้
-         มีข้อมูลจำนวนมาก
-         ข้อมูลถูกเก็บไว้ในหลาย format
-         ผู้บริหารมีลักษณะ information-based approach
-         มีลูกค้าจำนวนมาก และหลากหลาย  
-         ข้อมูลเป็นปัจจัยสำคัญในการตัดสินใจทางธุรกิจ