Monday, July 3, 2017

အချက်အလက်သိပ္ပံပညာ

အချက်အလက်သိပ္ပံပညာ
သို့မဟုတ်
ကွန်ပျူတာသိပ္ပံနှင့် စာရင်းအင်းပညာတို့၏ဆုံမှတ်
မိတ်ဆက်နိဒါန်း   
                ဒီကနေ့ခေတ်အခါမှာ ကျွန်တော်တို့ဟာ ပမာဏအားဖြင့် အလွန့်အလွန် များပြားကြီးမားလှတဲ့အချက်အလက်(big data)တွေနဲ့ ရင်ဆိုင်ကြုံတွေ့နေကြရပါတယ်။ ဥပမာ အခြေခံအမှုန်အသစ်ကို ရှာဖွေတွေ့ရှိနိုင်ဖို့အတွက် သိပ္ပံပညာရှင်တွေ ရူပဗေဒပညာရှင်တွေ အသုံးပြုတဲ့   ဟက်ဒရွန်အမှုန်တိုက်စက်ကြီး (Large Hadron Collider - LHC)က တစ်စက္ကန့်ကို ပရိုတွန် တိုးတိုက်မှုပေါင်း သန်း-၆၀၀ အထိ လုပ်ပေးနိုင်တဲ့အတွက်၊ တစ်နှစ် တစ်နှစ်ကို ဂက်ဂါဘိုက် ၁၅-သန်း (15 million gigabytes or 15 petabytes) အထိရှိတဲ့ အချက်အလက်တွေကို စုဆောင်းထားရတယ်။ အဲဒီလောက်များပြားတဲ့ အချက်အလက်တွေကို သိပ္ပံပညာရှင်တွေ  ကိုင်တွယ်အသုံးပြုနေရတယ်။ (Source: public.web.cern.ch/Public/en/LHC/LHC-en.html) ဆူနာမီနဲ့ပတ်သက်တဲ့အချက်အလက်တွေဟာ စတင်မှတ်တမ်းတင်တဲ့အချိန်မှာ ၅-ဂက်ဂါဘိုက် သာရှိခဲ့ပေမယ့်၊ အခုအခါမှာ ဂက်ဂါဘိုက်ပေါင်း ၁၇၀၀ ကျော်ထိရှိနေတယ်။ (Source: nctr.pmel.noaa.gov/Dart/dart_home.html) ဒါ့အပြင် ၂၀၀၆ ခုနှစ်ရဲ့စစ်တမ်းအရတင်ပဲ  တကမ္ဘာလုံးမှာ ကျွန်တော်တို့ ဖန်တီးလိုက်တဲ့ ဒီဂျစ်တယ်အချက်အလက်ဟာ  1,288 x 10^18 bits ရှိပြီး၊ ကွန်ပျူတာရှုဒေါင့်ကကြည့်ရင် အဲဒီပမာဏဟာ  161 exabytes or 161 billion gigabytes ရှိပါတယ်။(တစ်ဘီလီယံ = သန်းပေါင်းတစ်ထောင်) ။ ဒီပမာဏ ဟာ ကမ္ဘာပေါ်မှာ ပုံနှိပ်ထုတ်ဝေခဲ့ပြီးသမျှသော စာအုပ်တွေထဲက အချက်အလက်တွေအားလုံးထက် အဆပေါင်း သန်း-၃၀၀ လောက်ပိုများပါတယ်။ (Source : The Expanding Digital Universe, IDC White Paper sponsored by EMC Corporation. March 2007။)  ၂၀၂၀ ခုနှစ်အရောက်မှာ ကမ္ဘာ့အချက်အလက်ပမာဏဟာ ၂၀၁၁ နှစ်တုန်းကပမာဏထက် အဆပေါင်းငါးဆယ်တိုးလာလိမ့်မယ်လို့ဆိုပါတယ်။ (Source: http://www.emc.com) ဒီလောက်ထိများပြားလှတဲ့ အချက်အလက်တွေကို စုဆောင်းဖို့ မှတ်တမ်းပြုဖို့ သိမ်းဆည်းဖို့၊ ကိုယ့်ရဲ့ လေ့လာမှု သုတေသနနယ်ပယ်အတွက်အသုံးပြုလို့ရဖို့ အဲဒီအချက်အလက်တွေကို ပုံစံချဖို့ နဲ့ သရုပ်ခွဲဆန်းစစ်လေ့လာဖို့၊ နောက်ဆုံးမှာ အဲဒီရှေ့ကရရှိခဲ့တဲ့ အချက်အလက် သုံးသပ်ချက်တွေအပေါ်မူတည်ပြီး ဆုံးဖြတ်ချက် တစ်စုံတစ်ခုချမှတ်တာ ဒါမှမဟုတ် အနာဂတ်အတွက် မှန်းဆတာလုပ်ဖို့ ဆိုတာတွေဟာ တကယ့်ကို စိန်ခေါ်မှုကြီးမားလှတဲ့ ကိစ္စရပ်တွေဖြစ်လာပါတယ်။ အဲဒီလိုကြီးမားလှတဲ့ စိန်ခေါ်မှုကို ကိုင်တွယ်ဖြေရှင်းနိုင်ဖို့ အချက်အလက်သိပ္ပံ(data science) ဆိုတဲ့ပညာရပ်ဟာ လိုအပ်ချက်ကြောင့်ပေါ်ထွန်းလာပါတော့တယ်။

အချက်အလက်သိပ္ပံပညာ ၏သမိုင်း
                ဒိန်းမတ်ကွန်ပျူတာသိပ္ပံပညာရှင်၊ ကွန်ပျူတာသိပ္ပံလောကအတွက် နိုဘယ်လ်ဆုလို ဂုဏ်သိက္ခာကြီးမားလှတဲ့ တားရင်းဆု(တချို့က ကျူးရင်းဟုအသံထွက်သည်။ Turing Award)ရှင် ပီတာနော Peter Naur(25 October 1928 – 3 January 2016)က၊ ကွန်ပျူတာသိပ္ပံ ဆိုတဲ့စကားလုံးကို အစားထိုးဖို့ဆိုတဲ့ရည်ရွယ်ချက်နဲ့ ၁၉၆၀ လောက်ကတည်းက စတင်သုံးစွဲခဲ့တဲ့၊ အဲဒီ အချက်အလက်သိပ္ပံ ဆိုတဲ့ဝေါဟာရကို အချက်အလက်ဗေဒ (datalogy) ဆိုတဲ့စကားလုံးနဲ့ အပြန်အလှန်ဖလှယ်ပြီး စတင်အသုံးပြုခဲ့ကြတယ်။ ပီတာနော ၁၉၇၄ မှာ  ရေးသားထုတ်ဝေခဲ့တဲ့ "ကွန်ပျူတာနည်းလမ်းများအား တိကျစွာ တိုင်းတာစစ်ဆေးလေ့လာသုံးသပ်ခြင်း Concise Survey of Computer Methods " ဆိုတဲ့စာအုပ်မှာ အဲဒီ အချက်အလက်သိပ္ပံဆိုတဲ့စကားလုံးကို တရားဝင် ကျယ်ကျယ်ပြန့်ပြန့် သီးသီးသန့်သန့် စတင်သုံးစွဲခဲ့ပါတယ်။ ညီလာခံခေါင်းစဉ်ကြီးတစ်ခုထဲမှာ ပထမဆုံးအကြိမ်အဖြစ် ထည့်သွင်းအသုံးပြုခဲ့တာကတော့ အပြည်ပြည်ဆိုင်ရာ အမျိုးအစားခွဲခြားခြင်းပညာရပ်ဆိုင်ရာအသင်းများအဖွဲ့ချုပ် (International Federation of Classification Societies - IFCS)က၊ 1996 ခုနှစ် ဂျပန်နိုင်ငံ ကိုဘေး(Kobe)မြို့ မှာကျင်းပခဲ့တဲ့ " အချက်အလက်သိပ္ပံပညာ နှင့် အမျိုးအစားခွဲခြားခြင်းပညာ တို့နှင့်ဆိုင်သော နည်းလမ်းများ  Data Science, classification, and related methods" ဆိုတဲ့ ညီလာခံကြီးမှာပါ။
                အဲဒီနောက် ၂၀၀၁ ခုနှစ်မှာ၊ အမေရိကန်နိုင်ငံ အင်ဒီယားနားပြည်နယ် ပါဂျူးတက္ကသိုလ်ရဲ့ ကွန်ပျူတာသိပ္ပံပါမောက္ခ နဲ့ စာရင်းအင်းပညာပါမောက္ခ ဝီလီယံ အက်စ် ကလိဗ်လန်း William S. Cleveland (born 1943)က၊ တိုးတက်ချဲ့ထွင်ထားတဲ့ စာရင်းအင်းပညာကို အဆင့်မြင့်တွက်ချက်ခြင်းပညာရပ်နဲ့ပေါင်းစည်းပြီး အချက်အလက်သိပ္ပံပညာကို သီးခြားပညာရပ် သီးသန့်ဘာသာရပ်တစ်ခုအဖြစ်၊ ၂၀၀၁ ဧပြီလထုတ် အပြည်ပြည်ဆိုင်ရာ စာရင်းအင်းပညာသုံးသပ်ချက် International Statistical Review (အတွဲ-၆၉၊ အမှတ်-၁) စာစောင်မှာ "Data Science: An Action Plan for Expanding the Technical Areas of the Field of Statistics" ဆိုတဲ့ဆောင်းပါးနဲ့
စတင်မိတ်ဆက်ခဲ့ပါတယ်။  ၂၀၀၂ ခုနှစ် ဧပြီလမှာ အပြည်ပြည်ဆိုင်ရာသိပ္ပံကောင်စီ ရဲ့ အချက်အလက်သိပ္ပံနှင့်နည်းပညာကော်မတီ  (The International Council for Science: Committee on Data for Science and Technology - CODATA)က အချက်အလက်သိပ္ပံပညာဂျာနယ် ကိုစတင်ထုတ်ဝေခဲ့ပါတယ်။ လျှပ်စစ်နှင့် အီလက်ထရောနစ်အင်ဂျင်နီယာသိပ္ပံ (IEEE)က ၂၀၁၃ ခုနှစ်မှာ " အချက်အလက်သိပ္ပံပညာ နှင့် အဆင့်မြင့် သရုပ်ခွဲဆန်းစစ်လေ့လာမှုပညာ Data Science and Advanced Analytics" လုပ်ငန်းအဖွဲ့ ကိုစတင်ဖွဲ့စည်းခဲ့ပြီး ၂၀၁၄ ခုနှစ်မှာ  အချက်အလက်သိပ္ပံပညာနဲ့ဆိုင်တဲ့ အပြည်ပြည်ဆိုင်ရာ ညီလာခံကြီးကို ပထမဆုံးအကြိမ်ကျင်းပခဲ့ပါတယ်။ 

အချက်အလက်သိပ္ပံပညာ နှင့် စာရင်းအင်းပညာ
                တစ်ချို့သော စာရင်းအင်းပညာရှင်တွေ (ဥပမာ ဂစ်လ် ပရက်စ် Gil Press နဲ့ အသုံးချစာရင်းအင်းပညာရှင် နိတ် ဆစ်လ်ဗား Nate Silver) ကတော့ အချက်အလက်သိပ္ပံ ဆိုတဲ့ ဝေါဟာရသုံးစွဲတာကို သဘောမတူကြပါဘူး။ သူတို့က  ဒီ အချက်အလက်သိပ္ပံ ဆိုတဲ့ပညာရပ်ဟာ စာရင်းအင်းပညာနဲ့  အချက်အလက်သရုပ်ခွဲဆန်းစစ်လေ့လာခြင်းပညာရပ်(Data Analytics)ကို ပေါင်းစည်းအသုံးချခြင်းသာဖြစ်တယ်။  အချက်အလက်သိပ္ပံပညာရှင် လို့ဆိုသူတွေဟာ စာရင်းအင်းပညာရှင်တွေသာဖြစ်တယ်။ အဲဒီ စကားလုံး အချက်အလက်သိပ္ပံပညာ ဆိုတာ ပိုပြီးကြားကောင်းအောင် ခေါ်ထားတဲ့ ခေတ်ပေါ်အဆန်းထွင်စကားလုံးသာဖြစ်တယ်။ ဘာလို့လဲဆိုတော့ အဲဒီ အချက်အလက်သိပ္ပံပညာ ဆိုတဲ့စကားလုံးအတွက် တိကျတဲ့ အဓိပ္ပါယ်သတ်မှတ်ချက်တောင်မှ မရှိဘူး... စသည်ဖြင့် ငြင်းချက်ထုတ်ကြပါတယ်။ (မှတ်ချက်။ ကွန်ပျူတာသိပ္ပံ ဆိုတဲ့ ပညာရပ်အတွက်တောင် တိကျတဲ့ တစ်ကမ္ဘာလုံးလက်ခံတဲ့ အဓိပ္ပါယ်သတ်မှတ်ချက်မျိုး မရှိသေးပါဘူး။)
                ကျွန်တော့အနေနဲ့ အချက်အလက်သိပ္ပံပညာဆိုတာဟာ စာရင်းအင်းပညာမျှသာမဟုတ်ဘူးဆိုတာကို အလွန်သိသာထင်ရှားတဲ့ နယ်ပယ်နှစ်ခုနဲ့ ဥပမာပေးနိုင်ပါတယ်။ ပထမအချက်က သန်းနဲ့ချီရှိနေတဲ့ ဓါတ်ပုံ ရုပ်ပုံတွေကို အသုံးပြုပြီး သရုပ်ခွဲဆန်းစစ်လေ့လာတဲ့ မျက်နှာသွင်ပြင်မှတ်မိသိရှိခြင်းစနစ်တို့၊ ရုပ်ပုံတွေကို အမျိုးအမည် အုပ်စုခွဲတဲ့ (image classification, object recognition, လက်ဗွေရာတိုက်ဆိုင်စစ်ဆေးခြင်း တို့လို) အလုပ်မျိုးတွေကို ရှုပ်ထွေးအဆင့်မြင့်တဲ့ ကွန်ပျူတာသိပ္ပံ အယ်လ်ဂိုရစ်သမ်တွေ၊ စွမ်းရည်မြင့်ကွန်ပျူတာတွေရဲ့ အကူအညီမပါပဲ ဘယ်လိုမှလုပ်ဆောင်ဖို့မဖြစ်နိုင်ပါဘူး။ ဒုတိယတစ်ချက်က စကားသံမှတ်မိခြင်း၊ စကားလုံးမှ စကားသံသို့ပြောင်းခြင်း၊ စကားသံမှ စကားလုံးသို့ပြောင်းခြင်းတို့လို အသံသရုပ်ခွဲလေ့လာဆန်းစစ်ခြင်း(Voice/Sound Analytics) အလုပ်တွေကို စာရင်းအင်းပညာ သက်သက်နဲ့ ဘယ်လိုမှ လုပ်နိုင်မှာမဟုတ်ပါဘူး။ ဒါကြောင့် အချက်အလက်သိပ္ပံ ဆိုတာ ရင့်ကျက်တည်ငြိမ်ပြီးသား စာရင်းအင်းပညာရပ်နဲ့ နုနယ်သေးပေမယ့်အစွမ်းထက်လှတဲ့ ကွန်ပျူတာသိပ္ပံပညာရပ်တို့ပေါင်းစည်းထားတဲ့အတွက်သာ၊ အခုလက်ရှိမှာ ကျွန်တော်တို့ရင်ဆိုင်နေရတဲ့ အလွန့်အလွန်ကြီးမားများပြားတဲ့ အချက်အလက်ပိုင်းဆိုင်ရာပြဿနာတွေကို ထိထိရောက်ရောက် အောင်အောင်မြင်မြင် ဖြေရှင်းနိုင်တဲ့ အသုံးချသိပ္ပံပညာရပ်တစ်ခုဖြစ်တာလာလို့ဆိုချင်ပါတယ်။

အချက်အလက်သိပ္ပံပညာ ဆိုတာဘာလဲ
                အချက်အလက်သိပ္ပံပညာခေါ် အချက်အလက်အသုံးချသိပ္ပံပညာ (data-driven science) အတွက် အားလုံးလက်ခံထားတဲ့ တိကျတဲ့ အဓိပ္ပါယ်သတ်မှတ်ချက်တစ်ခု အခု(၂၀၁၇)အထိတော့ မရှိသေးပါဘူး။ ယေဘုယျပြောမယ်ဆိုရင် "အချက်အလက်သိပ္ပံဆိုတာ အပြန်အလှန် ကူးလူးဆက်နွယ်နေတဲ့ပညာရပ်တွေ၊ သိပ္ပံဆိုင်ရာ နည်းလမ်းတွေ၊ ဖြစ်စဉ်တွေ၊ စနစ်တွေ ကို အသုံးချပြီး၊ ပုံစံတကျဖြစ်ဖြစ် ပုံစံတကျမဟုတ်ပဲဖြစ်ဖြစ်(structured or unstructured) ရှိနေတဲ့ အချက်အလက်တွေထဲကနေ အသိပညာ ဒါမှအဟုတ် အတွေးအမြင်ကို ဖေါ်ထုတ် ရယူတဲ့ပညာရပ်တစ်ခုဖြစ်ပါတယ်။"  ဒီပညာရပ်ဟာ၊ အချက်အလက်ဘဏ်များအတွင်းမှ အသိပညာကိုရှာဖွေခြင်း  (Knowledge Discovery in Databases - KDD) ဆိုတဲ့ လုပ်ငန်းနဲ့ သဘောသဘာဝခြင်း ဆင်တူပါတယ်။
                ကွန်ပျူတာတွေအသုံးပြုပြီးလုပ်ရုံနဲ့၊ ဆော့ဖ်ဝဲတွေအသုံးပြုပြီးလုပ်ရုံနဲ့၊ ဒေတာအချက်အလက်တွေအများကြီးသုံးရုံနဲ့တော့ အချက်အလက်သိပ္ပံပညာမဟုတ်ပါဘူး။ အချက်အလက်အသုံးချဆော့ဖ်ဝဲတစ်ခုရဲ့တန်ဘိုးဟာ ဒေတာအချက်အလက်တွေဆီကနေဆင်းသက်လာရမယ်။ ပြီးတော့ အကျိုးဆက်အဖြစ် အသစ်အသစ်သော တခြား အချက်အလက်တွေကိုထပ်မံဖန်တီးထုတ်လုပ်ရမယ်။ ဒါကြောင့် အချက်အလက်အသုံးချ အဆင့်မြင့် ဆော့ဖ်ဝဲတစ်ခုဆိုတာ ဒေတာအများကြီးအသုံးပြုတဲ့ အသုံးချဆော့ဖ်ဝဲတစ်ခုမျှသာမဟုတ်ပဲ၊ ဒေတာထုတ်ကုန်(data porduct) တစ်ခုလည်းဖြစ်တယ်။ အချက်အလက်သိပ္ပံပညာဆိုတာ အဲဒီလို ဒေတာထုတ်ကုန်တွေကို ဖန်တီးနိုင်စွမ်းရှိစေတဲ့ ပညာရပ်နယ်ပယ်တစ်ခုဖြစ်တယ်။
                အချက်အလက်သိပ္ပံဆိုတဲ့ပညာရပ်ဟာ သင်္ချာပညာ၊ စာရင်းအင်းပညာ၊ သတင်းအချက်အလက်သိပ္ပံ နဲ့ ကွန်ပျူတာသိပ္ပံ တို့လို ပင်မကျောရိုးပညာရပ်တွေနဲ့၊  စက်-ကွန်ပျူတာ၏လေ့လာခြင်းပညာ machine learning, အမျိုးအစားခွဲခြားခြင်းပညာ classification, အုပ်စုခွဲလေ့လာသုံးသပ်မှုပညာ cluster analysis, အချက်အလက်များမှ အသုံးဝင်သော တန်ဘိုးရှိသော အရေးပါသော သတင်းအချက်အလက်များအား တူးဆွရှာဖွေခြင်းပညာ data mining, အချက်အလက်ဘဏ်ပညာနဲ့  အချက်အလက်တွေကိုရုပ်ပုံကားချပ်တွေအသုံးပြုပြီးဖေါ်ပြခြင်း visualization တို့လို ကိုင်းကွဲပညာရပ်နယ်ပယ်တွေက သီအိုရီတွေ နည်းစနစ်တွေကို ပေါင်းစည်းမွှေနှောက် အသုံးချရတဲ့ပညာရပ်မျိုးဖြစ်တယ်။
အမေရိကန် ကွန်ပျူတာသိပ္ပံပညာရှင်၊ တားရင်းဆုရှင် ဂျင်မ် ဂရေး Jim Gray (January 12, 1944 တွင်မွေးဖွား၍ January 28, 2007 တွင် ဆန်ဖရန်ဆစ်စကို ပင်လယ်ပြင်၌ ရွက်လွှင့်ရင်း ပျောက်ဆုံးခဲ့သည်။)က အချက်အလက်သိပ္ပံကို  သိပ္ပံပညာ၏စတုတ္ထပုံစံ (fourth paradigm စတုတ္ထပါရာဒိုင်း)[လက်တွေ့လုပ်ဆောင်မှုသိပ္ပံ၊ သီအိုရီသိပ္ပံ၊ တွက်ချက်မှုသိပ္ပံ၊ အချက်အလက်သိပ္ပံ empirical, theoretical, computational,data-driven: sciences]အဖြစ်ရှုမြင်ခဲ့ပြီး၊  "သတင်းအချက်အလက်နည်းပညာရဲ့ အကျိုးသက်ရောက်မှုကြောင့် သိပ္ပံပညာနဲ့ပတ်သက်တဲ့ အရာရာဟာ ပြောင်းလဲနေတယ်"လို့ ဆိုခဲ့ပါတယ်။ ဒါကြောင့်အရာရာပြောင်းလဲနေတဲ့ သိပ္ပံပညာရပ်တွေကို အကောင်းဆုံးနားလည်စေမှာက အချက်အလက်သိပ္ပံပညာရပ်ပဲဖြစ်ပါတယ်။

အချက်အလက်သိပ္ပံပညာ ၏လုပ်ငန်းစဉ်များ
အချက်အလက် သိပ္ပံပညာရှင်တွေရဲ့ လုပ်ငန်းစဉ်တွေမှာ
၁။ ပြင်ပလက်တွေ့ကမ္ဘာမှ အချက်အလက်များအား ကောက်ယူစုဆောင်းခြင်း။(Data Collecting)
၂။ လိုအပ်ချက်ပေါ်မူတည်၍ ၎င်းအချက်အလက်များအား ရွေးချယ်ခြင်း၊ ပြင်ဆင်ခြင်း၊ ဖြည့်စွက်ခြင်း၊ ပယ်ဖျက်ခြင်း (Data Processing Or Data Cleansing)
၃။ လိုအပ်ချက်ပေါ်မူတည်၍ အုပ်စုဖွဲ့အချက်အလက်Group Data များအား data အမျိုးအစားပြောင်းလဲခြင်း၊ ကိန်းဂဏန်းများ အားအချိုးချခြင်း၊ နှင့် သင်္ချာနှင့် စာရင်းအင်းပညာရပ်များကို အသုံးချ၍ အချက်အလက်များ၏ သွင်ပြင်လက္ခဏာ အမျိုးအစား တန်ဘိုး စသည်များကို ပြောင်းလဲခြင်း (Data Transformation)
၄။ အချက်အလက်များအတွင်းမှ အသုံးဝင်သော တန်ဘိုးရှိသော အရေးပါသော သတင်းအချက်အလက်များအား စူးစမ်းလေ့လာဖေါ်ထုတ်ခြင်း (Data Mining)
5. ဖေါ်ထုတ်ရရှိတဲ့ သတင်းအချက်အလက်တွေကို အဓိပ္ပါယ်ပြန်ဆိုခြင်း၊ အနက်အဓိပ္ပါယ်ဖေါ်ထုတ်ခြင်း၊ လုပ်ဆောင်ချက်များနှင့် ရလာဒ်များအား အကဲဖြတ်သုံးသပ်ခြင်း(Interpretation and evaluation)
                ဆိုတဲ့ အဆင့်တွေပါဝင်ပါတယ်။ အထက်ပါအဆင့်တွေထဲက တစ်ချို့ ဒါမှမဟုတ် အားလုံးဟာ ထပ်ပြန်တလဲလဲဖြစ်ပျက်နေနိုင်ပါတယ်။

Fig: The Computing Community Consortium Big Data Whitepaper (2012)
(http://www.cra.org/ccc/files/docs/init/bigdatawhitepaper.pdf)

အချက်အလက်သိပ္ပံပညာအား အသုံးချသောနယ်ပယ်များ
                တကယ်တော့ ဒီအချက်အလက်သိပ္ပံပညာရပ်ကို ဘယ်လိုနေရာတွေမှာ အသုံးချသလဲဆိုတာရေးပြရရင် ကုန်နိုင်ဖွယ်မရှိပါဘူး။ စီးပွားရေး၊ နိုင်ငံရေး၊ လူမှုရေး၊ ဆေးပညာ၊ သိပ္ပံပညာ စတဲ့နယ်ပယ်တိုင်းရဲ့ သုတေသနလုပ်ငန်းတွေမှာ ပုံစံအမျိုးမျိုးနဲ့ အသုံးချနေကြတာပါ။ အဲဒီထဲကတစ်ချို့ကတော့
·         မှတ်တမ်းမှတ်ရာတွေ အချက်အလက်တွေအရ ကမ္ဘာ့စီးပွားရေး၊ ရေနံစျေး၊ စတော့ရှယ်ရာစျေး တွေရဲ့ (ဖြစ်နိုင်ခြေရှိတဲ့) အပြောင်းအလဲအတက်အကျတွေကို ခန့်မှန်းတာမျိုး
·         ဘဏ်တစ်ခုဟာ သူ့ ဖေါက်သည်တွေရဲ့ ဝင်ငွေ၊ ငွေကြေးသုံးစွဲမှုပုံစံ၊ ပုဂ္ဂိုလ်ရေးအချက်အလက်တွေပေါ်မူတည်ပြီး အဲဒီဖေါက်သည်ဟာ အကြွေးတွေပြန်ဆပ်နိုင်ခြေရှိမရှိ ခန့်မှန်းတဲ့နေရာမျိုး
·         ရုက္ခဗေဒဆိုင်ရာ ဇီဝဗေဒဆိုင်ရာ အချက်အလက်တွေကို အသုံးပြုပြီး အသစ်တွေ့ရှိတဲ့ အပင်မျိုးစိပ်တစ်ခု၊ သက်ရှိမျိုးစိပ်တစ်ခုကို ဘယ်အုပ်စုမှာ ထားမလဲ၊ ဘယ်လိုအုပ်စုခွဲရမလဲ ဆိုတာမျိုး
·         လူတွေရဲ့ ပညာရေး လူမှုရေး စီးပွားရေးဆိုင်ရာအချက်အလက်တွေကိုကြည့်ပြီး၊ ထုတ်ကုန်တစ်ခုခု(မော်တော်ကား၊ ဆိုင်ကယ်၊ စက်ဘီး.. စသည်) ကို ဝယ်ယူသုံးစွဲနိုင်ခြေ ဘယ်လောက်ရှိသလဲဆိုတာမျိုး
·         လူ့DNA အချက်အလက်တွေကိုကြည့်ပြီး ရောဂါတစ်ခုခုဖြစ်နိုင်ခြေတို့ သက်တမ်းခန့်မှန်းတာတို့လိုမျိုး
·         လူမှုကွန်ယက် social media ပေါ်မှာရှိတဲ့ လူတွေရဲ့ကိုယ်ရေးအချက်အလက်တွေနဲ့ သူတို့မှတ်ချက်ပြုထားတဲ့ ကြိုက် မကြိုက် (like or dislike) ဆိုတဲ့အချက်တွေအပေါ်အခြေခံပြီး ဘယ်သူက ဘယ်လိုရုပ်ရှင်မျိုး၊ ဘယ်လိုစာအုပ်မျိုးကို ကြိုက်နှစ်လောက်တယ်ဆိုတာကို အကြံညာဏ်ပေးတာမျိုး
·         စာရေးဆရာ တစ်ရောက်ရဲ့ စာအုပ်စာတမ်းတွေထဲကနေ၊ သူရဲ့အများဆုံးအသုံးပြုလေ့ရှိတဲ့စကားလုံး၊ သူရဲ့ ရေးသားဟန်၊ စတာတွေကို ဖေါ်ထုတ်တာမျိုး၊ စာတစ်ပုဒ်ကို အဲဒီစာရေးဆရာကိုယ်တိုင်ရေးတာဟုတ် မဟုတ်ဆိုတဲ့ကိစ္စမျိုး
·         စကားပြောတွေ မိန့်ခွန်းတွေထဲက လေသံနဲ့ (စကားလုံးသက်သက်မျှမဟုတ်)၊ လေယူလေသိမ်း ကိုလေ့လာပြီး သူရဲ့စိတ်အခြေအနေကို ခန့်မှန်းတာမျိုး
                စတဲ့စတဲ့ ကိစ္စမျိုးတွေမှာ အချက်အလက်သိပ္ပံပညာရဲ့ နည်းစနစ်တွေ၊ လုပ်ထုံးလုပ်နည်းတွေကို အသုံးချပြီး လေ့လာဖေါ်ထုတ်ကြတာပါ။ အထူးသတိပြုသင့်တဲ့အချက်ကတော့ ဒီအချက်အလက်သိပ္ပံပညာရပ်ရဲ့ ခန့်မှန်းချက်တွေ၊ ဟောကိန်းတွေဟာ၊ တခြားနယ်ပယ်က တစ်ချို့ ပညာရှင်တွေ၊ ပညာရှင်ဟုအဆိုရှိသူတွေ တစ်ခါတစ်ရံမှာ ဟောကိန်းထုတ် ခန့်မှန်း  ဝေဖန် မှတ်ချက်ပြုကြတဲ့ ပုံစံမျိုးနဲ့ လုံးဝကွဲပြားခြားနားတယ်ဆိုတာပါပဲ။ အချက်အလက်သိပ္ပံဆိုတာက ပြင်ပကမ္ဘာရဲ့ တကယ့်လက်တွေ့အချက်အလက်တွေကိုအခြေခံတယ်။ အဲဒီအချက်အလက်တွေက ပြောတဲ့ ညွှန်းတဲ့ အချက်ကို အချက်အလက်သိပ္ပံပညာရှင်က ရှာဖွေဖေါ်ထုတ်တာသာဖြစ်တယ်ဆိုတာပါပဲ။ အချက်အလက်သိပ္ပံပညာရှင်ရဲ့ ရှာဖွေဖေါ်ထုတ်မှုက ဘယ်လောက်အတိုင်းအတာထိမှန်ကန်သလဲဆိုတာကတော့ ပညာရပ်ပိုင်းဆိုင်ရာ သီးခြားကိစ္စဖြစ်ပါတယ်။


အချက်အလက်သိပ္ပံပညာ နှင့့်် အနာဂတ်
                2012 မှာ ထုတ်ဝေခဲ့တဲ့ ဟားဗတ်စီးပွားရေးသုံးသပ်ချက်စာစောင် Harvard Business Review ရဲ့ ဆောင်းပါး "Data Scientist: The Sexiest Job of the 21st Century" မှာ ဆောင်းပါးရှင် ဒီဂျေ ပတေးလ် DJ Patil (ပရော်ဖက်ရှင်နယ် လူမှုကွန်ယက် လင့်ခ်ဒင် ၏ သိပ္ပံပညာရှင်ချုပ် - chief scientist at LinkedIn)က "အချက်အလက်သိပ္ပံပညာရှင်အလုပ်ဟာ ၂၁ရာစုရဲ့ တပ်မက်စရာအကောင်းဆုံးအလုပ် ဖြစ်ကြောင်း၊ အချက်အလက်သိပ္ပံပညာရှင်ဆိုတာ မျိုးစိပ်သစ်တစ်ခုဖြစ်ပြီး၊ အဲဒီလိုပညာရှင်မျိုးတွေ ရှားပါးခြင်း မလုံလောက်ခြင်း ပြတ်လပ်ခြင်းဟာ တစ်ချို့သောနယ်ပယ်တွေအတွက် သိပ်ကိုကြီးမားတဲ့ပြဿနာတစ်ရပ်ဖြစ်လာနေပြီ" လို့ ဆိုထားပါတယ်။ အွန်လိုင်းပညာရေးစင်တာကြီး edX နဲ့ Glassdoor ကုမ္ပဏီကြီးရဲ့အဆိုအရ လက်ရှိ ၂၀၁၇မှာ အမေရိကားရဲ့ နံပါတ်တစ်အလုပ်ဟာ အချက်အလက်သိပ္ပံပညာရှင်အလုပ်ဖြစ်တယ်လို့ဆိုပါတယ်။ Microsoft ရဲ့ သုတေသနပြုလုပ်ချက်တွေအရ ကမ္ဘာပေါ်မှာ အချက်အလက်သိပ္ပံရှင်အလုပ်မျိုးတွေ ၁.၃ သန်းအထိ လိုအပ်နေတယ်လို့ဆိုပြီး၊ အကြံပေးကုမ္မကြီး McKinsey & Company ရဲ့ ခန့််မှန်းချက်အရ ဆိုရင်တော့  ၂၀၁၈ ခုနှစ်မှာ big data တွေကို ကိုင်တွယ်အသုံးပြုရမယ့်အလုပ်အကိုင်ပေါင်း ၄-သန်းထိရှိနိုင်ပြီး၊ US တစ်နိုင်ငံထဲမှာတင်ပဲ အချက်အလက်သိပ္ပံပညာရှင်တွေ ၁၄၀,၀၀၀ ကနေ ၁၉၀,၀၀၀ အထိ လိုအပ်မှုရှိလိမ့်မယ်ဆိုပါတယ်။ ပညာရေးမှာ အမြဲထိပ်ဆုံးကပြေးနေတဲ့ ကမ္ဘာ့ထိပ်တန်း တက္ကသိုလ်ကြီးတွေဖြစ်တဲ့ အမ်အိုင်တီ၊ ဟားဗတ်၊ ကိုလံဘီယာ၊ စတင်းဖို့ဒ်၊ ကင်းဗရစ်ချ်၊ နဲ့ အောက်စ်ဖို့ဒ် စသည်တို့မှာ အချက်အလက်သိပ္ပံ ဆိုင်တဲ့ ပညာရပ်တွေကို ခေါင်းစဉ်အမျိုးမျိုးနဲ့ သင်ကြားနေကြပါပြီ။ ဒါ့အပြင် ပုဂ္ဂလိကပညာရေးစင်တာတွေ၊ ကော်ပိုရေးရှင်းကြီးတွေ၊ စခန်းသွင်းလေ့ကျင့်ပေးတဲ့သင်တန်းတွေမှာပါ DS ကို ပုံစံအမျိုမျိုးနဲ့ သင်ကြားပေးနေကြပါပြီ။ ကဲ ဒါဆိုရင် ကျွန်တော်တို့ဟာ ဒီအချက်အလက်သိပ္ပံပညာရပ်ကို လေ့လာသင်ယူထားဖို့ သင့် မသင့်၊ အနဲဆုံးတော့ တီးမိခေါက်မိအောင် ထိတွေ့လေ့လာထားသင့် မသင့် ဆိုတဲ့ကိစ္စဟာ စဉ်းစားဖို့တောင်မလိုအပ်တော့ဘူးလို့ ယူဆပါတယ်။
ရွှင်လန်းချမ်းမြေ့ပါစေ။

ကျော်ခိုင်စိုး(infoTherapy)
XSeries Certificate on Data Science and Analytics in Context (Columbia University)
Professional Certificate on  Data Science for Executives (Columbia University)

Microsoft Professional Program Certificate for Data Science

No comments:

Post a Comment

Note: Only a member of this blog may post a comment.