Chapter 2 Intelligent Agents
အသိဉာဏ်ရှိသောအေးဂျင့်များ
"အေးဂျင့်တွေရဲ့
သဘောသဘာဝ၊ ပြီးပြည့်စုံသော သို့မဟုတ် မပြည့်စုံသော - ပတ်ဝန်းကျင်ရဲ့ ကွဲပြားမှု နဲ့
အေးဂျင့်အမျိုးအစားတွေရဲ့ မတူကွဲပြားတဲ့ရလဒ်တွေအကြောင်း ဆွေးနွေးထားတယ်။"
အခန်း ၁ မှာ ဉာဏ်ရည်တုဆိုင်ရာချဉ်းကပ်မှုရဲ့ ဗဟိုချက်အဖြစ် ဆင်ခြင်တုံတရားရှိသောအေးဂျင့် (rational agent) အယူအဆကို တင်ပြခဲ့တယ်။ ဒီအခန်းမှာ အဲ့ဒီအယူအဆကို ပိုမိုခိုင်မာစေမှာ ဖြစ်ပါတယ်။ စိတ်ကူးလို့ရနိုင်သမျှသောပတ်ဝန်းကျင်မှာ အလုပ်လုပ်နေတဲ့ အေးဂျင့် (agents operating in any
imaginable environment) ပေါင်းမြောက်များစွာအတွက် ဆင်ခြင်တုံတရားရဲ့သဘောတရား
(concept of
rationality) ကို အသုံးချနိုင်တယ်။ ဉာဏ်ရှိတယ်လို့ ကျိုးကြောင်းဆီလျော်စွာခေါ်ဆိုနိုင်တဲ့ အောင်မြင်တဲ့အေးဂျင့်တွေကို တည်ဆောက်ဖို့အတွက် ဒီဇိုင်းအခြေခံမူ (design principles) တစ်ခုတည်ဆောက်ဖို့ ဒီသဘောတရားကို အသုံးပြုရန်ဖြစ်တယ်။
ဒီအခန်းမှာ အေးဂျင့်တွေ ပတ်ဝန်းကျင်တွေ နဲ့ ၎င်းတို့ကြားမှာရှိတဲ့ ဆက်နွယ်ချိတ်ဆက်မှုကို စစ်ဆေးခြင်းဖြင့် စတင်လေ့လာမယ်။ အချို့အေးဂျင့်တွေဟာ တခြားအေးဂျင့်တွေထက် ပိုကောင်းအောင် ပြုမူတာကို သတိပြုမိခြင်းဟာ "အတတ်နိုင်ဆုံး ကောင်းစွာပြုမူသော အေးဂျင့်", "ဆင်ခြင်တုံတရားရှိသော အေးဂျင့်", "ကျိုးကြောင်းဆီလျော်သော အေးဂျင့်" (rational agent) ဆိုတဲ့ အယူအဆကို ဖြစ်ပေါ်လာစေတယ်။ အေးဂျင့်တစ်ခု ဘယ်လောက်ကောင်းမွန်စွာ ပြုမူနိုင်တယ် ဆိုတဲ့အချက်ဟာ ပတ်ဝန်းကျင်ရဲ့ သဘောသဘာဝပေါ်မှာ မူတည်တယ်။ အချို့သောပတ်ဝန်းတွေဟာ အခြားပတ်ဝန်းကျင်တွေထက် ပိုခက်တယ်။ ကျွန်တော်တို့ဟာ ပတ်ဝန်းကျင်ကို အကြမ်းဖျင်းအမျိုးအစားခွဲမယ်၊ ပတ်ဝန်းကျင်တစ်ခုရဲ့ ဂုဏ်သတ္တိတွေဟာ၊ အဲ့ဒီပတ်ဝန်းကျင်အတွက် သင့်လျော်တဲ့ အေးဂျင့်တွေရဲ့ ဒီဇိုင်းကို မည်ကဲ့သို့ လွှမ်းမိုးကြောင်း ပြသမှာဖြစ်တယ်။ ဒီစာအုပ်ရဲ့ နောက်ပိုင်းတွေမှာ ပုံဖော်သွားမဲ့ အခြေခံ "ပင်မကျောရိုးပုံကြမ်း"(skeleton) အေးဂျင့်ဒီဇိုင်းတွေကို ဖော်ပြထားပါတယ်။
2.1 Agents and
Enviroments
အေးဂျင့်
နှင့် ပတ်ဝန်းကျင်
အာရုံခံကရိယာ(sensor)
တွေကတဆင့်၊ ပတ်၀န်းကျင်
(environment) ရဲ့
အခြေအနေ (state)
ကို သိမြင်နားလည်အောင်
အာရုံခံ (percepts) ပြီး၊
အလိုအလျောက် တုန့်ပြန်ဆောင်ရွက်နိုင်တဲ့အရာ (actuator)
တွေကတဆင့်၊ အဲဒီပတ်၀န်းကျင်ကို
တစ်စုံတစ်ရာ
တုန့်ပြန်လုပ်ဆောင်တဲ့
အရာမှန်သမျှဟာ
အေးဂျင့် ဖြစ်တယ်။
Figure 2.1 Agents interact with environments through
sensors and actuators.
ဥပမာ။
• Thermostat, Cell phone, Vacuum
cleaner, Self-driving car, Human, Robot စတာတွေဟာ
agent တွေ။
• လူသားအေးဂျင့်
ရဲ့ အာရုံခံကရိယာ
sensor တွေဟာ နား၊
မျက်စိ၊ နှာခေါင်း
အစရှိတဲ့ အာရုံခံအင်္ဂါတွေဖြစ်ပြီး
တုန့်ပြန်ကရိယာ
actuator တွေကတော့
လက်၊ ခြေထောက်၊
ပါးစပ် စတဲ့
တုန့်ပြန်လုပ်ဆောင်တဲ့
ခန္ဓာကိုယ်အစိတ်အပိုင်းတွေ။
• စက်ရုပ်
ရဲ့
sensors တွေဟာ၊ Cameras, sound recorder, infrared range,
Smoke-detector စတာတွေဖြစ်ပြီး
actuator ကတော့ အဲဒီစက်ရုပ်
လှုပ်ရှား လည်ပတ်နိုင်ဖို့တည်ဆောက်ထားတဲ့
အထွေထွေ အမျိုးမျိုးသော
motors တွေ၊
arms (လက်တံ)
တွေ။
အေးဂျင့်တွေမှာ
၁။
ပတ်၀န်းကျင်(environment)
က သိမြင်ကြားမှုတွေကို
နားလည်အောင်လုပ်ဆောင်ခြင်း
(perceive)
၂။
အဆင့် ၁
ကရရှိလာတဲ့
perception နဲ့၊ သူ့ရဲ့
ရည်ရွယ်ချက်
ဦးတည်ချက်(goal)
ပေါ်မူတည်ပြီး
တွေးတောခြင်း၊
ဆုံးဖြတ်ခြင်း၊
ရွေးချယ်ခြင်း၊
တွက်ချက်ခြင်း
(think) နဲ့
၃။
တုန့်ပြန်ဆောင်ရွက်ခြင်း
(act)
ဆိုတဲ့
Circle of [perceive-->think-->act] ဆိုတဲ့အခြေအနေတွေဟာ
ထပ်တလဲလဲ ဖြစ်ပျက်နေပါတယ်။
အာရုံခံရရှိမှုနှင့်
အာရုံခံရရှိမှုအစီအစဉ်များ
(Percept and Percept Sequence)
·
ပေးထားတဲ့
သတ်မှတ်ထားတဲ့
အချိန်တစ်ခုမှာ
agent ရဲ့
input အဖြစ် ပတ်ဝန်းကျင်က
အာရုံခံရရှိလာတဲ့သတင်းအချက်အလက်တစ်ခုဟာ
percept
·
ပေးထားတဲ့
သတ်မှတ်ထားတဲ့
အချိန်တစ်ခုအထိ
agent က ပတ်ဝန်းကျင်ကနေ
အာရုံခံရရှိထားတဲ့
အချက်အလက်တွေအားလုံး(history)ဟာ
percept sequence
ယေဘုယျပြောမယ်ဆိုရင်
agent တစ်ခုဟာ၊
သူ့အတွက် လုပ်ဆောင်ချက်
(action) ရွေးချယ်တဲ့အခါ၊
သူအာရုံခံရရှိထားတဲ့
အချက်အလက်တွေအားလုံး
(percept sequence) အပေါ်မှာ
မူတည်ပြီးရွေးချယ်တာဖြစ်တယ်။
သူ မရရှိ
မသိရှိတဲ့ အချက်အလက်အပေါ်မှာ
အခြေမခံဘူး။
အေးဂျင့်ဖန်ရှင် နှင့် အေးဂျင့်ပရိုဂရမ် (Agent Function and Agent Program)
သင်္ချာဆန်ဆန်ပြောမယ်ဆိုရင်
အေးဂျင့်တစ်ခုရဲ့
အပြုအမူကို
agent function နဲ့ဖေါ်ပြတယ်။
agent
function က၊ ပေးထားတဲ့
percept sequence ကို
action တစ်ခုနဲ့
တွဲဖက်ချိတ်ဆက်ပေးတယ်။
artificial
agent တစ်ခုအတွက်
agent function ကို
အကောင်အထည်ဖေါ်ပေးတာက
agent program
ဒါကြောင့်
ဒီနှစ်ခုရဲ့အဓိက
ကွဲပြားခြားနားချက်က
·
agent function ဆိုတာ
အကောင်အထည်မရှိတဲ့
သင်္ချာဆိုင်ရာသတ်မှတ်ဖေါ်ပြချက်တစ်ခု
·
agent program ဆိုတာ
တကယ့် ရုပ်စနစ်
(physical system) တစ်ခုအတွင်းမှာ
အလုပ်လုပ်
(run)ဖို့ အကောင်အထည်ဖေါ်
တည်ဆောက်ထားတဲ့
အရာတစ်ခု။
အထက်မှာ ဆွေးနွေးခဲ့တဲ့
စကားလုံးတွေနဲ့
သဘောတရားကို
နားလည်ဖို့အတွက်
အလွန်ရိုးရှင်းတဲ့
"ဖုန်စုပ်စက်"
စနစ်တစ်ခုကို
ဥပမာအဖြစ်လေ့လာကြည့်ပါစို့။
Fig
2.2 Simple Vaccum-Cleaner
ဒီစနစ်အလုပ်လုပ်မယ့်
ပတ်ဝန်းကျင် (environment)
·
လေးထောင့်ကွက်
အေ နဲ့
ဘီ။
agent
က အာရုံခံရရှိတဲ့အခြေအနေ(percept)
·
သူ့ရဲ့လက်ရှိတည်နေရာ
(အေမှာလား။ ဘီမှာလား။
A or B)နဲ့
·
အဲဒီတည်နေရာရဲ့
အခြေအနေ(ညစ်ပတ်နေသလား။
သန့်ရှင်းနေသလား။
Dirty or Clean)
agent
ရဲ့ ရွေးချယ်နိုင်တဲ့လုပ်ရပ်action
တွေက
·
ဘယ်ကိုရွှေ့မလား။
ညာကိုရွှေ့မလား။
ဖုန်စုပ်မလား။
Left, Right, Suck,
ဒီစနစ်နဲ့ပတ်သက်ပြီး
သိပ်ကိုရိုးရှင်းလွန်းတဲ့
agent function တစ်ခုကို
အောက်ပါအတိုင်း
သတ်မှတ်နိုင်တယ်။
if the current square is dirty, then suck;
otherwise, move to the other square.
လက်ရှိ လေးထောင့်ကွက်သည် ညစ်ပေနေပါက၊ ဖုန်စုပ်ပါ။
ထိုသို့မဟုတ်ပါက၊ အခြားလေးထောင့်ကွက်သို့ ရွှေ့ပါ။
ဒီ agent ရဲ့ percept sequence နဲ့ အဲဒီအပေါ်မူတည်ပြီး ဆောင်ရွက်တဲ့ action တွေ၊ တစ်နည်းပြောရရင် agent function တွေကို (တစ်စိပ်တစ်ပိုင်း) ဇယားချကြည့်မယ်ဆိုရင် အောက်ပါအတိုင်းဖြစ်နိုင်ပါတယ်။
Percept
sequence |
Action |
[A, Clean]
|
Right |
[A, Dirty]
|
Suck |
[B, Clean]
|
Left |
[B, Dirty]
|
Suck |
[A, Clean], [A, Clean]
|
Right |
[A, Clean], [A, Dirty]
|
Suck |
... |
... |
... |
... |
[A, Clean], [A, Clean], [A, Clean]
|
Right |
[A, Clean], [A, Clean], [A, Dirty]
|
Suck |
... |
... |
... |
... |
Figure 2.3 Partial tabulation of a simple agent function for
the vacuum-cleaner world shown in Figure 2.2. The agent cleans the current
square if it is dirty, otherwise it moves to the other square. Note that the
table is of unbounded size unless there is a restriction on the length of possible
percept sequences. |
agent program တစ်ခုကို
လက်တွေ့ အကောင်အထည်ဖေါ် ရေးသားမယ်ဆိုရင်တော့ အောက်ပါအတိုင်း
ဖြစ်နိုင်ပါတယ်။
function REFLEX-VACUUM-AGENT([location, status]) returns an
action
if status = Dirty then return Suck
else if location = A then return Right
else if location = B then return Left
Please Note Copyright Notice:
No comments:
Post a Comment
Note: Only a member of this blog may post a comment.