SEE: Exercises, Page-61
2.3 For each of the following assertions, say whether it
is true or false and support your answer with examples or counterexamples where
appropriate.
Q: အောက်ပါအခိုင်အမာအဆိုပြုချက်များ
မှားသည် မှန်သည် ဆုံးဖြတ်ပါ။ သင်၏အဖြေအတွက် အထောက်အကူပြု ဥပမာများ ရှင်းလင်းချက်များ
သင့်လျော်ရာပေးပါ။
A:
a. An agent
that senses only partial information about the state cannot be perfectly
rational.
ပတ်ဝန်းကျင်အခြေအနေနှင့်ပတ်သက်၍ သတင်းအချက်အလက် တဝက်တပျက်သာ
အာရုံခံနိုင်သော agent တွင် ပြည့်စုံသောကြောင်းကျိုးမှန်ကန်မှုမရှိနိုင်ပါ။
မှား။
ပြည့်စုံတဲ့ ကြောင်းကျိုးမှန်ကန်မှုဆိုတာ
အာရုံခံပစ္စည်းတွေက ပတ်ဝန်းကျင်ကနေ အချက်အလက်ရရှိတဲ့အပေါ် မှာ(အဲဒီ သတင်းအချက်အလက်က
နည်းသည်ဖြစ်စေ၊ များစည်ဖြစ်စေ၊ ပြည့်စုံသည်ဖြစ်စေ၊ မပြည့်စုံသည်ဖြစ်စေ)ကောင်းမွန်တဲ့
ဆုံးဖြတ်ချက်ချနိုင်တဲ့ စွမ်းရည်ကို ရည်ညွှန်းတာဖြစ်တယ်။ ဒါကြောင့် သတင်းအချက်အလက်
တစ်ဝက်တစ်ပျက်ပဲရလို့ rational မဖြစ်နိုင်ဘူးဆိုတာ မှားတယ်။ တစ်ဝက်တစ်ပျက်ပဲရလဲ (အားလုံးမဟုတ်ပေမယ့်
တစ်ချို့ agent တွေဟာ) rational ဖြစ်နိုင်ရမယ်။
b. There exist task environments in which no pure
reflex agent can behave rationally.
ဘယ်လို တုန့်ပြန်ဆောင်ရွက်သောအေးဂျင့်စစ်စစ်အတွက်မဆို
ကြောင်းကျိုးနဲ့အညီ မှန်မှန်ကန်ကန် မပြုမူနိုင်တဲ့ လုပ်ဆောင်မှုပတ်ဝန်းကျင်မျိုးရှိတယ်။
မှန်။
တုန့်ပြန်ဆောင်ရွက်သောအေးဂျင့်စစ်စစ်က
အရင်(အတိတ်)က အာရုံခံရရှိခဲ့တဲ့ အချက်အလက်တွေကို လျစ်လျူရှုလိုက်တယ်။ မသုံးတော့ဘူး။
ဒါကြောင့် တစ်ဝက်တစ်ပျက်ပဲ လေ့လာလို့ရတဲ့ပတ်ဝန်းကျင်မှာဆိုရင် အကောင်းဆုံးအခြေအနေကို
မခန့်မှန်းနိုင်ဘူး။ ဥပမာ စစ်တုရင်ကစားတဲ့ကိစ္စကိုကြည့်ပါ။ တစ်ခြားပြိုင်ဖက်က ရွှေ့လိုက်တဲ့အကွက်ဟာ
၊ agent အတွက် လတ်တလော လက်ရှိ အခြေအနေကို အာရုံခံလို့ရလိုက်တဲ့သတင်းအချက်အလက်ဖြစ်တယ်။
တုန့်ပြန်ဆောင်ရွက်သောအေးဂျင့်ဆိုတာက အရင့်အရင် ကစားကွက်တွေ စစ်တုရင်ခုံရဲ့အခြေအနေတွေကို
ပြန်ပြီး ထောက်လှမ်းသုံးသပ်နိုင်တဲ့အခြေအနေမရှိဘူး။ သူက အာရုံခံရရှိမှုအစီအစဉ်များ
percept history ၊ percept sequence ကိုမှ မှတ်သားမထားတာကိုး။ ဒါကြောင့် သူ ရွှေ့ရမယ့်အလှည့်မှာ
အရင်ကစားကွက်တွေဘယ်လိုရှိခဲ့ ရှိခဲ့၊ အဲဒါတွေကို ဘာမှ ထည့်မစဉ်းစားပဲ လွတ်တဲ့နေရာ ရွှေ့ထည့်လိုက်မယ့်
သဘောမျိုးဖြစ်နေတဲ့အတွက်၊ တုန့်ပြန်ဆောင်ရွက်သောအေးဂျင့်စစ်စစ် pure reflex agent တစ်ခုဟာ၊
အဲဒီလို တစ်ဝက်တစ်ပျက်ပဲလေ့လာလို့ရတဲ့ပတ်ဝန်းကျင်မျိုးမှာ ဘယ်လိုမှ rational မဖြစ်နိုင်ဘူးဆိုတာ
သိသာပါတယ်။
c. There exists a task environment in which every agent
is rational.
အေးဂျင့်တိုင်းအတွက်
ကြောင်းကျိုးနဲ့အညီ မှန်မှန်ကန်ကန်လုပ်ဆောင်နိုင်တဲ့ ပတ်ဝန်းကျင်မျိုးရှိတယ်။
မှန်။
ဥပမာ အခြေအနေတစ်မျိုးတည်းရှိတဲ့ ပတ်ဝန်းကျင်မျိုးမှာဆိုရင်
ဘယ်လိုလုပ်ဆောင်ချက်(action)ကိုပဲ ရွေးချယ်ပြီးလုပ်လုပ်၊ လုပ်ဆောင်ချက်အားလုံးအတွက်
ရမယ့်အကျိုးရလာဒ်က အတူတူပဲ။ ဒါကြောင့် ခြုံငုံပြီး ယေဘုယျဆန်ဆန်ပြောမယ်ဆိုရင် "လုပ်ဆောင်ချက်များအား မည်သို့ပင် တွဲဖက်လုပ်ဆောင်သည်ဖြစ်စေ၊
ရလာဒ်အပြောင်းအလဲမရှိသော မည်သည့်ပတ်ဝန်းကျင်အတွက်မဆို ထိုအချက် (There
exists a task environment in which every agent is rational )သည် မှန်ကန်သည်။"
လို့ ဆိုနိုင်ပါတယ်။
d. The input to an agent program is the same as the
input to the agent function.
agent
program ကိုပေးတဲ့ input နဲ့ agent function ကိုပေးတဲ့ input ဟာ အတူတူပဲ။
မှား။
agent function က လက်ရှိအချိန်အထိရှိနေတဲ့ အာရုံခံရရှိတဲ့အစီအစဉ်တွေအားလုံးကို
input အဖြစ်ယူတာ။ agent program ကတော့ အခုလက်ရှိ အာရုံခံလို့ရတဲ့အချက်ကိုပဲယူတာ။
e. Every agent function is implementable by some
program/machine combination.
ဘယ်လို agent
function မျိုးကိုမဆို program နဲ့ machine ပေါင်းစပ်ပြီး ဖန်တီးအကောင်အထည်ဖေါ်နိုင်တယ်။
မှား။
ဥပမာ တားရင်း(ကျူးရင်း)စက် Turing
Machines နဲ့ input tapes တွေရှိနေတဲ့ ပတ်ဝန်းကျင်မှာ agent လုပ်ရမယ့်အလုပ်က "ပရိုဂရမ်တစ်ခု
ပြီးဆုံးရပ်တန့်ခြင်းဆိုင်ရာပြဿနာ halting problem" ကို ဖြေရှင်းဖို့ဖြစ်တယ်ဆိုရင်၊
မှန်ကန်တဲ့အဖြေကို ရှာဖွေဖေါ်ထုတ်နိုင်တဲ့ agent function ကို သတ်မှတ်လို့ရပေမယ့်၊
လက်တွေ့အကောင်အထည်ဖေါ်မယ့် agent program ကိုတော့ ဘယ်လိုမှရေးလို့ရမှာမဟုတ်ဘူး။
တခြားဥပမာတစ်ခုပေးရရင် ကိန်းသေအချိန်အတွင်းမှာ လိုရာဖြစ်အရွယ်အစား(size
သည် variable။ အဲဒီ size ဟာ ကြိုက်တဲ့ တန်ဘိုးဖြစ်နိုင်တယ်။) ပြောင်းလဲမှုကို အမြဲမပြတ်
စောင့်ကြည့်ထောက်လှမ်းရမယ့်ပြဿနာမျိုးကို ဖြေရှင်းပေးမယ့် agent function မျိုးပေါ့။
(မှတ်ချက်။ ဤ အချက်များအား ကောင်းမွန်စွာ နားလည်သဘောပေါက်နိုင်ရန်အတွက်
Computer Science နှင့် Algorithms ပညာရပ်တို့၏အခြေခံများလိုအပ်ပါသည်။)
f. Suppose an agent selects its action uniformly at
random from the set of possible actions. There exists a deterministic task
environment in which this agent is rational.
agent တစ်ခုသည် ၎င်းအတွက်
လုပ်ဆောင်ရန် action ကို ဖြစ်နိုင်သမျှသော လုပ်ဆောင်မှုအစုအဝေးမှ ညီတူညီမျှဖြစ်နိုင်ခြေဖြင့်
ကျပန်း ရွေးချယ်သည်ဆိုပါစို့။ (ထိုအခါ၊ ထို) agentအတွက် ကျိုးကြောင်းညီညွတ်မှန်ကန်စွာ
ဆုံးဖြတ်နိုင်သည့် လုပ်ဆောင်မှုပတ်ဝန်းကျင် တစ်ခုရှိသည်။
မှန်။
အဆိုပြုချက် အမှတ်စီ၏ အထူးအခြေအနေတစ်ရပ်ဖြစ်ပါတယ်။
တကယ်လို့ ဘယ်လိုလုပ်ဆောင်မှုကို ရွေးချယ်ရွေးချယ် ကိစ္စမရှိဘူး (မထူးခြားဘူး၊ ရလာဒ်အတူတူပဲ)
ဆိုတဲ့အခြေအနေမျိုးမှာ၊ ကျပန်းရွေးချယ်မှုဟာ ကြောင်းကျိုးအချက်အလက်ညီညွတ်မှန်ကန်တယ်။
rational ဖြစ်တယ်။
g. It is possible for a given agent to be perfectly
rational in two distinct task environments.
ပေးထားသော agent တစ်ခုသည်၊
သိသာထင်ရှားစွာ ကွဲပြားခြားနားသောလုပ်ဆောင်မှုပတ်ဝန်းကျင်နှစ်ခုတွင် ပြည့်စုံစွာ မှန်မှန်ကန်ကန်ဆုံးဖြတ်လုပ်ကိုင်ရန်
ဖြစ်နိုင်သည်။
True. For
example, we can arbitrarily modify the parts of the environment that are
unreachable
by any optimal policy as long as they stay unreachable.
မှန်။
ဥပမာ... ဘယ်လို အကောင်းဆုံး မူဝါဒ
ပေါ်လစီကိုသုံးသုံး မရောက်နိုင် လက်လှမ်းမမှီနိုင်တဲ့ ပတ်ဝန်းကျင်အစိတ်အပိုင်းတွေကို၊
အဲဒီပတ်ဝန်းကျင်အစိတ်အပိုင်းတွေဟာ လက်လှမ်းမမှီနိုင်သေးတဲ့အခြေအနေမျိုးမှာ ရှိနေသေး၍၊
ကျွန်တော်တို့ဟာ အဲဒီပတ်ဝန်းကျင်အစိတ်အပိုင်းတွေကို စိတ်ကြိုက် ပြင်ဆင်ပြောင်းလဲနိုင်တယ်။
h. Every agent is rational in an unobservable
environment.
agent တိုင်းသည်
လေ့လာစူးစမ်း၍မရသော ပတ်ဝန်းကျင်တစ်ခုတွင် ကြောင်းကျိုးနှင့်အညီ မှန်ကန်စွာဆုံးဖြတ်လုပ်ကိုင်နိုင်သည်။
မှား။
(unobservable
environment မှာလုပ်ဆောင်ရတဲ့) တစ်ချို့လုပ်ဆောင်ချက်တွေဟာ မိုက်မဲတုံးအတဲ့လုပ်ဆောင်ချက်တွေပဲ။
တကယ်လို့ ပတ်ဝန်းကျင်ပုံစံတစ်ခုရှိမယ်ဆိုရင်၊ အဲဒီ ပတ်ဝန်းကျင်အခြေအနေကို ဘာမှ အာရုံခံ(percept)လို့မရဘူးဆိုရင်တောင်၊
အေးဂျင့်က ဒီအချက်ကို သိနိုင်တယ်။
i. A
perfectly rational poker-playing agent never loses.
လုံးဝပြီးပြည့်စုံသော ပိုကာကစားသည့် agent/program တစ်ခုသည်
မည်သည့်အခါမှ မရှုံးနိမ့်ပါ။
False. Unless it draws the
perfect hand, the agent can always lose if an opponent has
better
cards. This can happen for game after game. The correct statement is that the
agent’s expected winnings are nonnegative.
မှား။
အပြီးပြည့်စုံဆုံး အကောင်းဆုံး ဖဲချပ်တွေကို အေးဂျင့်က ဆွဲမထုတ်နိုင်ဘူးဆိုရင်၊
တဖက်ကစားသမား(ပြိုင်ဖက်)မှာ ပိုကောင်းတဲ့ဖဲရှိရင်၊ အေးဂျင့်အမြဲရှုံးနိုင်တာပေါ့။ ဒီလိုအခြေမျိုးဟာ
တစ်ပွဲပြီး တစ်ပွဲဖြစ်နိုင်တာပဲ။ မှန်ကန်တဲ့ အဆိုပြုဖေါ်ပြချက်က "The agent’s expected winnings are nonnegative. အေးဂျင့်၏
မျှော်လင့်နိုင်သော အနိုင်ပွဲအရေအတွက်သည် အနှုတ်ကိန်းမဟုတ်ပါ။" လို့ဖြစ်မှာပေါ့။
(ပွဲစဉ်အားလုံးတော့ မရှုံးနိုင်ဟု ဆိုလို။)
...
ဆက်လက်တင်ပြပါမည်။
copyright(c)2018 by InfoTherapy
No comments:
Post a Comment
Note: Only a member of this blog may post a comment.