Thursday, January 11, 2018

Artificial Intelligence: A Modern Approach - Lesson VI

SEE: Exercises, Page-61

2.3 For each of the following assertions, say whether it is true or false and support your answer with examples or counterexamples where appropriate.
Q: အောက်ပါအခိုင်အမာအဆိုပြုချက်များ မှားသည် မှန်သည် ဆုံးဖြတ်ပါ။ သင်၏အဖြေအတွက် အထောက်အကူပြု ဥပမာများ ရှင်းလင်းချက်များ သင့်လျော်ရာပေးပါ။

A:
a. An agent that senses only partial information about the state cannot be perfectly rational.
ပတ်ဝန်းကျင်အခြေအနေနှင့်ပတ်သက်၍ သတင်းအချက်အလက် တဝက်တပျက်သာ အာရုံခံနိုင်သော agent တွင် ပြည့်စုံသောကြောင်းကျိုးမှန်ကန်မှုမရှိနိုင်ပါ။
                မှား။
                ပြည့်စုံတဲ့ ကြောင်းကျိုးမှန်ကန်မှုဆိုတာ အာရုံခံပစ္စည်းတွေက ပတ်ဝန်းကျင်ကနေ အချက်အလက်ရရှိတဲ့အပေါ် မှာ(အဲဒီ သတင်းအချက်အလက်က နည်းသည်ဖြစ်စေ၊ များစည်ဖြစ်စေ၊ ပြည့်စုံသည်ဖြစ်စေ၊ မပြည့်စုံသည်ဖြစ်စေ)ကောင်းမွန်တဲ့ ဆုံးဖြတ်ချက်ချနိုင်တဲ့ စွမ်းရည်ကို ရည်ညွှန်းတာဖြစ်တယ်။ ဒါကြောင့် သတင်းအချက်အလက် တစ်ဝက်တစ်ပျက်ပဲရလို့ rational မဖြစ်နိုင်ဘူးဆိုတာ မှားတယ်။ တစ်ဝက်တစ်ပျက်ပဲရလဲ (အားလုံးမဟုတ်ပေမယ့် တစ်ချို့ agent တွေဟာ) rational ဖြစ်နိုင်ရမယ်။

b. There exist task environments in which no pure reflex agent can behave rationally.
ဘယ်လို တုန့်ပြန်ဆောင်ရွက်သောအေးဂျင့်စစ်စစ်အတွက်မဆို ကြောင်းကျိုးနဲ့အညီ မှန်မှန်ကန်ကန် မပြုမူနိုင်တဲ့ လုပ်ဆောင်မှုပတ်ဝန်းကျင်မျိုးရှိတယ်။
                မှန်။
                တုန့်ပြန်ဆောင်ရွက်သောအေးဂျင့်စစ်စစ်က အရင်(အတိတ်)က အာရုံခံရရှိခဲ့တဲ့ အချက်အလက်တွေကို လျစ်လျူရှုလိုက်တယ်။ မသုံးတော့ဘူး။ ဒါကြောင့် တစ်ဝက်တစ်ပျက်ပဲ လေ့လာလို့ရတဲ့ပတ်ဝန်းကျင်မှာဆိုရင် အကောင်းဆုံးအခြေအနေကို မခန့်မှန်းနိုင်ဘူး။ ဥပမာ စစ်တုရင်ကစားတဲ့ကိစ္စကိုကြည့်ပါ။ တစ်ခြားပြိုင်ဖက်က ရွှေ့လိုက်တဲ့အကွက်ဟာ ၊ agent အတွက် လတ်တလော လက်ရှိ အခြေအနေကို အာရုံခံလို့ရလိုက်တဲ့သတင်းအချက်အလက်ဖြစ်တယ်။ တုန့်ပြန်ဆောင်ရွက်သောအေးဂျင့်ဆိုတာက အရင့်အရင် ကစားကွက်တွေ စစ်တုရင်ခုံရဲ့အခြေအနေတွေကို ပြန်ပြီး ထောက်လှမ်းသုံးသပ်နိုင်တဲ့အခြေအနေမရှိဘူး။ သူက အာရုံခံရရှိမှုအစီအစဉ်များ percept history ၊ percept sequence ကိုမှ မှတ်သားမထားတာကိုး။ ဒါကြောင့် သူ ရွှေ့ရမယ့်အလှည့်မှာ အရင်ကစားကွက်တွေဘယ်လိုရှိခဲ့ ရှိခဲ့၊ အဲဒါတွေကို ဘာမှ ထည့်မစဉ်းစားပဲ လွတ်တဲ့နေရာ ရွှေ့ထည့်လိုက်မယ့် သဘောမျိုးဖြစ်နေတဲ့အတွက်၊ တုန့်ပြန်ဆောင်ရွက်သောအေးဂျင့်စစ်စစ် pure reflex agent တစ်ခုဟာ၊ အဲဒီလို တစ်ဝက်တစ်ပျက်ပဲလေ့လာလို့ရတဲ့ပတ်ဝန်းကျင်မျိုးမှာ ဘယ်လိုမှ rational မဖြစ်နိုင်ဘူးဆိုတာ သိသာပါတယ်။

c. There exists a task environment in which every agent is rational.
အေးဂျင့်တိုင်းအတွက် ကြောင်းကျိုးနဲ့အညီ မှန်မှန်ကန်ကန်လုပ်ဆောင်နိုင်တဲ့ ပတ်ဝန်းကျင်မျိုးရှိတယ်။
                မှန်။
                ဥပမာ အခြေအနေတစ်မျိုးတည်းရှိတဲ့ ပတ်ဝန်းကျင်မျိုးမှာဆိုရင် ဘယ်လိုလုပ်ဆောင်ချက်(action)ကိုပဲ ရွေးချယ်ပြီးလုပ်လုပ်၊ လုပ်ဆောင်ချက်အားလုံးအတွက် ရမယ့်အကျိုးရလာဒ်က အတူတူပဲ။ ဒါကြောင့် ခြုံငုံပြီး ယေဘုယျဆန်ဆန်ပြောမယ်ဆိုရင် "လုပ်ဆောင်ချက်များအား မည်သို့ပင် တွဲဖက်လုပ်ဆောင်သည်ဖြစ်စေ၊ ရလာဒ်အပြောင်းအလဲမရှိသော မည်သည့်ပတ်ဝန်းကျင်အတွက်မဆို  ထိုအချက် (There exists a task environment in which every agent is rational )သည် မှန်ကန်သည်။" လို့ ဆိုနိုင်ပါတယ်။
               

d. The input to an agent program is the same as the input to the agent function.
agent program ကိုပေးတဲ့ input နဲ့ agent function ကိုပေးတဲ့ input ဟာ အတူတူပဲ။
                မှား။
                agent function က လက်ရှိအချိန်အထိရှိနေတဲ့ အာရုံခံရရှိတဲ့အစီအစဉ်တွေအားလုံးကို input အဖြစ်ယူတာ။ agent program ကတော့ အခုလက်ရှိ အာရုံခံလို့ရတဲ့အချက်ကိုပဲယူတာ။

e. Every agent function is implementable by some program/machine combination.
ဘယ်လို agent function မျိုးကိုမဆို program နဲ့ machine ပေါင်းစပ်ပြီး ဖန်တီးအကောင်အထည်ဖေါ်နိုင်တယ်။
                မှား။
                ဥပမာ တားရင်း(ကျူးရင်း)စက် Turing Machines နဲ့ input tapes တွေရှိနေတဲ့ ပတ်ဝန်းကျင်မှာ agent လုပ်ရမယ့်အလုပ်က "ပရိုဂရမ်တစ်ခု ပြီးဆုံးရပ်တန့်ခြင်းဆိုင်ရာပြဿနာ halting problem" ကို ဖြေရှင်းဖို့ဖြစ်တယ်ဆိုရင်၊ မှန်ကန်တဲ့အဖြေကို ရှာဖွေဖေါ်ထုတ်နိုင်တဲ့ agent function ကို သတ်မှတ်လို့ရပေမယ့်၊ လက်တွေ့အကောင်အထည်ဖေါ်မယ့် agent program ကိုတော့ ဘယ်လိုမှရေးလို့ရမှာမဟုတ်ဘူး။
                တခြားဥပမာတစ်ခုပေးရရင်  ကိန်းသေအချိန်အတွင်းမှာ လိုရာဖြစ်အရွယ်အစား(size သည် variable။ အဲဒီ size ဟာ ကြိုက်တဲ့ တန်ဘိုးဖြစ်နိုင်တယ်။) ပြောင်းလဲမှုကို အမြဲမပြတ် စောင့်ကြည့်ထောက်လှမ်းရမယ့်ပြဿနာမျိုးကို ဖြေရှင်းပေးမယ့် agent function မျိုးပေါ့။
(မှတ်ချက်။               ဤ အချက်များအား ကောင်းမွန်စွာ နားလည်သဘောပေါက်နိုင်ရန်အတွက် Computer Science နှင့် Algorithms ပညာရပ်တို့၏အခြေခံများလိုအပ်ပါသည်။)

f. Suppose an agent selects its action uniformly at random from the set of possible actions. There exists a deterministic task environment in which this agent is rational.
agent တစ်ခုသည် ၎င်းအတွက် လုပ်ဆောင်ရန် action ကို ဖြစ်နိုင်သမျှသော လုပ်ဆောင်မှုအစုအဝေးမှ ညီတူညီမျှဖြစ်နိုင်ခြေဖြင့် ကျပန်း ရွေးချယ်သည်ဆိုပါစို့။ (ထိုအခါ၊ ထို) agentအတွက် ကျိုးကြောင်းညီညွတ်မှန်ကန်စွာ ဆုံးဖြတ်နိုင်သည့် လုပ်ဆောင်မှုပတ်ဝန်းကျင် တစ်ခုရှိသည်။
                မှန်။
                အဆိုပြုချက် အမှတ်စီ၏ အထူးအခြေအနေတစ်ရပ်ဖြစ်ပါတယ်။ တကယ်လို့ ဘယ်လိုလုပ်ဆောင်မှုကို ရွေးချယ်ရွေးချယ် ကိစ္စမရှိဘူး (မထူးခြားဘူး၊ ရလာဒ်အတူတူပဲ) ဆိုတဲ့အခြေအနေမျိုးမှာ၊ ကျပန်းရွေးချယ်မှုဟာ ကြောင်းကျိုးအချက်အလက်ညီညွတ်မှန်ကန်တယ်။ rational ဖြစ်တယ်။

g. It is possible for a given agent to be perfectly rational in two distinct task environments.
ပေးထားသော agent တစ်ခုသည်၊ သိသာထင်ရှားစွာ ကွဲပြားခြားနားသောလုပ်ဆောင်မှုပတ်ဝန်းကျင်နှစ်ခုတွင် ပြည့်စုံစွာ မှန်မှန်ကန်ကန်ဆုံးဖြတ်လုပ်ကိုင်ရန် ဖြစ်နိုင်သည်။
                True. For example, we can arbitrarily modify the parts of the environment that are
unreachable by any optimal policy as long as they stay unreachable.
                မှန်။
                ဥပမာ... ဘယ်လို အကောင်းဆုံး မူဝါဒ ပေါ်လစီကိုသုံးသုံး မရောက်နိုင် လက်လှမ်းမမှီနိုင်တဲ့ ပတ်ဝန်းကျင်အစိတ်အပိုင်းတွေကို၊ အဲဒီပတ်ဝန်းကျင်အစိတ်အပိုင်းတွေဟာ လက်လှမ်းမမှီနိုင်သေးတဲ့အခြေအနေမျိုးမှာ ရှိနေသေး၍၊ ကျွန်တော်တို့ဟာ အဲဒီပတ်ဝန်းကျင်အစိတ်အပိုင်းတွေကို စိတ်ကြိုက် ပြင်ဆင်ပြောင်းလဲနိုင်တယ်။

h. Every agent is rational in an unobservable environment.
agent တိုင်းသည် လေ့လာစူးစမ်း၍မရသော ပတ်ဝန်းကျင်တစ်ခုတွင် ကြောင်းကျိုးနှင့်အညီ မှန်ကန်စွာဆုံးဖြတ်လုပ်ကိုင်နိုင်သည်။
                မှား။
                (unobservable environment မှာလုပ်ဆောင်ရတဲ့) တစ်ချို့လုပ်ဆောင်ချက်တွေဟာ မိုက်မဲတုံးအတဲ့လုပ်ဆောင်ချက်တွေပဲ။ တကယ်လို့ ပတ်ဝန်းကျင်ပုံစံတစ်ခုရှိမယ်ဆိုရင်၊ အဲဒီ ပတ်ဝန်းကျင်အခြေအနေကို ဘာမှ အာရုံခံ(percept)လို့မရဘူးဆိုရင်တောင်၊ အေးဂျင့်က ဒီအချက်ကို သိနိုင်တယ်။

i. A perfectly rational poker-playing agent never loses.
လုံးဝပြီးပြည့်စုံသော ပိုကာကစားသည့် agent/program တစ်ခုသည် မည်သည့်အခါမှ မရှုံးနိမ့်ပါ။
                False. Unless it draws the perfect hand, the agent can always lose if an opponent has
better cards. This can happen for game after game. The correct statement is that the
agent’s expected winnings are nonnegative.
                မှား။

                အပြီးပြည့်စုံဆုံး အကောင်းဆုံး  ဖဲချပ်တွေကို အေးဂျင့်က ဆွဲမထုတ်နိုင်ဘူးဆိုရင်၊ တဖက်ကစားသမား(ပြိုင်ဖက်)မှာ ပိုကောင်းတဲ့ဖဲရှိရင်၊ အေးဂျင့်အမြဲရှုံးနိုင်တာပေါ့။ ဒီလိုအခြေမျိုးဟာ တစ်ပွဲပြီး တစ်ပွဲဖြစ်နိုင်တာပဲ။ မှန်ကန်တဲ့ အဆိုပြုဖေါ်ပြချက်က "The agent’s expected winnings are nonnegative. အေးဂျင့်၏ မျှော်လင့်နိုင်သော အနိုင်ပွဲအရေအတွက်သည် အနှုတ်ကိန်းမဟုတ်ပါ။" လို့ဖြစ်မှာပေါ့။ (ပွဲစဉ်အားလုံးတော့ မရှုံးနိုင်ဟု ဆိုလို။)

...
ဆက်လက်တင်ပြပါမည်။

copyright(c)2018 by InfoTherapy

No comments:

Post a Comment

Note: Only a member of this blog may post a comment.