¾Æ·¡ ³»¿ëÀº A Brief Introduction to Graphical Models and Bayesian Networks ¿¡¼ ¹ø¿ªÇϰí, Gurugail.comÀÇ GGOP(Virtual Dog) ÇÁ·ÎÁ§Æ®¿¡ ¸ÂÃß¾î ¼öÁ¤, ¿ä¾àÇÑ °ÍÀÔ´Ï´Ù.
Bayesian Network´Â
"È®·ü À̷аú ±×·¡ÇÈ ÀÌ·ÐÀÇ °áÇÕÀ¸·Î ÀÌ·ç¾îÁø ±×·¡ÇÈ ¸ðµ¨(Graphical Models)"
À̶ó°í ª°Ô Ç¥ÇöµÉ ¼ö ÀÖ´Ù. ±×·¡ÇÈ ¸ðµ¨ÀÇ ±âº»Àû ¾ÆÀ̵ð¾î´Â º¹ÀâÇÑ ½Ã½ºÅÛÀ» °£´ÜÇÑ ¸ðµâ·Î¼ÀÇ ±¸¼ºÀ» ±×·¡ÇÁÀûÀ¸·Î Ç¥ÇöÀÌ °¡´ÉÇϴٴ Ư¡ÀÌ ÀÖ´Ù. ±×·³À¸·Î½á ±× ¸ðµâÀÌ ¾î¶»°Ô ¼·Î ¿¬°ü¼ºÀ» °¡Áö´ÂÁö¸¦ È®·üÀû À̷п¡ ±â¹ÝÇÏ¿© Ç¥ÇöÀÌ °¡´ÉÇϸç, ÇϳªÀÇ ¸ðµâÀº ³ëµå(Node)·Î½á Ç¥ÇöÀÌ °¡´ÉÇϸç, ¸ðµâ°£ÀÇ °ü°è´Â È£(Arc)·Î Ç¥ÇöµÈ´Ù. ±×·¡ÇÈ ¸ðµ¨Àº ¹æÇ⼺(Directed or Undirected)À̳ª ³ëµåÀÇ ¼øÈ¯¼º(Cyclic or nonCyclic)¿¡ µû¶ó¼ HMM(Hidden Markow Models), FA(Factor Analysis), Kalman Filters µî ¿©·¯ °¡Áö°¡ ÀÖÀ¸¸ç, ±× Áß Çϳª°¡ Baysian NetworkÀÌ´Ù.
±×·¡ÇÈ ¸ðµ¨¿¡¼, ³ëµå´Â ·£´ý º¯¼ö(Random Variables)¸¦ ³ªÅ¸³»¸ç, È£´Â ³ëµåµé°£ÀÇ °ü°è¼ºÀ» °¡¸®Å²´Ù. Áß¿äÇÑ »ç½ÇÀº ±×·¡ÇÈÀû Ç¥Çö¸¸À¸·Î Fully Joint Probabilty DistributionÀÇ Ç¥ÇöÀÌ °¡´ÉÇÏ´Ù¶ó´Â °ÍÀÌ´Ù. ÀÌ´Â ´Ù½Ã ¸»ÇØ, BNÀ¸·Î Ç¥ÇöÀÌ µÇ¸é, ·£´ý º¯¼öÀÇ ¸ðµç Á¶ÇÕÀ¸·Î ±¸¼ºµÈ È®·ü ºÐÆ÷µµ¸¦ ¾Ë ¼ö ÀÖ´Ù¶ó´Â ¸»ÀÌ´Ù.
BN´Â ±×·¡ÇÈ ¸ðµ¨ Áß¿¡¼ ¹æÇ⼺ÀÌ ÀÖÀ¸¸ç, ºñ¼øÈ¯ÀÇ ±×·¡ÇÈ ¸ðµ¨À» ¸»ÇÑ´Ù. ÁÙ¿©¼ DAG, (Directed ACyclic Graph)¶ó°í ÇÑ´Ù. ¾Æ·¡ °£´ÜÇÑ ¿¹Á¦ BNÀ» »ìÆìº¸ÀÚ. BNÀÇ ¼³¸í¿¡¼ Á¾Á¾ µîÀåÇÏ´Â ¿¹Á¦ÀÌ´Ù. Àܵð(WetGrass)°¡ Á¥À» °æ¿ì´Â ½ºÇÁ¸°Å¬·¯(Sprinkler)°¡ µ¿ÀÛÇϰųª ºñ°¡ ¿À°Å³ªÀÇ °æ¿ì¸¦ BNÀ¸·Î Ç¥ÇöÇÑ °ÍÀÌ´Ù. ¾Æ·¡ ¿¹¿¡¼ "³¯¾¾°¡ È帱 ¶§ ºñ°¡ ¿Ã È®·ü", Áï P(R=T| C=T) = 0.8ÀÌ´Ù.

¾î¶² »óȲÀ» BNÀ¸·Î ±¸¼ºÇϱâ À§Çؼ´Â À§¿Í °°Àº °æ¿ìó·³,
1. ½Ã½ºÅÛÀ» Ç¥ÇöÇÒ ¼ö ÀÖ´Â ³ëµå ±¸¼º
2. ³ëµå¿ÍÀÇ ¿¬°á¼º (Arc ±¸¼º)
3. È®·ü Å×À̺í(CPT) ±¸¼º
ÇÏ¸é ¸ðµç °ÍÀÌ ³¡³´Ù. ´Ü, Áß¿äÇÑ »ç½ÇÀº ³ëµå°£ÀÇ Á¶°ÇºÎ µ¶¸³(Conditional Indendence)ÀÇ Æ¯¼ºÀ» ºÎ¿©ÇÏ¸é¼ ±¸¼ºÇØ¾ß µÈ´Ù´Â »ç½ÇÀÌ´Ù. Á¶°ÇºÎ µ¶¸³À» È®ÀÎÇϱâ À§ÇÑ D-seperation ¾Ë°í¸®Áò?µµ ÀÖ°í, º¹Àâµµ ÇÏÁö¸¸ °£´ÜÈ÷, Á¦ »ý°¢À¸·Î´Â Àû¾îµµ Virtual Dog¿¡¼ ´À³¦»óÀ¸·Î Á¶°ÇºÎ µ¶¸³ÀûÀ¸·Î ³ëµå¸¦ ±¸¼ºÇϸé OKÀÌ´Ù. À§ÀÇ ¿¹¿¡¼´Â ½ºÇÁ¸°Äð·¯(S)°¡ µ¿ÀÛÇÒ °æ¿ì¿Í ºñ°¡ ¿Ã °æ¿ì´Â È帰³¯(C)À̶ó´Â Á¶°Ç¿¡¼ ¼·Î Á¶°ÇºÎ µ¶¸³ÀÌ´Ù.
À§¿Í °°Àº BNÀ̱¸¼ºµÇ¸é, "Àܵ𰡠Á¥¾úÀ» ¶§(W), ½ºÇÁ¸°Äð·¯(S)°¡ µ¿ÀÛÇÏ¿´À» È®·ü"À» ¾Æ·¡ ½Äó·³ Á÷Á¢ °è»êÇÒ ¼ö ÀÖ´Ù. CPT¿¡ Á÷Á¢ÀûÀ¸·Î Ç¥ÇöÀÌ µÇÁö ¾Ê¾ÒÁö¸¸, Ãß·ÐÀ̶ó´Â Method¿¡ ÀÇÇØ Ç¥Çö(°è»ê, ÃßÃø, Ãß·Ð)µÉ ¼ö ÀÖ´Â °ÍÀÌ´Ù.
![]()
´Ù¸¥ ¸ðµç °æ¿ìµµ ¼ö½ÄÀ¸·Î °è»êÀÌ °¡´ÉÇÑ °ÍÀÌ´Ù. ´Ù¸¸ Á÷Á¢ °è»êÀ» ÇÒ °æ¿ì ±âÇϱ޼öÀûÀ¸·Î °è»ê·®ÀÌ Áõ°¡Çϱ⠶§¹®¿¡, Approximation ¹æ¹ýÀ» ÀÌ¿ëÇϱ⵵ ÇÑ´Ù°í ÇÑ´Ù. °è»ê ¹æ¹ýÀº ÀÌ ¹®¼¿¡¼´Â »ý·«Çϰí, ´Ù¸¸ ±×³É °³³ä¸¸ ÀÌÇØÇÏ°í °¬À¸¸é ÇÑ´Ù. Çϳª ´õ Ãß°¡ÇÒ °³³äÀº ¿©±â¼ W°¡ Evidence°¡ µÇ°í S°¡ Query°¡ µÇ´Â ¼ÀÀ̸ç( Àܵ𰡠Á¥¾ú´Ù´Â »ç½ÇÀ» ¾Ë°í, ±×¿¡ »óÀÀÇÏ´Â SÀÇ È®·üÀ» Äõ¸®), ÀÌ·± ½ÄÀÇ °è»êÀ» Bottom-up reasoning À̶ó°í ÇÑ´Ù.
BN¿¡¼ Ãß·ÐÀ̶õ ¹«¾ùÀϱî, ¾î¶² Àǹ̸¦ Ãß·ÐÀ̶ó°í ÇÒ±î? À§¿¡¼ Àá±ñ ¾ð±ÞÇÑ Evidence¿Í Query¸¦ ¸ÕÀú ÀÌÇØÇØ¾ß ÇÑ´Ù. BN¿¡¼ Ãß·ÐÀ̶õ "¾Ë°í ÀÖ´Â È®·üº¯¼ö¸¦ ÀÌ¿ëÇØ¼ ¿øÇÏ´Â(¾Ë°íÀÚ ÇÏ´Â) È®·ü°ªÀ» ±¸ÇÏ´Â °úÁ¤"À̶ó ÇÒ ¼ö ÀÖ´Ù. À§ÀÇ °úÁ¤ÀÌ ¹Ù·Î Ã߷аúÁ¤ÀÌ´Ù. À§ ±×¸²ÀÇ BN¿¡¼´Â Casuality(¿øÀÎ -> °á°ú)¿¡ µû¸¥ È®·ü°ªÀº Ç¥ÇöÀÌ µÇ¾î ÀÖ°í(CPT), À§ ¼ö½Ä°ú °°ÀÌ "Àܵ𰡠Á¥¾úÀ» ¶§(W), ½ºÇÁ¸°Äð·¯(S)°¡ µ¿ÀÛÇÏ¿´À» È®·ü"Àº CPT¸¦ ÀÌ¿ëÇØ ¹Ù·Î ±¸ÇÒ ¼ö´Â ¾ø´Ù. ±×·³À¸·Î °è»êÀ̳ª Approximation ¹æ¹ý µîÀ» ÀÌ¿ëÇÑ Ãß·ÐÀ» ÇØ¾ß ÇÑ´Ù. ¹°·Ð ¾î¶»°Ô º¸¸é È®·ü °è»ê¿¡ ºÒ°úÇÏÁö¸¸, ±×·¯ÇÑ °è»êÀÌ ³ëµå¿¡ µû¶ó¼ ±âÇÏ ±Þ¼öÀûÀ¸·Î Áõ°¡Çϱ⠶§¹®¿¡ ¿©·¯ °¡Áö Ãß·Ð ¾Ë°í¸®ÁòÀÌ ÀÖ´Ù. (Variable Elimination, Dynamic Programming, Approximation Algorithms, etc)
1. Variable Elimination
Ãß·ÐÀ» ÇÏ´Â ¹æ¹ý ÁßÀÇ ÇϳªÀÌ´Ù. ±âº» »ý°¢Àº Ãß·ÐÀ» ¿øÇϰíÀÚ ÇÏ´Â ½ÄÀ» CPTÀÇ Factored RepresentationÀ¸·Î Ç¥ÇöÇÏ´Â °ÍÀÌ´Ù. ±×°ÍÀº °ü°è ¾ø´Â º¯¼ö¿¡ ´ëÇÑ °æ¿ìÀÇ ÇÕ°è Ç¥ÇöÀ¸·Î °¡´ÉÇÏ´Ù. ¼³¸íÀÌ Àß ÀÌÇØ°¡ µÇÁö ¾ÊÀ» °ÍÀÌ´Ù. ^^; °íµîÇб³ ¶§ ¹è¿î È®·üÀ» Àß »ý°¢Çغ¸ÀÚ. Joint Probability¿¡¼ ·£´ø º¯¼ö X, Y°¡ ÀÖ°í, Y´Â Boolean VariableÀ̶ó°í °¡Á¤Çϸé
P(X=i) = P(X=i, Y=false) + P(X=i, Y=true) ÀÎ °ÍÀÌ »ý°¢ÀÌ ³ª´ÂÁö... ¾Æ¹«Æ° ÀÌ¿Í °°Àº ¿ø¸®¿Í ±×¸®°í Bayes ÀÌ·ÐÀ» »ç¿ëÇØ¼ È®·ü°ªÀ» ±¸ÇÏ´Â ¹æ¹ý·ÐÀÌ Variable EliminationÀÌ´Ù.

WetGrass(P(W=true))ÀÎ È®·üÀ» ±¸Çϱâ À§Çؼ À§¿Í °°Àº ´Ü°è¸¦ °ÅÄ¡¸é, °á±¹ CPT¿¡ ÀÖ´Â È®·ü°ªµéÀ» ÀÌ¿ëÇØ¼ ±¸ÇÒ ¼ö ÀÖ´Â °ÍÀÌ´Ù. ¿Ö ÀÌ ¹æ¹ýÀÌ "º¯¼ö Á¦°Å(Variable Elimination)"ÀÎÁö´Â È®·ü°ªÀ» ±¸Çϱâ À§Çؼ´Â Innermost°¡ ¿ì¼±ÀûÀ¸·Î ±¸ÇØÁö°í, ±×¿¡ µû¶ó Summation µÇ´Â º¯¼ö(c,s,r) µîÀÌ Â÷·Ê·Î ±¸ÇØÁö´Â °úÁ¤¿¡¼ »ý±ä À̸§À¸·Î »ý°¢µÈ´Ù.
BN¿¡¼ ÇнÀÀ̶õ, ÁÖ¾îÁø ÇнÀ µ¥ÀÌŸ¸¦ ÀÌ¿ëÇÏ¿©, ±×·¡ÇÁÀÇ Topology¸¦ ±¸¼ºÇÏ´Â °Í°ú CPT(Conditional Probability Table)À» ±¸¼ºÇÏ´Â °ÍÀ» ¸»Çϸç, ±×·¡ÇÁÀÇ Topology¸¦ ±¸¼ºÇÏ´Â °ÍÀÌ CPT¸¦ ±¸¼ºÇÏ´Â °Íº¸´Ù ¾î·Á¿î ÀÛ¾÷ÀÌ´Ù. µ¥ÀÌÅÍ È¤Àº ±×·¡ÇÁ¿¡ µû¶ó Á¶°Çº° ÇнÀ ¹æ¹ýÀº ¾Æ·¡¿Í °°´Ù.
|
Structure
|
Observability
|
Method
|
| Known | Full | Maximum Likelihood Estimation |
| Known | Partial | EM (or gradient ascent) |
| Unknown | Full | Search through model space |
| Unknown | Partial | EM + search through model space |
1. Structure°¡ KnownÀ̸ç, ÇнÀ µ¥ÀÌÅ͵µ Full ObservabilityÇÒ °æ¿ìÀÇ ¿¹
(Maximum Likelihood Estimation)
ÀÌ¿Í °°Àº °æ¿ìµµ ±×·¡ÇÈÀÇ ±¸Á¶³ª CPT¸¦ ±¸Çϱâ À§ÇÑ ¸ðµç ÇнÀ µ¥ÀÌÅͰ¡ ÁÖ¾îÁö±â ¶§¹®¿¡ ´Ü¼ø CountingÀ¸·Î ÃßÃøÇÒ ¼ö ÀÖ´Ù. °¡·É À§ ±×¸²¿¡¼ W ³ëµåÀÇ CPT¸¦ ±¸ÇÑ´Ù°í °¡Á¤Çϸé, ´ÙÀ½°ú °°ÀÌ Maximum Likelihood Estimation ¹æ¹ýÀ» ÀÌ¿ëÇÑ´Ù.
![]()
½ÄÀ» º¸¸é ´Ü¼øÈ÷ Counting¸¸À¸·Î W ³ëµåÀÇ CPT¸¦ ±¸ÇÏ´Â °ÍÀ» º¼ ¼ö ÀÖ´Ù.(N´Â °æ¿ìÀÇ ¼ö)