コマネチ大学数学科 19回

じゃんけんをし、「グー」で勝ったら3歩、「チョキ」で勝ったら6歩、「パー」で勝ったら6歩進めるというゲームで、勝つために最適な「グー」、「チョキ」、「パー」の割合を求める問題。

なんか騙されているような気がする回答だった。まだよく分からない。少し考えてみよう。

自分が進める歩数の損得表を作るとこんな感じ。マイナスの場合は相手が進む。

	相手グー(X)	相手チョキ(Y)	相手パー(Z)
自分グー(g)	0	3	-6
自分チョキ(t)	-3	0	6
自分パー(p)	6	-6	0

X,Y,Z,g,t,pはそれぞれの確率。回数と考えても良い。この表からで自分の進める歩数の期待値を計算する。
自分が「グー」を出した時に進める歩数の期待値:
(相手の「チョキ」確率)x3 + (相手の「パー」確率)x(-6)

これに自分の「グー」を出す割合をかければ、全体の中での「グー」の期待値が出るので、数式で書くと
g(3Y-6Z)
となる。
同様に「チョキ」「パー」の期待値の式を出しすべて足すと自分の進める歩数の期待値が出る。

g(3Y-6Z) + t(-3X+6Z) +p(6X-6Y) ……①

番組ではここで相手の手数でまとめるた式に変形する。

(6p-3t)X + (3g-6p)Y + (6t-6g)Z ……②

これは流れからすると①式を変形したのだと思うが、これは表を縦に見れば、相手が失う歩数の期待値としてわざわざ式変形しなくても表から直接求めることができる。

ここで、

(6p-3t)=A
(3g-6p)=B
(6t-6g)=C

とおく。意味としては
A:相手の「グー」1回に対しての自分の進める歩数の期待値
B:相手の「チョキ」1回に対しての自分の進める歩数の期待値
C:相手の「パー」1回に対しての自分の進める歩数の期待値
となる。
②式（相手が失う歩数=自分が得る歩数）は

AX+BY+CZ ……③

となる。
3つの式を変形すると

2(A+B)+C=0

という式を出すことができる。

この式が成り立つのは次の2つの場合だ。

1.A=B=C=0
2.A,B,Cのどれかが<0

さて、俺が引っかかったのは次の部分だ。
2の場合、負けてしまう場合があるから却下で、1の方法(A=B=C=0)しかないと言う。
しかし、A=B=C=0ということは、結局自分の進める期待値0ということだ。つまり引き分け狙い。それが「勝つ」ために最善の選択なのか？引き分け狙いなので相手がどんな戦略を選んでも負けない方法だけど、逆に相手がどんな戦略を選んでも勝てないんじゃないか？
2の場合、確かに例えばA(相手が「グー」の時の自分の期待値)をマイナスにした場合、相手が「グー」ばかり出すと負けてしまう。しかし、その分相手が「グー」以外を多く出した場合は勝つ可能性が高い。
そうなると、2の場合の期待値を出さずに却下するのはどうも納得できない。
さらに相手がどのような割合で出すか分からないとなれば、計算方法が思い付かないけど、期待値はやっぱり0になりそうな気がする。違うのかな。マイナスになるのか？

仮にA=-1,B=1,C=0で考えてみる。
相手がすべて均等に出す場合。
X=1,Y=1,Z=1で考えられるので、③に代入して自分が得る歩数を計算すると0。
相手が「グー」ばかり出した場合。
X=1,Y=0,Z=0で考えられるので、③に代入して自分が得る歩数を計算すると-1。
相手が「チョキ」ばかり出した場合。
X=0,Y=1,Z=0で考えられるので、③に代入して自分が得る歩数を計算すると1。
相手が「パー」ばかり出した場合。
X=0,Y=0,Z=1で考えられるので、③に代入して自分が得る歩数を計算すると0。
平均したら同じになりそうだな。

そうか、A=-1,B=1,C=0という置き方が良くないかもしれない。Cの特殊性を生かしていない。
仮にA=-1,B=0,C=2で考えてみる。
相手がすべて均等に出す場合。
X=1,Y=1,Z=1で考えられるので、③に代入して自分が得る歩数を計算すると1。
相手が「グー」ばかり出した場合。
X=1,Y=0,Z=0で考えられるので、③に代入して自分が得る歩数を計算すると-1。
相手が「チョキ」ばかり出した場合。
X=0,Y=1,Z=0で考えられるので、③に代入して自分が得る歩数を計算すると0。
相手が「パー」ばかり出した場合。
X=0,Y=0,Z=1で考えられるので、③に代入して自分が得る歩数を計算すると2。

ああ、そうかとりあえず相手がすべて均等で出した場合を考えてみよう。
となると自分が得る歩数=A+B+C。
つまり、

2(A+B)+C=0

を満たし、かつ

A+B+C

が大きくなる組み合わせは何か。
Cのプラスを大きくすれば良さそうだ。

A=-1,B=-1,C=4の場合。
自分の得る歩数=2

じゃあ、この時相手が「グー」ばかり出した場合。
X=1,Y=0,Z=0で考えられるので、③に代入して自分が得る歩数を計算すると-1。
相手が「チョキ」ばかり出した場合。
X=0,Y=1,Z=0で考えられるので、③に代入して自分が得る歩数を計算すると-1。
相手が「パー」ばかり出した場合。
X=0,Y=0,Z=1で考えられるので、③に代入して自分が得る歩数を計算すると4。

どうだろう。この問題はあらかじめ割合を考えるわけだから、相手もあらかじめ決めていないと不公平だろう。つまり、こちらの戦略を見て途中で相手が戦略を変えることはなしと考えると、この方法はなんとなく有利そうだよな。ちょっと数学的にこうっていうぴしっとした答えは出せないけど。

ただ、あらかじめ割合を考えるのは自分が勝手に決めたルールで、相手は途中で戦略変更可能だとしたらちょっと複雑でよく分からないな。