探索アルゴリズムは、局面の実現確率を打ち切り条件に利用することで、人 間のエキスパートの思考法と似た狭くて深い探索を実現しています。ロジス ティック回帰モデルを利用して局面の遷移確率の推定を行うことで、探索の 有効分岐数は、約2〜2.5程度におさまっており、比較的短時間でも20手以上 先の局面を読むことができます。 評価関数の学習には、平均化パーセプトロンをベースにした手法を用いてお り、高速な学習が可能になっています。これにより、学習時に、比較的深い 探索(現在は基本深さ8)を行いながらパラメータの最適化を行うことが可 能になっています。