2016年アピール文書

去年、55将棋で実装して手応えがあった強化学習とGAを組み合わせた学習を利用します。

使っている手法は以下の通りです。
・pvs
・nullmove
・futility
・ビットボード




***************************************************************************************************
2015年アピール文書

今年は去年からやっているボナンザ学習の作り込みとバグ修正が主な修正点です。

使っている手法は以下の通りです。
・pvs
・nullmove
・futility
・ビットボード




***************************************************************************************************
2014年アピール文書

去年(2013)年はUCT/MCを作る予定でしたが、ソースがゴチャゴチャになっていて作りこめませんでした。
そこで、今回は難解になっている部分(ほぼ全部)の書き直しをしています。
ベースとなるデータ構成や思考部分も書き直しなので、今まで使った基本的な手法や
うまくいった手法を使って作っています。
使っている手法は以下の通りです。
・pvs
・nullmove
・futility
・ビットボード

実戦で使うかどうか未決定ですが、現在作成中の手法は以下の通りです。
・マルチコア処理
・ボナンザ学習




***************************************************************************************************
2013年アピール文書

少し前から、コンピュータ囲碁で爆発的人気の手法であるUCT/MCを取り入れることにしました。
マルチコアのPCなので1スレッド(コア)は今まで通りのαβ法を使いこれをメインの決定方法とし
UCT/MCはこれからの作りこみ及び調整なので補助的な扱いとします。

去年作成したマルチコア探索は削除。




***************************************************************************************************
2012年アピール文書

今年もあまり進展がないので「アピール文書を出さない」という選択をしようと思いましたが、
余計な事をして運営の方々に迷惑が掛かっても悪いので去年のアピール文書に追加して提出します。

去年同様納得できるような結果を出す学習プログラムは今現在完成していません。
このままだと３年前バージョンでの参加となってしまい、面白くないので
マルチコアPCを持って行くならば、大会日までにマルチコア対応を入れて参加しようと考えてます。
(シングルコアPCならほぼ間違いなく３年前バージョンでの参加でしょう)

では、今回(実は２年前に実装した)追加するマルチコア対応の内容です。
いろいろと聞き取りをしたところ１手目のマルチコア対応はあまり高速化には貢献しないらしい。
上位プログラムの意見なのでなり金に当てはまるかは怪しいが信じる事にして、
この方法は採用しない事にしました(３手目でマルチコア対応するのはそこそこ良いような話も有るみたい)。
そこで、何か面白いアイディアはないかと考えたのが pvs+sss(名称はたぶんあっていると思う)の
ハイブリッドです。
１スレッドでメインとなるpvs探索、他のスレッドでオマケのsss探索を行い、
sssで得た結果でメインpvsのα、β値を絞って見る。
まあ、ココまで書いておいてなんですが、当時バグ満載できちんとデータを
取っていないので感覚的ですが結果はあまり良くないです。
今回はバグが取れることを期待して再挑戦します。


今回の追加手法
・マルチコア探索




***************************************************************************************************
2011年アピール文書


今年の修正は評価関数の学習を追加する事でしたが、今日現在でうまく動作していません。

このまま、学習結果がうまく動作しない場合は一昨年のバージョンとほぼ同じ状況での出場となります。


それでは使用している手法の一覧です。

なり金将棋は特別に変わったところはありません。
非常に一般的と言われるアルゴリズムのみで構成されています。
採用している手法は以下の
・αβ法(pvsらしい)
・nullmove
・futility
・一部ビットボード
です。