第25回情報論的学習理論ワークショップ(IBIS2022)において学生最優秀プレゼンテーション賞を受賞

バンディット問題における敵対的設定・確率的設定という異なる報酬モデルに対して同時に最適性を達成する方策の研究について,D3土屋平が学生最優秀プレゼンテーション賞を受賞しました.受賞対象の研究「バンディット問題におけるBest-of-Both-Worlds方策の進展:構造的バンディットと分散依存リグレット」は,土屋平(京大,理研AIP),本多淳也(京大,理研AIP),伊藤伸志(NEC)の共同研究です.

IBIS2022のサイト https://ibisml.org/ibis2022/awards/