負のサンプルサイズ(日本語の資料)

マルチスケール・ブートストラップでは負のサンプルサイズが出てきます.オリジナルデータのサンプリサイズをn,ブートストラップデータのサンプルサイズをn’とします.オリジナルデータからn’個の要素をリサンプリングしてブートストラップデータを作ります.このときn’=nとするのが普通のブートストラップです.マルチスケール・ブートストラップではn’>0の値をいくつか設定します.たとえばn’=0.5n, 1.0n, 1.5n みたいにします.するとブートストラップ確率という信頼度はn’の関数になります.この関数をスケーリング則といいます.スケーリング則の理論式をつかって,n’ = -nに外挿すると,頻度論の不偏なp-値が得られます.ちなみに普通のブートストラップでn’ = nとするのはベイズの事後確率に相当します.したがって,n’ = nから n’ = -nにすると,ベイズが頻度論になります.実際には分散=n/n’の関数としてスケーリング則を表します.分散=1から0をとおって−1まで外挿しますので,n’でみるとn’=nから0の方向ではなく無限大の方向に動かします.n’=-nにどういう意味があるのかはよくわかりません.

(次の日本語資料では,n’をmと書いています)

(IBIS2016のスライドより)


(日本統計学会誌 2012年の論文より)

専攻入試説明会と研究室見学(2019/05)

京都大学大学院 情報学研究科システム科学専攻の入試説明会に合わせて,研究室見学を行います.できれば事前にメール連絡をください.

研究室見学の前に論文みると良いです

第1回 2019/5/18(土)
研究室見学:11:30~12:30 (工学部総合校舎109号室)
専攻入試説明会:13:00~15:00(工学部総合校舎213号室)

第2回 2019/5/21(火)
研究室見学:15:00~16:00 (工学部総合校舎109号室)
専攻入試説明会:16:30~18:30(工学部総合校舎213号室)

専攻入試説明会のウェブサイトは
http://www.sys.i.kyoto-u.ac.jp/exam/index.html

京都大学の数理工学コースは今年60周年記念

京都大学工学部情報学科には計算機科学コースと数理工学コースがありますが,弊研究室の属する後者は今年60周年記念を迎えます.2019年10月には記念出版や記念シンポジウムが予定されています.詳細は下記URLを参照してください.

2019年に数理工学は60周年を迎えます
「数理工学」の名を冠する専攻・学科・コースの英訳は,Applied Mathematics and Physics, Mathematical Engineering, Mathematical Sciencesと様々あることからわかるように,数理工学で行われている研究の内容は一律ではありません.最近では数理工学と関わりが深い人工知能やデータサイエンスが大きく発展していますが,数理工学は工学・社会・人間・経済・自然現象など森羅万象を扱う工学・数学・情報学にまたがる学際的分野とされることが多いようです.
京都大学の数理工学科は1959年に誕生し,それより少し前に誕生した東京大学の数理工学コースと並んで日本の数理工学を牽引してきました.2019年は数理工学科が誕生して60周年にあたります.研究者・学生等として京都大学の数理工学科・数理工学コースを担当する研究室に所属したことがある方々だけでなく広く数理工学に関心のある方々を対象として,ここに「数理工学誕生60周年記念ホームページ」を開設しました.
数理会幹事 中村佳正

https://www.suurikai.net

ちなみに東京大学の数理工学コースは1951年設立のようです.詳細は次の東大のサイト「理念と歴史(数理情報工学)」で説明されています.

言語処理学会第25回年次大会(NLP2019)において若手奨励賞と最優秀ポスター賞を受賞

研究室メンバーのKIM, GEE WOOK(修士1年)が言語処理学会第25回年次大会(NLP2019)において若手奨励賞と最優秀ポスター賞を受賞しました.

題名:擬ユークリッド空間への単語埋め込み
著者:Kim Geewook, 奥野彰文, 下平英寿

言語処理学会第25回年次大会(NLP2019)のウェブサイト:http://www.anlp.jp/nlp2019/

単語埋め込み,選択的推測,複雑ネットワーク,情報量規準 (2019/02/28)

本年度の研究のうち,4つのテーマについてのまとめ.単語埋め込みは数年前から興味もってるもので,ほぼ研究室の学生がやってる.複雑ネットワークの成長モデルも研究室の学生と卒業生が中心となってやってる.統計の理論 (selective inferenceとinformation criterion)は理研チームのメンバーとやってる.

最近の論文 (2019/02/28)

本年度の研究まとめについては次の2つの投稿を参照してください(追記)

研究室の学生やチームのメンバーのおかげで,グラフ埋め込みや類似度学習に関する表現学習の手法や理論の論文がいくつか出てきました.

グラフ埋め込みの表現学習に関連した応用として,単語埋め込みや画像の埋め込みの論文も出ています.

統計学の理論や応用の論文もあります.

研究室見学の前に論文みると良いです

下平研究室に興味があって見学希望する学生のみなさんへアドバイスです.研究室のメンバーが書いた論文をぜひ見てください.論文は研究のページに「最近の論文」のリストがあります.

または下記のブログは項目別に2016年以降の論文をまとめました (2019/02/28追記)

論文見ても全然わからないよ,っていうのは学部生ですと普通なので心配しなくてよいです.それでも図や式をみて,なんとなく雰囲気が感じ取れれば,それで十分と思います.

研究室の論文は成果物ですから,会社でいえば商品に相当します.研究室のメンバーになれば,こんどは研究して学会発表したり論文書いたりする立場になります.そのまえに,商品をよく調べるのは当然やったほうが得だと思う.

本当はすごい装置見せたりできればいいのですが理論系なので本や計算機サーバーくらいしか見せるものないです.研究内容のわかりやすい解説をウェブに掲載すればいいとおもうけど,サボっていてまだありません.会社でいえば商品は頑張って作ってるが広告やってないので,あまり自慢できる状況ではないけれど,ご理解ください.

そういえば最近twitterやってるのは広告かもしれないです.