研究室のメンバーリストを2019年度版に更新しました
負のサンプルサイズ(日本語の資料)
マルチスケール・ブートストラップでは負のサンプルサイズが出てきます.オリジナルデータのサンプリサイズをn,ブートストラップデータのサンプルサイズをn’とします.オリジナルデータからn’個の要素をリサンプリングしてブートストラップデータを作ります.このときn’=nとするのが普通のブートストラップです.マルチスケール・ブートストラップではn’>0の値をいくつか設定します.たとえばn’=0.5n, 1.0n, 1.5n みたいにします.するとブートストラップ確率という信頼度はn’の関数になります.この関数をスケーリング則といいます.スケーリング則の理論式をつかって,n’ = -nに外挿すると,頻度論の不偏なp-値が得られます.ちなみに普通のブートストラップでn’ = nとするのはベイズの事後確率に相当します.したがって,n’ = nから n’ = -nにすると,ベイズが頻度論になります.実際には分散=n/n’の関数としてスケーリング則を表します.分散=1から0をとおって−1まで外挿しますので,n’でみるとn’=nから0の方向ではなく無限大の方向に動かします.n’=-nにどういう意味があるのかはよくわかりません.
(次の日本語資料では,n’をmと書いています)
- マルチスケール・ブートストラップの漸近理論,日本統計学会誌,2012年
- なぜサンプルサイズを負にすると ベイズが頻度論に変わるのか? (日本統計学会研究業績賞記念講演 2011)
- 頻度論とベイズをつなぐ統計的信頼度,第19回情報論的学習理論ワークショップ (IBIS2016),2016年


高度AI人材になろう(AI関連分野のトップ会議)
専攻入試説明会と研究室見学(2019/05)
京都大学大学院 情報学研究科システム科学専攻の入試説明会に合わせて,研究室見学を行います.できれば事前にメール連絡をください.
第1回 2019/5/18(土)
研究室見学:11:30~12:30 (工学部総合校舎109号室)
専攻入試説明会:13:00~15:00(工学部総合校舎213号室)
第2回 2019/5/21(火)
研究室見学:15:00~16:00 (工学部総合校舎109号室)
専攻入試説明会:16:30~18:30(工学部総合校舎213号室)
専攻入試説明会のウェブサイトは
http://www.sys.i.kyoto-u.ac.jp/exam/index.html
配属説明会の研究室紹介のスライド(2019/04/04)
京都大学の数理工学コースは今年60周年記念
京都大学工学部情報学科には計算機科学コースと数理工学コースがありますが,弊研究室の属する後者は今年60周年記念を迎えます.2019年10月には記念出版や記念シンポジウムが予定されています.詳細は下記URLを参照してください.
2019年に数理工学は60周年を迎えます
https://www.suurikai.net
「数理工学」の名を冠する専攻・学科・コースの英訳は,Applied Mathematics and Physics, Mathematical Engineering, Mathematical Sciencesと様々あることからわかるように,数理工学で行われている研究の内容は一律ではありません.最近では数理工学と関わりが深い人工知能やデータサイエンスが大きく発展していますが,数理工学は工学・社会・人間・経済・自然現象など森羅万象を扱う工学・数学・情報学にまたがる学際的分野とされることが多いようです.
京都大学の数理工学科は1959年に誕生し,それより少し前に誕生した東京大学の数理工学コースと並んで日本の数理工学を牽引してきました.2019年は数理工学科が誕生して60周年にあたります.研究者・学生等として京都大学の数理工学科・数理工学コースを担当する研究室に所属したことがある方々だけでなく広く数理工学に関心のある方々を対象として,ここに「数理工学誕生60周年記念ホームページ」を開設しました.
数理会幹事 中村佳正
ちなみに東京大学の数理工学コースは1951年設立のようです.詳細は次の東大のサイト「理念と歴史(数理情報工学)」で説明されています.
言語処理学会第25回年次大会(NLP2019)において若手奨励賞と最優秀ポスター賞を受賞
研究室メンバーのKIM, GEE WOOK(修士1年)が言語処理学会第25回年次大会(NLP2019)において若手奨励賞と最優秀ポスター賞を受賞しました.
題名:擬ユークリッド空間への単語埋め込み
著者:Kim Geewook, 奥野彰文, 下平英寿

言語処理学会第25回年次大会(NLP2019)のウェブサイト:http://www.anlp.jp/nlp2019/
単語埋め込み,選択的推測,複雑ネットワーク,情報量規準 (2019/02/28)
グラフ埋め込みや類似度関数の学習 (2019/02/28)
最近の論文 (2019/02/28)
本年度の研究まとめについては次の2つの投稿を参照してください(追記)
研究室の学生やチームのメンバーのおかげで,グラフ埋め込みや類似度学習に関する表現学習の手法や理論の論文がいくつか出てきました.
- Representation Learning with Weighted Inner Product for Universal Approximation of General Similarities (arXiv 2019) (IJCAI 2019) [ニューラルネットワークと重み付き内積による一般類似度関数の万能近似性]
- Robust Graph Embedding with Noisy Link Weights (arXiv) (AISTATS 2019) [リンクにノイズがあるときのロバストなグラフ埋め込み]
- Graph Embedding with Shifted Inner Product Similarity and Its Improved Approximation Capability (arXiv) (AISTATS 2019) [ニューラルネットワークの関係データ解析で用いる類似度の拡張とその近似定理および近似レート評価]
- A probabilistic framework for multi-view feature learning with many-to-many associations via neural networks (arXiv) (ICML 2018) [ニューラルネットワークによるマルチビュー関連データ解析]
グラフ埋め込みの表現学習に関連した応用として,単語埋め込みや画像の埋め込みの論文も出ています.
- 擬ユークリッド空間への単語埋め込み (言語処理学会第25回年次大会 NLP2019) KIM, GEE WOOK(修士1年)が若手奨励賞&最優秀ポスター賞受賞 (3/27追記)
- Segmentation-free compositional n-gram embedding (arXiv 2019) (NAACL-HLT 2019 accepted papers) [単語分割しない合成的文字n-gram埋め込み]
- Word-like character n-gram embedding (W-NUT 2018) [単語らしい文字n-gramの埋め込み]
- 単語らしい文字n-gramの埋め込みによる単語の分散表現 (言語処理学会 第24回年次大会 2018)
- Segmentation-Free Word Embedding for Unsegmented Languages (EMNLP 2017) [単語分割しない単語埋め込み]
- Spectral Graph-Based Method of Multimodal Word Embedding (TextGraphs-11, 2017) [画像を補助情報とした単語埋め込み]
- 単語分割を経由しない単語埋め込み (言語処理学会 第23回年次大会 2017)
- Image and tag retrieval by leveraging image-group links with multi-domain graph embedding (ICIP 2016) [Flickrの画像,タグ,グループ検索]
- Cross-Lingual Word Representations via Spectral Graph Embeddings (ACL 2016) (CL-Eigenwords Website) [多言語コーパスの単語分散表現]
- マッチング相関分析を用いた画像-マルチタグ間の相互検索, 電子情報通信学会 和文論文誌D 2016「画像の認識・理解」特集 [Flickrの画像,タグ検索]
統計学の理論や応用の論文もあります.
- An information criterion for auxiliary variable selection in incomplete data analysis (Entropy 2019) [不完全データにおける補助変数選択のための情報量規準]
- Selective Inference for Testing Trees and Edges in Phylogenetics (arXiv 2019) [系統樹推定における選択的仮説検定]
- Transitivity vs Preferential Attachment: Determining the Driving Force Behind the Evolution of Scientific Co-Authorship Networks (ICCS 2018) [共著ネットワークなどの複雑ネットワーク成長メカニズムにおける優先的選択性と推移性について]
- Selective inference for the problem of regions via multiscale bootstrap (arXiv 2018) [マルチスケールブートストラップによる選択的仮説検定]
- PAFit: an R Package for Estimating Preferential Attachment and Node Fitness in Temporal Complex Networks (arXiv 2017) [ネットワーク成長モデルの優先的選択関数と適応度を同時推定するソフトウエア]
- An information criterion for model selection with missing data via complete-data divergence (Annals of the Institute of Statistical Mathematics 2018) [欠測データの情報量規準]
- Joint estimation of preferential attachment and node fitness in growing complex networks (Scientific Reports 2016) [ネットワーク成長モデルの優先的選択関数と適応度を同時推定]
- Cross-validation of matching correlation analysis by resampling matching weights (Neural Networks 2016) (arXiv) [CDMCAの概要とそのリサンプリング理論]