生成AIモデルの地図:確率分布と情報幾何による類似性の可視化

生成AIが実社会に大きな影響を与えています。数学的に見ると、生成AIは確率分布です。その内部ではニューラルネットによって文書や画像の生成確率が計算され、モデルごとに出力傾向に個性があります。私たちは、日々提案される生成AIモデルの類似性を把握するため、確率分布の空間における位置関係を反映するような座標を計算する統計的手法を提案しました。情報幾何学のアプローチにより、モデル間のKLダイバージェンス(確率分布間のずれをエントロピーで測った指標)を近似する「生成AIの地図」を比較的小さい計算コストで作成できます。

約1000個の言語モデルの地図

参考文献

  • Momose Oyama, Hiroaki Yamagiwa, Yusuke Takase, Hidetoshi Shimodaira, Mapping 1,000+ Language Models via the Log-Likelihood Vector, https://arxiv.org/abs/2502.16173 (accepted to ACL2025 main)

コードとデータ

ModelMapのポータルサイト

言語処理学会第31回年次大会(NLP2025)において委員特別賞を受賞

単語の意味の変化を検出するため,単語毎の文脈付き単語埋め込みの集合間に不均衡最適輸送を適用して意味が消失/出現した用例を特定する方法の発表を行い(発表者 岸野 稜),委員特別賞を受賞しました.

不均衡最適輸送を用いた意味変化検出
◯岸野 稜, 山際 宏明 (京大), 永田 亮 (甲南大/理研), 横井 祥 (国語研/東北大/理研), 下平 英寿 (京大/理研)

言語処理学会のサイト https://www.anlp.jp/nlp2025/award.html

NLP若手の会 (YANS) 第19回シンポジウム (2024)において奨励賞を受賞

単語の意味の変化を検出するため,単語毎の文脈付き単語埋め込みの集合間に不均衡最適輸送を適用して意味が消失/出現した用例を特定する方法の発表を行い(発表者 岸野 稜),奨励賞を受賞しました.

不均衡最適輸送を用いた意味変化検出
◯ 岸野 稜 (京大), 山際 宏明 (京大), 永田 亮 (甲南大/理研), 横井 祥 (東北大/理研), 下平 英寿 (京大/理研)

言語処理学会第30回年次大会(NLP2024)においてリクルート賞を受賞

「大規模言語モデルにおける幻覚緩和のための単語確率の外挿」と題する発表を行い(発表者 何昀臻),リクルート賞を受賞しました.大規模言語モデルのニューラルネットで用いられるトランスフォーマーには多数の層があり,入力層から出力層にむけて単語の情報表現が変換されていきます.これを時系列と解釈して外挿し仮想的に層を追加したときの出力層を予測するアプローチを本研究で提案しました.素朴なアイデアですが言語モデルの性能が向上することを実験的に示しています.

大規模言語モデルにおける幻覚緩和のための単語確率の外挿
何昀臻, 高瀬侑亮, 石橋陽一 (京大), 下平英寿 (京大/理研)

言語処理学会のサイト https://www.anlp.jp/nlp2024/award.html

NLP若手の会 (YANS) 第18回シンポジウム (2023)において奨励賞を受賞

大規模言語モデルが内部でどのように情報を表現しているのか,とくにファインチューニング前後でどのように変化するのか,について「内部表現の幾何に基づく言語モデルの解釈」と題する発表を行い(発表者 大山百々勢 ),奨励賞を受賞しました.

「内部表現の幾何に基づく言語モデルの解釈」
◯大山百々勢 (京大/理研),山際宏明 (京大),石橋陽一 (京大),下平英寿 (京大/理研)

NLP若手の会 (YANS) 第18回シンポジウム (2023)

第25回情報論的学習理論ワークショップ(IBIS2022)において学生最優秀プレゼンテーション賞を受賞

バンディット問題における敵対的設定・確率的設定という異なる報酬モデルに対して同時に最適性を達成する方策の研究について,D3土屋平が学生最優秀プレゼンテーション賞を受賞しました.受賞対象の研究「バンディット問題におけるBest-of-Both-Worlds方策の進展:構造的バンディットと分散依存リグレット」は,土屋平(京大,理研AIP),本多淳也(京大,理研AIP),伊藤伸志(NEC)の共同研究です.

IBIS2022のサイト https://ibisml.org/ibis2022/awards/

データ科学コース 入試説明会(2022年12月)

2023年2月の入試について,Zoomによる入試説明会が開催予定です.入試についての説明のほかに,弊研究室 (統計知能・統計数理)の分野説明もあります.

データ科学コース 入試説明会【オンライン開催】

第1回 2022年12月14日(水曜)17:00-18:30

第2回 2022年12月17日(土曜)13:00-14:30

※事前登録不要.zoom接続情報は下記URLに掲載.

2023年度からの組織変更について

京都大学情報学研究科の組織変更

情報学研究科は2023年(令和5年)4月に改組され、現在の6専攻は統合されて7つのコースを擁する「情報学専攻」になります。現在の知能情報学専攻、社会情報学専攻、先端数理科学専攻、数理工学専攻、システム科学専攻、通信システム専攻は、それぞれ対応するコースに移行します。そして、データ科学コースが新設されます。

この研究室はどうなるの?

下平・本多研究室は、2つのコースに所属します。つぎのどちらの分野名も下平・本多研究室です。研究室内での主な活動に差はありませんが、大学院生が履修する授業科目はコースによって違いがあります。

  • システム科学コース 統計知能分野
  • データ科学コース 統計数理分野

各コースのサイトはこちら

トップ研究者のリスト

論文の被引用数等をベースにした世界の研究者データが公開されています.そのデータからトップ研究者のリストを作成してみました.研究の各分野について,世界の上位20名と,日本の上位20名のリスト(PDFファイル)です.

こんな感じ.それぞれの研究者の分野は,メイン(分野1)とサブ(分野2)の両方で登録されているので,同じ人がリストに2回出てくることもあります.

研究者データでは,各研究者がどの分野で論文を書いているかの成分値が自動推定されて,その上位2分野が利用されています.成分値が低い研究者でも,他分野での被引用数が多い場合は上位に掲載されることがあります.そこで,成分値が15%以上となっている場合に限定したリストも作成しました.世界と日本で上位300名のリスト(エクセルファイル)です.

PDFファイルのダウンロード(成分値は考慮せず上位20名)

エクセルファイルのダウンロード(成分値15%以上の上位300名)

研究者データ

Baas, Jeroen; Boyack, Kevin; Ioannidis, John P.A. (2021), August 2021 data-update for “Updated science-wide author databases of standardized citation indicators”, Mendeley Data, V3, https://doi.org/10.17632/btchxktzyw.3

言語処理学会第28回年次大会(NLP2022)において若手奨励賞を受賞

単語の意味をベクトルで表現する,という単語埋め込みの研究においてB4の大山百々勢が若手奨励賞(対象280件中12件)を受賞をしました.対象となった研究「単語ベクトルの長さは意味の強さを表す」は,大山百々勢 (京大,理研AIP),横井祥(東北大学,理研AIP),下平英寿(京都大学,理研AIP)の共同研究です.

言語処理学会のサイト https://www.anlp.jp/nlp2022/award.html