2023/03 NLP2023@宜野湾
2025/08 夏ゼミ合宿@軽井沢
2024/02 スキー合宿@志賀高原
2026/7/1: ICDAR 2026発表
8/30-9/4に開催されるICDAR 2026で以下の研究発表をします。
Keito Sasagawa, Shuhei Kurita, and Daisuke Kawahara. Synth-JDoc: Synthesizing a Japanese Document Image Dataset for OCR with Diverse Layouts and Embedded Images.
2026/7/1: ICML 2026発表
7/6-11に開催されるICML 2026で以下の研究発表をします。
Koshiro Aoki, Itsuki Hamada, Naho Orita, Daisuke Kawahara, Hiromu Sakai. Crosscoders Identify Shared or Specific Features between the Human Brain and Language Models. (Mechanistic Interpretability Workshop)
Koshiro Aoki, Ryota Takatsuki, Gouki Minegishi, Yusuke Haruki, Daisuke Kawahara. In-Context Neurofeedback: Can Large Language Models Control Their Internal Representations through Privileged Access? (AI4GOOD Workshop)
2026/6/30: ACL 2026 発表
7/2-7に開催されるACL 2026で以下の研究発表をします。
Hao Wang, Pinzhi Huang, Daisuke Kawahara. Evaluating Cross-Lingual Behavior and Consistency of Multimodal Large Language Models. (TrustNLP)
Hayato Ogawa, Daisuke Kawahara. Constructing a Japanese Rap Lyric Generation Model with GRPO. (SRW)
Miwa Masano, Hirokazu Kiyomaru, Atsushi Keyaki, Kaito Horio, Rei Minamoto, Ribeka Keyaki, Kouta Nakayama, Hideyuki Tachibana, and Daisuke Kawahara. Constructing a Japanese Verdict Prediction Dataset for Fact-Checking of LLM-Generated Texts. (SRW)
Rei Minamoto, Yusuke Oda, Daisuke Kawahara. Detecting Sensitive Personal Information in Japanese Pre-Training Corpora for Large Language Models. (Findings)
2026/6/8: 人工知能学会全国大会 (第40回) 発表
6/8-12に開催される人工知能学会全国大会 (第40回)で以下の研究発表をします。
牧野剛之, 河原大輔, 倉林利行. Probe-SWE-agent:高精度なコードテストを行うコーディングエージェント.
青木洸士郎, 磯沼大, 小田悠介, 清丸寛一, 児玉貴志, 劉超然, 大関洋平, 宮尾祐介, 河原大輔. 損失曲線のクラスタリングによる言語モデルの訓練ダイナミクスのボトムアップな解釈.
佐々木斗海, 河原 大輔. 人間向けクイズを模した高難易度日本語 QA ベンチマークの構築.
杉浦一瑳, 笹川慶人, 中尾圭佑, 前田航希, Yin Ziqi, Yang Zhishen, 栗田修平, 小田悠介, 徳久良子, 河原大輔, 岡崎直観. Jagle: 視覚言語モデルのための大規模日本語マルチモーダル事後学習データセットの構築.
西田悠人, 清丸寛一, 小田悠介, 児玉貴志, 劉超然, 河原大輔, 宮尾祐介, 磯沼大. パラメータ間の距離に基づくLLMの事前学習データの寄与分析.
2026/6/6: 人工知能学会 表彰
以下の論文が人工知能学会において表彰されました。
人工知能学会40周年記念論文賞 最優秀論文賞
青木洸士郎, 高槻瞭大, 峰岸剛基, 趙羽風. Mechanistic Interpretability : 解釈可能性研究の新たな潮流.
2026/5/11: LREC 2026 発表
5/11-16に開催されるLREC 2026で以下の研究発表をします。
Keito Sasagawa, Shuhei Kurita, and Daisuke Kawahara. Evaluating Multimodal Large Language Models on Vertically Written Japanese Text.
Miwa Masano, Ribeka Keyaki, Atsushi Keyaki, Rei Minamoto, Kaito Horio, Hirokazu Kiyomaru, Kouta Nakayama, Hideyuki Tachibana, and Daisuke Kawahara. Constructing a Japanese Claim Decomposition Dataset for Fact-Checking of LLM-Generated Texts.
Akiko Aizawa, Yuki Arase, Fei Cheng, Jiahao Huang, Zhiyi Huang, Junfeng Jiang, Teruhito Kanazawa, Daisuke Kawahara, Kazuma Kobayashi, Takashi Kodama, Sadao Kurohashi, Yusuke Oda, Yuma Tsuta, Zhen Wan, Zhishen Yang, and Rio Yokota. Building Effective Japanese Medical LLMs with an Open Recipe for Domain Adaptation through Continued Pre-training.
Shengzhe Li, Masaya Ohagi, Ryokan Ri, Akihiko Fukuchi, Tomohide Shibata, and Daisuke Kawahara. JMTEB and JMTEB-lite: Japanese Massive Text Embedding Benchmark and Its Lightweight Version.
Shengzhe Li, Masaya Ohagi, Hayato Tsukagoshi, Akihiko Fukuchi, Tomohide Shibata, and Daisuke Kawahara. Construction of a Japanese RAG Benchmark Using Synthetic Documents on Non-existent Entities and Events.
2026/4/1: 新メンバー配属
7名の学部生、1名の修士学生、1名の博士学生が新たに配属されました。