2023/03 NLP2023@宜野湾
2023/09 夏ゼミ合宿@鴨川
2024/02 スキー合宿@志賀高原
2026/3/9: EACL2026 発表
3/24-29に開催されるEACL 2026で以下の研究発表をします。
Yusuke Nakamura, Hirokazu Kiyomaru, Chaoran Liu, Shuhei Kurita, and Daisuke Kawahara. Demystifying Mixed Outcomes of Self-Training: Pre-training Analyses on Non-Toy LLMs. (Findings)
Hirokazu Kiyomaru, Yusuke Oda, Takashi Kodama, Chaoran Liu, and Daisuke Kawahara. Scaling Data-Constrained Language Models with Synthetic Data. (Findings)
Sebastian Zwirner, Wentao Hu, Koshiro Aoki, and Daisuke Kawahara. Evaluating the Impact of SAE-based Language Steering on LLM Performance. (SRW)
2026/3/9: 言語処理学会第32回年次大会(NLP2026) 発表
3/9-13に開催されるNLP2026で以下の研究発表をします。
五十里渚, 福田創, 高山隼矢, 綿岡晃輝, 河原大輔. JMT-Safety: 日本語マルチターン対話における安全性評価ベンチマーク.
渡邉一功, 水本智也, 周藤唯, 河原大輔. 応答内容・順序に着目した音声対話ベンチマークの構築.
藤田一颯, 織田宥楽, Sebastian Zwirner, 河原大輔. JaCarEval: 日本語車載対話に対するLLM 評価器のメタ評価フレームワーク.
笹川慶人, 栗田修平, 河原大輔. マルチモーダルLLM の縦書きテキスト読み取り能力の評価.
青木洸士郎, 河原大輔. クロスコーダーを用いた脳と言語モデルにおける内部表現の特徴量比較.
榎本倫太郎, 栗田修平, 河原大輔. アンサンブル蒸留と学習ベース集計を用いた数学的推論プロセスの検証と性能分析.
杣谷星音, 河原大輔. 大規模言語モデルの手順型応答を対象としたファクトチェックフレームワークの構築.
福田創, 河原大輔. 尤度を用いた進化戦略によるLLMの最適化.
Sebastian Zwirner, Wentao Hu, Koshiro Aoki, Daisuke Kawahara. Improving SAE-based Language Steering with Prompting in Large Language Models.
小野聡, 河原大輔. 大規模言語モデルに対するプロービングによる複合動詞の意味理解の分析.
中尾圭佑, 栗田修平, 河原大輔. オープンなVLMを活用した日本語マルチモーダル指示データセットの構築.
小川隼斗, 河原大輔. GRPOを用いた日本語ラップの歌詞生成モデルの構築.
小川隼斗, 福地成彦, 李聖哲, 河原大輔. 指示認識テキスト埋め込みモデルの指示によるベクトル変位の分析.
源怜維, 小田悠介, 河原大輔. 大規模コーパスにおける要配慮個人情報検出の精度向上.
清丸寛一, 出口祥之, 政野美和, 源怜維, 堀尾海斗, 欅惇志, 中山功太, 橘秀幸, 欅リベカ, 河原大輔. LLM-jp FactCheck:学習コーパスに照らした真偽検証によるモデル応答の分析.
杉浦一瑳, 前田航希, 栗田修平, 小田悠介, 河原大輔, 岡崎直観. JAMMEval: 再アノテーションによる日本語VQA評価データセットの信頼性向上.
政野美和, 欅リベカ, 欅惇志, 清丸寛一, 中山功太, 堀尾海斗, 源怜維, 橘秀幸, 河原大輔. LLMの生成テキストの真偽検証のための日本語言説分解データセットの構築と評価.
杉浦一瑳, 栗田修平, 小田悠介, 河原大輔, 岡部寿男, 岡崎直観. WAON: 視覚言語モデルのための大規模かつ高品質な日本語画像・テキスト対データセット.
政野美和, 清丸寛一, 欅惇志, 堀尾海斗, 源怜維, 欅リベカ, 中山功太, 橘秀幸, 河原大輔. LLMの生成テキストの真偽検証のための日本語真偽判定データセットの構築.
2025/3/7: 第267回自然言語処理研究発表会
3/7,8に開催される第267回自然言語処理研究発表会で以下の研究発表をします。
屋藤翔麻, 清丸寛一, 小田悠介, 河原大輔. 官庁出版物コーパスを用いた日本語LLMの継続事前学習とその分析.
織田宥楽, 小川隼斗, 河原大輔. 韻と内容を制御した日本語ラップ歌詞の自動生成.
2025/3/6: 第50回社会言語科学会研究大会
3/6-8に開催される第50回社会言語科学会研究大会で以下の研究発表をします。
折田奈甫, 小川隼斗, 河原大輔. 非母語話者の日本語に対する言語モデルの差別的傾向.
2026/1/20: AAAI-26 発表
1/20-27に開催されるAAAI-26で以下の研究発表をします。
Hao Wang, Eiki Murata, Lingfang Zhang, Ayako Sato, So Fukuda, Ziqi Yin, Wentao Hu, Keisuke Nakao, Yusuke Nakamura, Sebastian Zwirner, Yi-Chia Chen, Hiroyuki Otomo, Hiroki Ouchi, Daisuke Kawahara. VIR-Bench: Evaluating Geospatial and Temporal Understanding of MLLMs via Travel Video Itinerary Reconstruction.