研究発表
2024年度
学術論文
石原祥太郎, 村田栄樹, 中間康文, 高橋寛武. 日本語ニュース記事要約支援に向けたドメイン特化事前学習済みモデルの構築と活用. 自然言語処理 (応用システム論文), 31巻, 4号, 2024年12月.
国際会議
Ziqi Yin, Hao Wang, Kaito Horio, Daisuke Kawahara, Satoshi Sekine. Should We Respect LLMs? A Cross-Lingual Study on the Influence of Prompt Politeness on LLM Performance. The Second Workshop on Social Influence in Conversations (SICon 2024) @ EMNLP 2024. November, 2024.
Shohei Tanaka, Hao Wang and Yoshitaka Ushiku. SciPostLayout: A Dataset for Layout Analysis and Layout Generation of Scientific Posters. The 35th British Machine Vision Conference (BMVC 2024). November, 2024.
Hirokazu Kiyomaru, Issa Sugiura, Daisuke Kawahara, and Sadao Kurohashi. A Comprehensive Analysis of Memorization in Large Language Models. The 17th International Natural Language Generation Conference (INLG 2024). September, 2024.
Hao Wang, Shuhei Kurita, Shuichiro Shimizu, Daisuke Kawahara. SlideAVSR: A Dataset of Paper Explanation Videos for Audio-Visual Speech Recognition. The Third Workshop on Advances in Language and Vision Research (ALVR) @ ACL 2024. August, 2024.
Rintaro Enomoto, Arseny Tolmachev, Takuro Niitsuma, Shuhei Kurita, Daisuke Kawahara. Investigating Web Corpus Filtering Methods in Language Model Development. The 2024 Conference of the North American Chapter of the Association for Computational Linguistics: Student Research Workshop (NAACL SRW 2024). June, 2024.
Mizuki Kondo, Daisuke Kawahara, Toshiyuki Kurabayashi. Improving Repository-level Code Search with Text Conversion. The 2024 Conference of the North American Chapter of the Association for Computational Linguistics: Student Research Workshop (NAACL SRW 2024). June, 2024.
Hao Wang, Tetsuro Morimura, Ukyo Honda, Daisuke Kawahara. Reinforcement Learning for Edit-Based Non-Autoregressive Neural Machine Translation. The 2024 Conference of the North American Chapter of the Association for Computational Linguistics: Student Research Workshop (NAACL SRW 2024). June, 2024.
Takuya Uematsu, Hao Wang, Daisuke Kawahara, Tomohide Shibata. A Benchmark Suite of Japanese Natural Questions. The 13th Joint Conference on Lexical and Computational Semantic (*SEM 2024). June, 2024.
Hao Wang, Shohei Tanaka and Yoshitaka Ushiku. SciPostLayout: A Dataset for Layout Analysis and Layout Generation of Scientific Posters. The workshop on Graphic Design Understanding and Generation (GDUG) @ CVPR 2024. June, 2024.
Eiki Murata and Daisuke Kawahara. Time-aware COMET: a Commonsense Knowledge Model with Temporal Knowledge. In Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024). May, 2024.
国内会議
田中翔平, 王昊, 牛久祥孝. SciPostLayout: 科学論文ポスターのレイアウト解析およびレイアウト生成のためのデータセット. 第27回 画像の認識・理解シンポジウム. 2024年8月.
王昊, 藤田正悟, 神田峻介. 契約書条文に特化した文埋め込みモデルの構築. 第260回自然言語処理研究発表会. 2024年6月.
その他
青木洸士郎, 河原大輔. 大規模言語モデルは他者の心をシミュレートしているか? 2024年度 ナラティブ意識学ワークショップ「脳・言語・意識」. 2024年9月.
福田創, 河原大輔. 物語生成タスクにおける埋め込みを用いたLLMの創造性評価. NLP若手の会(YANS) 第19回シンポジウム. 2024年9月.
渡邉一功, 河原大輔. 学習過程における重みのマージによるモデル最適化. NLP若手の会(YANS) 第19回シンポジウム. 2024年9月.
織田宥楽, 小川隼斗, 河原大輔. 人工知能ラッパーの実現に向けて. NLP若手の会(YANS) 第19回シンポジウム. 2024年9月.
小川隼斗, 河原大輔. 和歌埋め込みモデルの構築とそれを用いた本歌取りの分析. NLP若手の会(YANS) 第19回シンポジウム. 2024年9月.
植松拓也, 河原大輔, 柴田知秀. Japanese MT-bench++: より自然なマルチターン対話設定における大規模日本語ベンチマーク. NLP若手の会(YANS) 第19回シンポジウム. 2024年9月.
王昊, 河原大輔. 言語学習支援に向けた動画生成モデルの構築. NLP若手の会(YANS) 第19回シンポジウム. 2024年9月.
堀尾海斗, 河原大輔. LLMは真面目・不真面目になれるか? NLP若手の会(YANS) 第19回シンポジウム. 2024年9月.
2023年度
学術論文
大村和正, 河原大輔, 黒橋禎夫. 基本イベントに基づく常識推論データセットの構築と利用. 自然言語処理, 30巻, 4号. 2023年12月.
王昊, 清水博文, 河原大輔. 言語モデルを用いた漢詩文の返り点付与と書き下し文生成. 自然言語処理, 31巻, 1号. 2024年3月.
国際会議
Hao Wang, Hirofumi Shimizu and Daisuke Kawahara. Kanbun-LM: Reading and Translating Classical Chinese in Japanese Methods by Language Models. In Findings of the Association for Computational Linguistics: ACL 2023 (Findings of ACL 2023). July, 2023.
Nobuhiro Ueda, Kazumasa Omura, Takashi Kodama, Hirokazu Kiyomaru, Yugo Murawaki, Daisuke Kawahara, and Sadao Kurohashi. KWJA: A Unified Japanese Analyzer Based on Foundation Models. In Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics (Volume 3: System Demonstrations) (ACL 2023 Demo). July, 2023.
Sakura Imai, Daisuke Kawahara, Naho Orita and Hiromune Oda. Theoretical Linguistics Rivals Embeddings in Language Clustering for Multilingual Named Entity Recognition. In Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics (Volume 4: Student Research Workshop) (ACL 2023 SRW). July, 2023.
Tomohito Kasahara and Daisuke Kawahara. Exploring Automatic Evaluation Methods based on a Decoder-based LLM for Text Generation. In Proceedings of the 13th International Joint Conference on Natural Language Processing and the 3rd Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics: Student Research Workshop (IJCNLP-AACL 2023 SRW). November, 2023.
国内会議
清水博文, 河原大輔. 非言語データを用いた対照学習による文埋め込み学習の日本語における効果検証. 人工知能学会全国大会(第37回). 2023年6月.
伊藤俊太朗, 河原大輔. 日本語BERTにおけるトークナイザの違いによる影響の検証. 人工知能学会全国大会(第37回). 2023年6月.
堀尾海斗, 村田栄樹, 王昊, 井手竜也, 河原大輔, 山崎天, 新里顕大, 中町礼文, 李聖哲, 佐藤敏紀. 日本語における Chain-of-Thought プロンプトの検証. 人工知能学会全国大会(第37回). 2023年6月.
尹子旗, 河原大輔. 多段階転移学習による不完全発話補完の精度向上. 人工知能学会全国大会(第37回). 2023年6月.
中村友亮, 河原大輔. 日本語TruthfulQAの構築. 言語処理学会第30回年次大会. 2024年3月.
清水博文, 河原大輔. 日本語Winogroundデータセットの自動構築. 言語処理学会第30回年次大会. 2024年3月.
尹子旗, 王昊, 堀尾海斗, 河原大輔, 関根聡. プロンプトの丁寧さと大規模言語モデルの性能の関係検証. 言語処理学会第30回年次大会. 2024年3月.
今井咲良, Giovanni Pasa, 小田博宗, 折田奈甫, 河原大輔. 意味的プロービングデータセットの構築と言語モデルの評価: イタリア語の倒置を例に. 言語処理学会第30回年次大会. 2024年3月.
近藤瑞希, 河原大輔, 倉林利行. テキスト変換によるリポジトリレベルのコード検索の改善. 言語処理学会第30回年次大会. 2024年3月.
村田栄樹, 大友寛之, 村上聡一朗, 本多右京, 舟久保弘明. 訴求軸を考慮したキーワードからの広告文生成. 言語処理学会第30回年次大会. 2024年3月.
村田栄樹, 河原大輔. TaCOMET: 時間を考慮したイベント常識生成モデル. 言語処理学会第30回年次大会. 2024年3月.
植松拓也, 王昊, 河原大輔, 柴田知秀. 日本語Natural QuestionsとBoolQの構築. 言語処理学会第30回年次大会. 2024年3月.
山内悠輔, 河原大輔. 手順のテキスト化による将棋解説文生成. 言語処理学会第30回年次大会. 2024年3月.
王昊, 栗田修平, 清水周一郎, 河原大輔. SlideAVSR: 視聴覚音声認識のための論文解説動画データセット. 言語処理学会第30回年次大会. 2024年3月.
関根聡, 安藤まや, 後藤美知子, 鈴木久美, 河原大輔, 井之上直也, 乾健太郎. ichikara-instruction LLMのための日本語インストラクションデータの作成. 言語処理学会第30回年次大会. 2024年3月.
Arseny Tolmachev, Masayoshi Hayashi, Takuro Niitsuma, Rintaro Enomoto, Hao Wang, Shuhei Kurita, Daisuke Kawahara, Kazuma Takaoka, Yoshitaka Uchida. Uzushio: A Distributed Huge Corpus Processor for the LLM Era. 言語処理学会第30回年次大会. 2024年3月.
岡野裕仁, 河原大輔, 野村理朗. 自由記述からセルフ・コンパッションを推定することは可能か? ―BERTによる心理学的構成概念の定量化―. 言語処理学会第30回年次大会. 2024年3月.
小林俊介, 河原大輔. 多様なクイズを自動生成する手法およびその検証. 言語処理学会第30回年次大会. 2024年3月.
笠原智仁, 村田栄樹, 河原大輔. 科学技術論文を対象とした根拠付き生成型要約システムの構築. 言語処理学会第30回年次大会. 2024年3月.
榎本倫太郎, Tolmachev Arseny, 新妻巧朗, 栗田修平, 河原大輔. 大規模言語モデル開発における日本語Web文書のフィルタリング手法の検証. 言語処理学会第30回年次大会. 2024年3月.
笹川慶人, 河原大輔. 環境依存情報を利用しない大規模言語モデルによるコンピュータータスク自動化手法. 言語処理学会第30回年次大会. 2024年3月.
伊藤俊太朗, 河原大輔. 知識志向 Mixture of LoRA Experts の構築. 言語処理学会第30回年次大会. 2024年3月.
太田聖三郎, 河原大輔, 野村理朗. おもしろい川柳の生成. 言語処理学会第30回年次大会. 2024年3月.
その他
村田栄樹, 石原祥太郎. ドメイン別に訓練した要約モデルにおけるHallucinationの内在・外在要因分析. NLP若手の会(YANS) 第18回シンポジウム. 2023年8月.
王昊, 森村哲郎, 本多右京, 河原大輔. 非自己回帰言語モデルへの強化学習の適用. NLP若手の会(YANS) 第18回シンポジウム. 2023年8月.
2022年度
学術論文
栗原健太郎, 河原大輔, 柴田知秀. JGLUE: 日本語言語理解ベンチマーク. 自然言語処理, 30巻, 1号. 2023年3月.
国際会議
Tatsuya Ide and Daisuke Kawahara. Building a Dialogue Corpus Annotated with Expressed and Experienced Emotions. In Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics: Student Research Workshop (ACL 2022 SRW). May, 2022.
Kentaro Kurihara, Daisuke Kawahara, and Tomohide Shibata. JGLUE: Japanese General Language Understanding Evaluation. In Proceedings of the Thirteenth Language Resources and Evaluation Conference (LREC 2022). June, 2022.
Ryoma Sakaeda, Daisuke Kawahara. Generate, Evaluate, and Select: A Dialogue System with a Response Evaluator for Diversity-Aware Response Generation. In Proceedings of the 2022 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies: Student Research Workshop (NAACL 2022 SRW). July, 2022.
Tomohito Kasahara, Daisuke Kawahara, Nguyen Tung, Shengzhe Li, Kenta Shinzato, Toshinori Sato. Building a Personalized Dialogue System with Prompt-Tuning. In Proceedings of the 2022 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies: Student Research Workshop (NAACL 2022 SRW). July, 2022.
Ritvik Choudhary, Daisuke Kawahara. Grounding in social media: An approach to building a chit-chat dialogue model. In Proceedings of the 2022 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies: Student Research Workshop (NAACL 2022 SRW). July, 2022.
国内会議
植田暢大, 大村和正, 児玉貴志, 清丸寛一, 村脇有吾, 河原大輔, 黒橋禎夫. KWJA:汎用言語モデルに基づく日本語解析器. 情報処理学会 第253回自然言語処理研究会. 2022年9月.
児玉貴志, 植田暢大, 大村和正, 清丸寛一, 村脇有吾, 河原大輔, 黒橋禎夫. テキスト生成モデルによる日本語形態素解析. 言語処理学会第29回年次大会. 2023年3月.
栗原健太郎, 二宮大空, 友松祐太. 意味的類似度計算システムによるチャットボットFAQシステムの性能向上. 言語処理学会第29回年次大会. 2023年3月.
栗原健太郎, 河原大輔, 柴田知秀. JCommonsenseQA 2.0: 計算機と人の協働による常識推論データセットの改良. 言語処理学会第29回年次大会. 2023年3月.
井手竜也, 村田栄樹, 堀尾海斗, 河原大輔, 山崎天, 李聖哲, 新里顕大, 佐藤敏紀. 人間と言語モデルに対するプロンプトを用いたゼロからのイベント常識知識グラフ構築. 言語処理学会第29回年次大会. 2023年3月.
井手竜也, 榮田亮真, 河原大輔, 山崎天, 李聖哲, 新里顕大, 佐藤敏紀. 対話に基づく常識知識グラフの構築と対話応答生成に対する適用. 言語処理学会第29回年次大会. 2023年3月.
吉田あいり, 河原大輔. 日本語 WiC データセットの構築と読みづらさ検出への応用. 言語処理学会第29回年次大会. 2023年3月.
今井咲良, 河原大輔, 折田奈甫, 小田博宗. 理論言語学の知見を応用した多言語クラスタリング. 言語処理学会第29回年次大会. 2023年3月.
榮田亮真, 井手竜也, 村田栄樹, 河原大輔. 対話行為の分布を利用した雑談対話システムの評価指標. 言語処理学会第29回年次大会. 2023年3月.
笠原智仁, 河原大輔, 山崎天, 新里顕大, 佐藤敏紀. Decoderベースの大規模言語モデルに基づくテキスト生成の自動評価指標. 言語処理学会第29回年次大会. 2023年3月.
太田聖三郎, 河原大輔, 野村理朗. 機械学習を用いた川柳の面白さの予測. 言語処理学会第29回年次大会. 2023年3月.
王昊, 中町礼文, 佐藤敏紀. 日本語の大規模な基盤モデルに対するLoRAチューニング. 言語処理学会第29回年次大会. 2023年3月.
王昊, 清水博文, 河原大輔. 言語モデルを用いた漢文の返り点付与と書き下し文生成. 言語処理学会第29回年次大会. 2023年3月.
Ritvik Choudhary, 河原大輔. 魅力的な対話応答生成のための複数教師による知識蒸留. 言語処理学会第29回年次大会. 2023年3月.
田村稔行, 河原大輔. 事前学習モデルに基づく日本語形態素解析器における辞書の利用. 言語処理学会第29回年次大会. 2023年3月.
小林俊介, 河原大輔. 複数文書の読解を要する質問の自動生成と質問応答システムへの応用. 言語処理学会第29回年次大会. 2023年3月.
植松拓也, 河原大輔. 日本語の分類タスクにおけるカリキュラム学習とマルチタスク学習の効果検証. 言語処理学会第29回年次大会. 2023年3月.
村田栄樹, 井手竜也, 榮田亮真, 河原大輔, 山崎天, 李聖哲, 新里顕大, 佐藤敏紀. 大規模言語モデルによって構築された常識知識グラフの拡大と低コストフィルタリング. 言語処理学会第29回年次大会. 2023年3月.
2021年度
国際会議
Tatsuya Ide and Daisuke Kawahara. Multi-Task Learning of Generation and Classification for Emotion-Aware Dialogue Response Generation. In Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Student Research Workshop (NAACL-HLT 2021 SRW). June, 2021.
国内会議
笠原智仁, 河原大輔. Prompt-Tuningによる個性を持った対話システムの構築. 言語処理学会第28回年次大会. 2022年3月.
榮田亮真, 河原大輔. 応答の生成・評価・選択による対話システム. 言語処理学会第28回年次大会. 2022年3月.
井手竜也, 河原大輔. 表出感情と経験感情をタグ付けした対話コーパスの構築. 言語処理学会第28回年次大会. 2022年3月.
Ritvik Choudhary, 河原大輔. ソーシャルメディア上のインタラクションを利用したオープンドメイン対話応答生成. 言語処理学会第28回年次大会. 2022年3月.
吉田あいり, 河原大輔. 構造的曖昧性に基づく読みづらさの検出. 言語処理学会第28回年次大会. 2022年3月.
栗原健太郎, 河原大輔, 柴田知秀. JGLUE: 日本語言語理解ベンチマーク. 言語処理学会第28回年次大会. 2022年3月.
その他
栗原健太郎, 河原大輔, 柴田知秀. 日本語版GLUE構築の試み. NLP若手の会(YANS) 第16回シンポジウム. 2021年8月.
榮田亮真, 河原大輔. 応答の評価モデルとそれを利用した対話システム. NLP若手の会(YANS) 第16回シンポジウム. 2021年8月.
2020年度
国内会議
井手竜也, 河原大輔. 生成と分類のマルチタスク学習による感情が考慮された対話応答生成. 言語処理学会第27回年次大会. 2021年3月.
榮田亮真, 河原大輔. 逆翻訳とフィルタリングによる擬似対話コーパスの生成とそれを用いた対話システムの学習. 言語処理学会第27回年次大会. 2021年3月.
栗原健太郎, 河原大輔. ファクトチェック支援のための含意関係認識システム. 言語処理学会第27回年次大会. 2021年3月.
小原京子, 河原大輔, 笹野遼平, 関根聡. 集合知を用いた大規模意味的フレーム知識の構築. 言語処理学会第27回年次大会. 2021年3月.
田中佑, 村脇有吾, 河原大輔, 黒橋禎夫. 日本語Wikipediaの編集履歴に基づく入力誤りデータセットと訂正システムの改良. 言語処理学会第27回年次大会. 2021年3月.