和地 瞭良 / Akifumi Wachi
Enlgish version is here.
強化学習(Reinforcement Learning, RL)の理論と応用全般に関して興味をもって研究しています。特に、以下の三つの研究テーマに最近は興味をもっています。
- Safe RL: 安全性に関する理論的保証のある強化学習アルゴリズムの設計
- RL × NLP:言語モデルのアライメントなど、強化学習と自然言語処理(NLP)の融合
- RLによる敵対的検証: 強化学習を用いてAIシステムの安全性を検証する方法の開発
論文・特許などの研究業績につきましては、英語ページ を御覧ください。
共同研究やインターンシップに興味のある方はメールにてご連絡ください。
経歴
- 2023 - present: Chief Research Scientist, LINEヤフー株式会社
- 2022 - 2023: Senior Research Scientist, LINE株式会社
- 2018 - 2022: Research Scientist, IBM東京基礎研究所
- 2021: 博士(情報工学)筑波大学(指導教員:佐久間淳 教授)
- 2018: 修士(航空宇宙工学)東京大学(指導教員:中須賀真一 教授)
- 2016: 学士(航空宇宙工学)東京大学(指導教員:中須賀真一 教授)
その他
受賞
- Top Reviewer, NeurIPS, 2024
- 工学系研究科長賞(副代表), 東京大学, 2018
- 最優秀学生論文賞, Joint Conference: 31st ISTS, 26th ISSFD, and 8th NSAT, 2017
- 最優秀学生論文賞, IFAC Symposium on Automatic Control in Aerospace (ACA), 2016, [link]
講演
- NLPコロキウム "Stepwise Alignment for Constrained Language Model Policy Optimization"
[webpage] - 大阪大学 数理・データ科学教育研究センター AI・データ利活用研究会 「安全性を考慮した強化学習:基礎から応用まで」
[webpage] - 鉄鋼協会 計測・制御・システム工学部会シンポジウム 「解釈性・信頼性の高いAI開発に向けたシステム技術」
[webpage] - 人工知能学会主催 第90回人工知能セミナー (2024.3.26) 「AIトレンド・トップカンファレンス報告会(NeurIPS2023):世界最先端のAI研究開発動向が1日でわかる!」
[webpage] [YouTube(学会概要と参加報告)] [YouTube(受賞論文「DPO」徹底解説)] - NeurIPS 2023 論文読み会
[Presentation Slide] - Safe Reinforcement Learning, Cohere Guest Speaker Session, February, 2024
[Cohere Website] [Presentation Slide]