OMRON

OMRON SINIC X Corporation | Japan

AI・機械学習分野の世界トップレベルの国際会議「NeurIPS 2025」で最新の研究成果を発表

オムロン サイニックエックス株式会社(本社:東京都文京区、代表取締役社長:諏訪正樹、以下 OSX)は、「The Thirty-Ninth Annual Conference on Neural Information Processing Systems (NeurIPS 2025)」にて、最新の研究成果を発表します。

「NeurIPS 2025」は、機械学習・人工知能(AI)分野において世界最大かつ最も影響力のあるトップカンファレンスの一つです。2025年は21,575件の投稿の中から、5,290件(約24.52%)の論文が採択され、12月2日から12月7日(現地時間)にかけて米国 サンディエゴで開催されます。

OSXより発表する研究論文は、次の2件です。なお、1件目の論文は、採択された論文の中でも特に注目度が高く優れた研究に与えられるSpotlightとして採択されています。

NeurIPS 2025での採択内容

■ 1) Provably Efficient RL under Episode-Wise Safety in Constrained MDPs with Linear Function Approximation
(日本語訳:線形関数近似を用いた制約付きMDPにおける、エピソード単位の安全性の下で理論的に効率保証された強化学習)

Toshinori Kitamura (OSX), Arnob Ghosh (New Jersey Institute of Technology), Tadashi Kozuno (OSX), Wataru Kumagai (OSX), Kazumi Kasaura (OSX), Kenta Hoshino (Kyoto University), Yohei Hosoe (Kyoto University), Yutaka Matsuo (The University of Tokyo)

制約付きMDP(Constrained Markov Decision Process)は、安全性を考慮した強化学習問題の定式化として広く用いられています。本研究では、各エピソードにおいて制約違反を生じさせない強化学習アルゴリズムを提案します。
既存手法の多くは、エピソードを多数繰り返した際の平均的な制約満足性を保証するのみであり、個々のエピソードでは制約違反が発生する場合がありました。そのような手法は実環境での利用には危険であり、実用的ではありません。

https://arxiv.org/abs/2502.10138

  

2) Self Iterative Label Refinement via Robust Unlabeled Learning
(日本語訳:ロバストラベルなし学習を用いた自己ラベル改善)

Hikaru Asano (OSX), Tadashi Kozuno (OSX), Yukino Baba (The University of Tokyo)

大規模言語モデル(LLM)の学習においては、近年、学習データそのものをLLMに生成させる手法が増えています。しかし、LLMが十分な知識を持たない領域に関しては、生成データに不正確な情報が含まれる可能性があり、そのようなデータを用いて学習するとモデル性能が低下するおそれがあります。そこで本研究では、この問題を回避するために、ラベルなし学習を活用した新たな手法を提案しました。

https://arxiv.org/abs/2502.12565

  

※所属は、論文執筆時点のものです。現時点では、情報が異なる場合がありますので、あらかじめご了承いただくとともに、ご注意をお願いいたします。
 



技術に関するご相談・OSXに関するご質問など、お気軽に下記よりお問い合わせください。
お問い合わせはこちら

share
home
ページ
上部へ