機械学習の数理的研究


私たちは、与えられた限られた情報(データ)を記憶するだけでなく、そこから一般性を見つけ出し、与えられていない情報(データ)にも適用できる能力を持っています、その能力が学習能力(正確には学習の汎化性能)であり、単なるメモリから脳や機械学習を画す極めて重要な特性です。

この能力のおかげで、私たちは初めて行く場所でも歩くことができ、初めて合う人とでも話しができます。たとえあなたが、この文章を初めて読んでいるとしても、あなたがすでに文字や文章を読むことを学習しているおかげで、人生で初めて見たこの文を読めてしまうでしょう。

しかし、脳や機械学習が、なぜこのような能力を実現できるのかは学習理論における未解明の最重要問題の一つです。いま見ているこの文字が、以前見たあの文字と同じだと知るには、画像という極めて高次元のデータ空間の中で、画像同士が互いに似ている似ていないという、データ間の距離のようなものを、脳や人工知能が獲得する必要があります。

脳やニューラルネットワークも、極めて複雑で巨大なネットワークであり、数学的には極めて高次元の情報で特徴づけられるため、脳や人工知能の学習とは、極めて高次元のデータ空間の構造を、極めて高次元のシステムに写し込むことだとも考えられます。その仕組みが解明できれば、例えば少数のデータだけから学習を行う、今よりずっと効率的な人工知能が実現できると考えられています。

我々は、このような問題に対して、データとネットワークの高次元性を積極的に活かした数理的なアプローチを試みており、最新の研究では、ある条件下でデータの構造とネットワークの構造を具体的に関係付けることにも成功し、さらなる研究を進めています。

 

寺前 順之介

京都大学 情報学研究科 先端数理科学専攻 非線形物理学講座