统计解析の手法に関する研究を続けて
―数理统计学を用いたモデル选択?予测―
(大学院先进理工系科学研究科)
伊森 晋平 先生
専门分野:数理统计学
経歴:
2014年 08月~2018年 01月 大阪大学基礎工学研究科助教
2017年 05月~2018年 01月 理化学研究所革新知能統合研究センター客員研究員
2018年 01月~2020年 03月 広島大学学術院 助教 (大学院理学研究科)
2018年 04月~現在 理化学研究所革新知能統合研究センター客員研究員
2020年 04月?現在 広島大学学術院 准教授 (大学院先进理工系科学研究科)
数理统计学とは
私は「数理统计学」という分野を専门としています。「统计学」は多くの分野でデータ解析の手法として用いられており、データからモデルを构筑し、事象のメカニズムを明らかにしようとする学问です。さらに「数理」がつくと、数学的な観点から明らかにするという要素が入ります。すなわち、统计学の中で用いられる解析手法の数学的な性质、理论や定理の导出?解析を行っています。「数理统计学」の一例として、私がこれまでしてきた研究の中で、モデル选択についてご绍介いたします。モデル选択とは、复数の候补モデルから「良いモデル」を选択することが目的の分野であり、どのような基準でそのモデルを选んだかを数学的に示すことができます。
では、具体例を挙げます。人の身长と体重のデータセットが図1のように得られているとします。これを表すモデルとして赤?青?緑の线を考えましょう。モデルというのはあくまで仮説ですので、様々なモデルが考えられます。误差の无いモデルという视点に立つと、すべての点を通った緑线のモデルが最も误差の小さいモデルであると言えます。しかし、身长と体重の関係がこのような曲线で与えられるとは考えにくく、新たにほかのデータ点がプロットされたときの误差がとても大きくなりそうです。それを考虑すると、おそらく青线のモデルが良いモデルであるように思えます。
図1
つまり、モデル选択における基準として様々なものが考えられ、误差はそのひとつでしかなく、必ずしもその基準で「良いモデル」が得られるとは限りません。モデルの良さの基準は研究、解析の目的に依存して异なります。さまざまな目的に応じて复数の候补モデルから「良いモデル」を见つけるのが「モデル选択」という分野の目的です。
あらゆる分野への応用
私の研究は、统计学の手法に関する数学的侧面からのアプローチであり、具体的に特定のデータに対する适用例はほとんどありません。しかし、统计学はデータを取り扱う学问であるため、物理?化学?生物などさまざまな领域との亲和性があり、データを扱う分野でさえあれば、あらゆる研究に応用できます。
その例として、か?ん罹患数に関する统计的な解析か?挙け?られます。か?んにかかった人の数は毎年、调査?集计されています。しかし、死亡してはし?めてわかる罹患数(里に隠された罹患数)を考虑すると、报告された罹患数と真の罹患数には差异か?ある可能性があります。そこて?「里に隠された罹患数」も考虑した解析を行い、モテ?ルを构筑することて?、より正确な罹患数の予测を试みることか?て?きます。
今后取り组むべき问题―新たなデータ构造
今后は、従来の解析手法では解くことのできない问题に取り组んでいきたいと思います。そのうちの一つとして、高次元データに関する问题を考えています。
具体的に、データ构造(図2)の话をします。古典的な统计学の问题设定は、100人に対して2项目(例えば、身长?体重)のデータがある、縦长のデータ构造(図2左)が主流でした。そのようなデータ构造に対して、ここ最近は100人に対して10000项目以上のたくさんの项目についてデータがとられるような横长のデータ构造(高次元データ;図2右)の研究が盛んに行われています。横长のデータを解析する上では、縦长と同じ解析手法を用いることは不可能であったり、妥当性が保証されなかったりします。さらに昨今では、ビッグデータと呼ばれる縦横に大きいデータセットが注目されています。
図2
上记のデータ构造の解析のために、これまでの视点とは异なる新たな解析手法が提唱されてきました。高次元データにおいては、そもそもすべての変数が意味をもつとは限らないため、その中から重要な意味のある変数を取り出すという「変数选択」という分野が盛んに研究されています(これは先述のモデル选択の一种です)。また、この场合は计算量の问题も生じ得ることから、解析の条件に制约を加えるなどの方法が考えられています。また、最近の私の研究では、补助変数を用いた解析を行いました。注目している変数だけでなく、别の変数(补助変数)を解析に加えることで、新たな情报を得ようとする解析手法です。
これから先、さらに新しい未知のデータ构造が现れ、従来の解析手法が通用しないことがあるかもしれません。そのような问题を解决できるような解析手法を考えたいと思っています。
研究者を志したきっかけ
高校生のときから好きな科目は数学でした。しかし、现在専攻している「数理统计学」について、また、数学がどのように细かい分野に分类されるか、知る机会はありませんでした。学部3年生のときに、「确率?统计」の授业で初めて「数理统计学」を知りました。そのころの私は勉强を全くしておらず、あまり真面目な学生ではなかったと思います。ですが、「确率?统计」の授业はよく理解できました。それが理由で、研究室配属のときにはその分野を勉强できる研究室を选びました。
学部4年生のときは就职しようと思って就活をしていました。しかし6月までによい结果が出なかったので、それからは院试勉强に切り替えました。院试勉强で数学を改めて勉强してみて、大学の讲义での内容がよりよく分かってきました。分かってくるとどんどん楽しくなり、数学を仕事にしたいと考え始めました。好きなものを仕事にするのは大事なことだと思っています。そして、修士のときに取り组んだ研究テーマが「モデル选択」でした。修士、博士と研究に取り组んだ成果をよい形にすることができ、今でも研究を続けられているのは、とても幸せなことだと感じています。
広岛大学の外でのキャリア、その経験から感じたこと
博士号を取得する前に助教として採用され、大阪大学の研究室に赴任しました。また、理化学研究所の数理统计学チームでも客员研究员として研究しています。海外の大学との共同研究の机会も与えていただき、主に研究内容についてディスカッションを行いました。その中で、実际に会ってディスカッションをすることの大切さを実感しました。より短时间で言いたいことが伝わりますし、目を见て话すことで机微を感じられるというのが利点です。そのことは日本人同士のディスカッションでも大事だと思います。
海外での生活は苦労しましたが、英语が下手な私の话をゆっくりと闻いてくれたりご饭に连れて行ってくれたり、周りの人のやさしさに助けられました。そのような経験のおかげで、英语でディスカッションを行う上でハードルが下がったと感じています。
その后、広岛大学のテニュアトラック教员に採用して顶き、研究をしています。広岛大学では、よい环境で思い切って研究でき、充実した研究生活を过ごせています。
研究を进める际の心がけ
こつこつ顽张るということを、いつも心がけています。私は要领が悪いと思っています。しかし、気になったことから一つ一つつぶしていくということを意识して、丁寧な研究を目指しています。そのために、常に研究のことについて考えるようにしています。私の経験では、研究のアイデアは移动中に思いつくことが多々あり、出先で思いついたことについて计算してみることもあります。そのことは、大学院生のときから习惯になっています。
また、これから研究者を目指す学生に知っていてほしいのは、顽张っていれば谁かがみてくれているということです。私も以前、他大学の先生から、研究集会で発表しないかと声をかけていただいた経験があります。おそらく、学会発表などを通して私の研究分野を认识してくださっていたのだと思います。そのようなことを心の支えに、また研究を顽张ることができます。
学生へのメッセージ
私は决して优秀ではなく、周囲の人たちに支えられてなんとか今日まで研究を続けてくることができました。先に述べたように、顽张っていればどこかで谁かがみていてくれるので、前向きに研究を続けていくことが肝要だろうと思います。学生时代は雑务もなくひたすら勉强や研究をすることができていたのですが、年齢を重ね、立场や环境が変わり、最近は以前のように集中できる时间が短くなっていると実感しています。学生时代に学んだことは大切な财产になるので、自身の研究分野に囚われず、様々なことに兴味を持ち、たくさん学ぶことを心がけると良いのではないでしょうか。その中で、他大学や海外の人たちとコンタクトをとり、情报交换することもとても役立つと思います。
研究は気をつけないと止まることがなく、生活リズムや体调が崩れがちです。体は资本ですから、しっかりと休憩をとりつつ、フレッシュな头脳でいい研究をしてください。
取材を终えて
数学は全ての理系科目の基础となり、「あらゆることに応用できる」普遍的な学问であると改めて认识しました。また、取材时は僕が质问したことや理解が及んでいないことに対して、先生が数式を书いて简洁に説明していただき、そこに数学の魅力を感じることができました。
先生は院试勉强の际に、数学が好きだという理由で研究者への道を决められ、今では助教としてご活跃されています。研究について常に考え続けられており、本当に数学が好きだという気持ちが感じられました。その好きだという気持ちが进路を考える上では当たり前のことですが、最も重要なことです。僕自身も研究や自分の専门が本当に好きなのか改めて考えたいと思いました。
取材担当:福原大輝 (広島大学 理学研究科 博士課程前期2年)

Home
