大学院生が研究ネタを見つける4つの方法(具体例付き)

今年3月に博士号取得予定です。

学部4年生のころから、ずっと同じ研究室に所属し続けたおかげか、自分の研究に加え、後輩との共同研究もたくさん行うことが出来ました。その結果、博士論文提出時のジャーナル・国際会議・国内会議の論文数をすべて合計すると、主著が27本、共著は59本もあります。質の面はまだまだ精進が足りませんが、数の面だけは、自慢できるほどあるかなあと思っています。

今日は、そんな私がこれまでの経験で得た、大学院生が研究ネタを見つけるための、4つの方法を紹介したいと思います。

方法1:アプリから考える方法

まずアプリケーションやタスクを考え、それを実現するためにいろいろがんばる、というやり方です。
アプリやタスクを考える上で大事なのは、以下の2点です。

  • そのアプリができたらうれしいのか。(有益性、usefulness)
  • そのアプリは技術的に実現できるのか。(実現可能性、feasibility)

「有益性」の高いアプリを見つける能力は、あまり経験に依存しません。個人差はあるとは思いますが、学部4年生でも、博士をとった人でも、大きな差はないと思います。この意味で、研究初心者でも、いきなり素晴らしい研究が実現できる可能性を秘めています。ただし当たり前ですが、そのアプリに新規性があるかどうかのサーベイだけは、いくら初心者であろうと、きちんとやる必要があります。

もう一方の、アプリに「実現可能性」があるかどうか見極める能力ですが、これははっきりと経験が物を言います。また学術的には、「ギリギリ feasible」(簡単には実現できないけど最先端の技術を使うとどうにか実現可能なアプリ)が評価されやすい傾向にあります。簡単に実現可能なアプリは、そもそも研究対象にならないので・・・個人的には、「ギリギリ feasible」でなく簡単に feasible で、かつ useful なアプリはとっても素敵だと思うのですが、それはまた別の話。

こういった背景から、研究初心者の人の可能な研究ネタ探しアプローチの一つとして、とにかく沢山新規性があって useful なアプリを考え、それを指導教員や先輩に「ギリギリ feasible」があるかどうか相談してみる、といったことが出来ると思います。

私の身の回りで、アプリから考える研究が成功した例としては、研究室の先輩の研究になりますが、「手の動きからの音声合成」に関する研究があります。福祉の応用で、健常者が口を動かして話すように、構音障がい者の方も手を動かして話せるようなアプリを実現した研究です。Usefulness の方はそういったアプリを求めていらっしゃる障がい者の方がいらっしゃるという点で、最初からクリアしていました。ギリギリ feasibility の方は、基礎技術としては声質変換で用いられている技術をそのまま転用出来そうな点で feasible だが、どういった手の動きをどの声に割り当てればよいのか、声の高さはどう制御するのか、などといった問題も沢山ありそうだぞ、とういうことでギリギリ feasiblity もクリアしています。結果この先輩は、この研究を続けて博士号までとっておられます。私はほとんどこの研究に絡んでいなかったのですが、途中少しだけお手伝いをさせていただいたことがあり、こっそり第三著者にいれてもらった論文があったりします(http://www.gavo.t.u-tokyo.ac.jp/~mine/paper/PDF/2008/SP2008-78_p45-50_t2008-11.pdf)。

方法2:既存の有望そうな技術を、別の応用に適用する方法

この方法で研究をはじめる場合、以下の点を考えることになります。

  • どの既存技術が有望そうか?
  • どんな応用ならば、その手法が useful になるか?

まず、既存の有望そうな技術を見つける必要がありますが、これに関してはトップカンファレンスに参加するなどして、情報を仕入れてくる必要があります。有望そうな技術を見極める能力は、経験を重ねるしか無いので、初心者にはなかなか難しいかもしれません。一段メタな研究、私の専門の音声工学でいえば機械学習のトップカンファレンスで発表されている技術なども、調べる必要があるかもしれません。

別の切り口として、研究室の先生・先輩が研究している技術を別の応用に適用する、ということも出来ます。先生・先輩は、自分が有望と思うからその技術を研究しているわけですし、さらに実装を貰うこともできますしサポートもしてもらえますし、いいことづくめです。ただ、これをやりすぎると、研究室全体としての diversity が失われますので、ほどほどにしておく必要がありますが・・・

使う技術を決めたら、既に feasible であることは明白なので、それをどんな応用に用いたら useful かを考えます。まず一番簡単なのは、技術はそのままデータベースだけを変更する、というものです。音声工学でいえば、英語データベースでやっていたものを日本語データベースでもやってみるなどといった感じです。例えば、私は修士論文の頃に音声の構造的表象を用いた日本人英語の発音評価(http://www.gavo.t.u-tokyo.ac.jp/~mine/paper/PDF/2011/IPSJ-JNL_v52_n5_p1899-1909_t2011-5.pdf)をやっていたのですが、この技術を、中国人留学生が日本人中国語の発音評価に適用する研究をしてくれました(http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=6424270)。技術的な新規性はそれほど高くはありませんが、研究を進めるうちに技術を工夫すべき点も見えてきていろいろ技術の改良もできましたし、またデータベースの構築そのものにも、学術的価値があると思います。

また別のやり方として、技術をまったく別の応用分野に適用する、ということもできると思います。私の最近の研究で、雑音に頑健な音声認識を実現するために【雑音ののった音声→クリーンな音声】を行う技術を提案したのですが、この技術自体は、任意のパラレルな特徴量の変換を実現することができます。そこで研究室の後輩を中心に、私は共同研究者として、いくつか別応用の研究を行なっています。【電話帯域の音声→高帯域の音声】や【Aさんの音声→Bさんの音声】に適用した研究は、次の3月の音響学会にて発表予定です。

方法3:既存の有望そうな技術を、さらに改良する方法

先の方法に似ていますが、今度は応用を変えるのではなく、改良して精度を向上させることを狙うものです。

簡単には、有望そうな手法を組み合わせる、ということが考えられます。例えば後輩との共同研究で、雑音抑圧手法としてよく知られている SPLICE に、声質変換技術でよく用いられる eigenvoice conversion に関する技術を導入した、eigen-SPLICE を提案しました(http://www.gavo.t.u-tokyo.ac.jp/~mine/paper/PDF/2012/ICASSP_p4289-4292_t2012-3.pdf)。その後輩が、この研究に関する発表で音響学会で学生賞を受賞したりもしましたので、想い出深い研究の一つです。

手法を組み合わせるだけでなく、独自の工夫を加えてもよいと思います。これには、どのような工夫を行えば精度があがりそうなのか、を見抜く力が必要になります。この能力は、音声工学でいえば、音声の一般的な性質に関する理解、それぞれの機械学習手法に関する理解などを深めていくことで、力がついていくと思います。経験と、センスと、様々なものが問われます。

ちなみにですが、これまで誰もやっていなかったような新技術が提案できれば、それに越したことはないです。例えば私の指導教員である峯松先生の音声の構造的表象(http://www.gavo.t.u-tokyo.ac.jp/~mine/paper/PDF/2004/ICASSP_p585-588_t2004-5.pdf)は、誰もやっていない新技術でした。ただし、音声工学は、音声に関する様々な学問に関する知見をルール化したり機械学習技術に載せて実装していく、という面が強いですので、まったく新しい技術を使う必要性は、かなり低めだと思っています。もちろん他の分野であれば、新技術の提案が、最も重要になることもあるかと思います。しかし残念ながら、私はまだ新技術を効率的に見つけていく力を身につけていないので、ここではこれ以上深入りしません。

方法4:研究所にインターンに行く

研究ネタを考える方法ではないですが、研究ネタを見つける方法としては、非常に効率的です。

他力本願にはなってしまいますが、研究所インターンに行けば、受け入れ側の方が、企業としてのニーズがあってかつそれなりに短期間で成果が出そうな研究テーマを与えてくれます。こんなチャンス、学生にしかありません!私は、NTT CS研と、IBM Research - Tokyo(×2)でインターンさせて頂く機会に恵まれました。

NTT CS 研のインターンでは、SPLICE に関する研究テーマを頂きました。インターンが終わった後も、メールベースでご指導を頂け、研究の成果は http://www.gavo.t.u-tokyo.ac.jp/~mine/paper/PDF/2012/ICASSP_p4109-4112_t2012-3.pdf で発表し、ICASSP の学生賞まで頂けました。

IBM Research - Tokyo のインターンでは、音声の構造的表象を用いた大語彙音声認識に関する研究テーマを頂き、研究を行いました(http://www.gavo.t.u-tokyo.ac.jp/~mine/paper/PDF/2012/INTERSPEECH_876_t2012-9.pdf)。二回にわたってインターンをさせていただき、一回目の成果は音響学会の学生賞を、二回目の成果は粟屋賞まで頂いてしまいました。(さらにインターンとは直接関係ないですが、来年からは IBM Research - Tokyo に就職することになりました。)

またインターンは、研究テーマを頂くだけでなく、研究の進め方も参考になることばかりでした。インターンに行く前までは、研究は論理的であることが一番大事!としか思っていませんでしたが、論理的であることに加え、一貫性(consistency)が実は非常に重要である、ということを、実感として学ぶことができました。また、おこがましい話ですが、後輩を指導するときに、どのような研究テーマを与えるべきか、またどういった点に気をつけて指導するべきか、といった視点を得ることもできました。

うれしいことだらけのインターンですので、研究室の後輩にもインターンに行くようおすすめしています。実際に私の後輩も NTT CS 研や NICT などのインターンに参加させていただいており、よい研究成果をたくさんあげている最中です。

まとめ

以上、大学院性が研究ネタを見つけるための4つの方法を紹介しました。

学部4年生や修士1年生の人は、方法1で研究ネタを見つけるか、研究室の先生や先輩から方法2や方法3で見つけた研究ネタを貰う、というのが主になると思います。研究に慣れてきた先輩側の人は、方法2や方法3で研究ネタを見つけて自分研究したり、また見つけた研究ネタで後輩と共同研究するのもよいと思います。また、将来博士にいったり、研究者になったりしてみたいな〜なんて思っている人には、方法4がものすごくオススメです。

よく聞く話ではありますが、研究は、ほとんど研究ネタを決めた時点で勝負が決まっています。良い研究ネタを見つけて、ハッピー院生ライフを送りましょう!研究楽しいよ。