PEOPLENICTで働く人たち #5
音声研究における世界の強豪に並び、
VoiceTraで先端技術をリードしたい。

ホーム/岡本拓磨|PEOPLE

岡本 拓磨OKAMOTO Takuma先進的音声翻訳研究開発推進センター(ASTREC)
先進的音声技術研究室 主任研究員

東北大学大学院博士後期課程修了。東北大学大学院工学研究科COEフェローなどを経て、2012年よりNICTへ入所。多感覚評価研究室及び音声コミュニケーション研究室などに携わる。2016年より先進的音声技術研究室に在籍、2020年より現職。

岡本拓磨‗顔写真

音の研究に夢中になり、NICTへ。ここでは自由な研究ができることが魅力です。

子供の頃は、自転車を解体しては組み立ててしまうくらい機械が好きでした。大学ではロボットの研究をしたいと希望したのですが入れる枠がありませんでした。そして機械と同じくらいオーディオにも興味があったので、音の研究ができる研究室を探して入りました。入った当初は試しに1年やってみようという気持ちだったのですが、気がついたら数学と物理でよい音を作り出せる研究が面白いと思い、現在に至ります。
NICTに入る前は大学で「超臨場感」と呼ばれる3次元音場の収録や制御に関する研究を行っていましたが、ちょうどNICTで、自身の分野である立体映像に向けた3次元音響付与の研究者を募集していることを知り、転職を決意しました。NICTでは「超臨場感」を2年間研究し、2014年から「音声」の研究を行うことになったのですが、所属部署の上長から「今までやってきた研究も大切に続けるように」と言ってもらえたことが励みになり、「音声」の最先端の研究でも結果を出せるようになりました。私は参加する学会では必ず「音声」と「超臨場感」、両方の分野の発表を行っています。上長が理解のある方なので、自ら提案して研究の幅を広げることもできています。コミュニケーションで悩むことはありません。NICTは、しっかり頑張れば自身の研究もしっかりと自由にやることができる、ということです。

岡本拓磨‗国際会議ポスター発表1

世界最先端を意識し、バランスを考えながら社会に還元できる研究開発を心がけています。

現在は多言語音声翻訳技術における音声合成の研究開発に従事しています。音声合成とは、入力されたテキストを自然に読み上げる技術で、VoiceTra*1など様々な場面で使われており、音声対話システムにとって重要な技術です。ここでの役割として最も意識していることは、世界最先端技術や研究を行なっていくということです。多言語音声翻訳などの業界は海外の強豪が多く、日進月歩の勢いで最先端の研究や積極的な発表が行われています。トップカンファレンスで発表すると、ニューラルネットの音声合成を作った第一人者などが気軽に質問しに来てくれたりするので、難しい論文を通した甲斐があります。業界自体が盛り上がっており、とても刺激があります。
しかし、社会還元の観点からは、それだけでは不十分と考えています。例えば、音声合成において最先端のニューラルネットモデルで”いい音”が出せるようになれば論文にはできますが、音質が良くても合成時間が遅いとVoiceTra等では使えないので、多少音質を犠牲にしてでも高速に合成できる手法をシステムに組み込むことになります。このプロセスの中で新たな研究が生まれることもあるため、技術を実社会で活かすには「バランス」を考えながら取り組むことが大切です。その上で、世界最先端の研究を行い、研究成果を上げられるよう日々心がけています。

*1: 2010年より実証実験として一般公開している多言語音声翻訳アプリ
岡本拓磨‗国際会議デモ説明

重要なのは「自由+バランス力」。研究に打ち込める環境があるからこそ、それが実現できます。

ミッションのある研究を維持発展する責務はありますので当然頑張るのですが、研究は「自由」な発想が認められるべきだとも思います。それにより新しい価値が生まれると信じています。
研究では情報収集能力、発想力、開発力、論文の執筆能力なども重要なスキルです。また、研究レベルよりもシビアなプログラミング能力も必要です。しかし、いくら論文を書けたとしてもNICTでは社会で使われない技術の研究を続けることはできませんし、システム開発だけできても学術性が滞ってしまいます。NICTではそれらも含めた「バランス力」が大事だと考えています。NICTでは、研究者が成果を上げられるよう、上長が配慮してくれるのでありがたく思っています。こういった環境があるからこそ、研究に打ち込めるのだと思います。NICTには潤沢なリソースや研究設備、事務職員や支援スタッフの手厚いサポートがあります。「この研究計画はちょっと通せないかなー」とか1人でぶつぶつ言いながら悩んでいるとアシスタントの方が「これをこうしたら通せるんじゃない?」と声かけてくれるのです。こんな些細なことがすごく助かっています。
NICTではインターン生も受け入れていて、学生に最先端の研究環境を提供できることも大きな特徴だと思います。

私の研究成果

「音声合成」と「超臨場感」、2足のわらじで新しい研究にチャレンジしたい。

近年、音声合成において、最先端のニューラルネットワーク技術を用いて、自然音声とほぼ同等の音質でリアルタイムに合成を実現できるところまで来ました。今年度*2からは、日本人の話者の声を英語に変換するようなクロスリンガル音声合成の研究開発にも着手しています。また、個人で取得した科研費*3で、超臨場感を実現するための技術として、多数のスピーカを用いて音の聞こえるエリアと聞こえないエリアを形成できる、マルチスポット再生技術の研究開発も進めています。私の強みは音声分野と音響信号処理の両方を行っていることなので、将来それらを融合した新しい研究ができればと思っています。NICTは、情報通信分野でも異なる領域の研究所やセンターが多数あり、他部署との連携や融合もできたら面白いですね。その上で、世界最先端の音声の研究+自身の科研費の研究成果を上げ、「NICTってやっぱりすごい」と他から言われるような研究開発を日々心がけています。

*2: 2020年度

*3: 日本学術振興会が実施する科学研究費助成事業の学術研究助成基金助成金、または科学研究費補助金 
岡本拓磨‗国際会議ポスター発表2

私のオフタイム

ジョギングのイメージ画像

オンでもオフでも飲み会が大好きです。また、大学時代からジョギングを始め、毎日10km走っています。頭をからっぽにして研究等の思考に没頭できます。始めた頃はタイムを出すことがモチベーションでしたが、今は頭一つで考えることができるジョギングが、生活で欠かせないものになっています。休日はたまに家族が電動自転車で一緒に走ってくれるのですが、息子が暴れて大変な時もあります(笑)。

OTHERS

CONTACT

お問い合わせ

採用に関するお問い合わせがございましたら、下記いずれかよりご連絡ください。

総務部人事室人事グループ
/

経営企画部 研究職採用担当

電話
042-327-7304

受付時間:平日8:30~17:00

メールjinji-r@ml.nict.go.jp
窓口〒184-8795
東京都小金井市貫井北町4-2-1
国立研究開発法人情報通信研究機構
NICT採用トップ