ページトップへ
合成音声というのは、以前から利用されはじめている技術だ。それが、ここへ来てそのレベルが格段に上昇し、ラジオなどでも人の代わりにAIを利用しているという。合成音声がアナウンサーとして活躍する時代もいよいよ近づいているのではないだろうか。


ニュース、交通情報、天気、防災はAIにおまかせ

コミュニティFMでは、通常のラジオ局と違って放送エリアも限られている。そのため、広告収入も限定的であり、24時間体制でアナウンサーを配備しニュースや交通情報を読むというのは極めて難しい。特に、深夜帯の放送内容は限られたものにならざるを得ない傾向にある。しかし、これをテキストからの合成音声が代行できるようなれば、深夜でも最新のニュースや天気予報、交通情報や防災情報を即時に放送することが可能となるだろう。また、そもそものコミュニティFMの役割を存分に発揮することができる。こうしたことから、実際に国内のコミュニティFMでは合成音声による放送がスタートしているのだ。

エフエム和歌山ではアマゾンの音声合成技術を利用

「Banana FM」の名称で知られるエフエム和歌山では、Amazon Web ServicesのAIサービスである「Amazon Polly」を本格活用し始めた。具体的には、2017年7月から主にニュースや天気予報の自動読み上げをスタートさせたのだ。この「Amazon Polly」はクラウド上でテキストを合成音声に変換する。アマゾンの供給するディープラーニングと機械学習を利用した、人間に近いリアルなアナウンス技術がFM放送に活かされているというのだ。

エフエム和歌山では、新聞社などから受け取っている原稿を合成音声での読み上げが可能になるように、独自に開発されたプログラムで句読点などの修正をかけるようにしている。そして、その原稿を「Amazon Polly」が音声変換し番組内で読み上げているそうだ。放送を開始した当初は、完全に人が読み上げるものとは多少違和感があるとの声もあった。しかし、利用していくうちにレベルが改善され、人が読み上げるのと遜色のない領域へと上達が見られる状況になったという。まさに、ディープラーニングの強みである。導入開始以降、ニュースと天気予報をこの「Amazon Polly」による読み上げで放送しており、リスナーからの評判も高まりつつあるのだ。

特定のキャラクターを合成することも可能

今回この合成音声によるニュースと天気予報の読み上げを開始したエフエム和歌山は、前項で紹介した音声合成技術をAIアナウンサーの「ナナコ」と名づけて利用している。合成音声技術は特定のキャラクター音声を合成することも可能であることが考えられ、エフエム和歌山のように明確なAIアナウンサーという位置づけで利用していくことも可能だ。たとえば、有名DJのしゃべり方をまねするといったキャラクター付けも今後できるだろう。また、リスナーからのメールやツイートに対して的確に反応するのは、人工知能のなかでも合成音声よりはチャットボットの機能に近くなる。これに関してはさらなるレベルアップが必要となるが、この先十分に利用できるものへと進化すると期待していいだろう。すでに、AIスピーカーでは合成音声の主に対するユーザーの好意度が高まるといった現象も現れているようだ。AIを利用したDJが大きな人気を博する時代もそう遠くはなさそうである。

既存のFM・AMラジオ放送も、昨今のリスナーの減少はそれに伴う広告収入の減少などからコストの削減を余儀なくされるケースが増えているという。AIアナウンサーを利用することで、これまでにないような番組制作や編成も可能になることから、今後さらに多角的な利用が始まることが考えられる。もっとも、人とネット接続機器などのコミュニケーションインターフェースに、人工知能を利用したAIの合成音声が多用されることになれば、人と合成音声の親和性が高まる社会が生まれるのはそう不思議なことではない。ラジオ放送も人のパーソナリティから、AIのパーソナリティが主流になる時代が訪れると、十分に考えられるまでにさしかかっているのだ。

<参考・参照元>
人工知能 ナナコの放送が始まりました|Banana FM 87.7MHz
 ニュース解説 - Amazon PollyでAIアナウンサー、AWS機械学習がじわり浸透|ITpro