ページトップへ
引用元:日本語入力システムATOK 2017 for Windows | ジャストシステム

前編では、ジャストシステムの創業から現在に至るまでの歴史に触れました。さて、後編では日本語入力システムであるATOKに焦点を当ててみます。画期的な「かな変換」に始まり、なんと今ではディープラーニングまで搭載しているその機能について見てみましょう。

高機能な日本語変換に定評

「ATOK(エイトック、Advanced Technology Of Kana-kanji transfer)」は、ジャストシステムが開発しているかな漢字変換ソフトウェア。Microsoftで言えばMS-IMEに当たる存在です。一太郎が発売される前から前身となるソフトが存在していたため、1985年にワープロソフト「一太郎Ver.1」が発売されたときは「ATOK 4」と呼ばれていました。

前編でも述べましたが、DOSと呼ばれる当時のOSに合わせて作ったことや、「スペースキーでかな漢字変換→リターン(Enter)キーで変換候補の確定」という今すでに定着している日本語入力の操作スタイルを考案したことは当時としては画期的なことでした。

また、内蔵する辞書の情報量を強固にすることで、海外メーカーのソフトよりも日本語変換に優位性を持たせ、さらなる好評を得ました。「ATOK 15」からは関西弁などの方言や文語体などへも対応し、様々な層をターゲットにその可能性を広げています。こうした便利さから、Wordを使いながらもATOKを購入して使っているという人も多く、現在では一太郎をしのぐジャストシステムの主力製品になっています。

早くから人工知能を実装

1993年リリースの「ATOK 8」から、人工知能(AI)による変換技術が実装されました。当時はインターネットの普及が進んでいなかったため、手入力で50万もの用例を集めて知識を注入したそうです。

「ATOK 2007」では、それまでのAI変換に、機械学習による統計的な自然言語処理を組み合わせることで、複文節変換時における文節区切り位置や、同音異義語の分類の正確さが向上しました。

ついにディープラーニングを実装

2017年2月には、「ATOK 2017 for Windows」が発売されます。目玉はなんといってもディープラーニングによる学習機能を持った「ATOKディープコアエンジン」を搭載していること。同社にとって、変換エンジンの刷新は10年ぶりのこと。使えば使うほど、日本語変換能力が向上していく強力なツールに進化しています。

これまでのATOKは、「開発者が認識でき、ルール化できた情報」に基づいて開発されていました。つまり、登場したばかりの新語や外来語には、ほとんど対応できなかったのです。しかし、ディープラーニングはこうした課題を解決してくれます。「開発者が認識できず、ルール化できない日本語の特徴」を分析的に取り入れてくれるからです。

開発に当たっては、正確性を伝える文章や、気持ちを伝える話し言葉など、大量の日本語テキストをディープラーニング技術を用いて分析。コンピューター自らが学習し、自動的に日本語における特徴を抽出。長年培ってきたアルゴリズムと組み合わせたとのこと。

例えば、ATOKはこれまで「へんしん」と入力した際には、「変身」ではなく「返信」をあえて第1候補にしていました。それを「ATOK 2017」では、文脈を判断して適当な単語へと変換してくれます。同社の調査によれば、誤変換は30%も減少しているそうです。

同時に、日本語特有の文節区切りの難しさも、学習によって誤変換が減少しているとのこと。例えば、「さとうさんとしのださん」と入力したとき、これまでは「佐藤三都市の打算」と誤変換されることが多々ありました。これが「佐藤さんと篠田さん」と適切な区切りをしてくれるようになっています。

今回発表のWindows版に加え、今後はメモリや速度面を考慮しながら、Mac版やAndroid版への実装も予定。

インターネットやSNSの発達によって情報量が爆発的に拡大し、現代の日本語は急速に変化しています。この多様化する現代日本語に対応できるツールとして、新しいATOKは要注目です。

こちらもチェック

今やディープラーニング搭載のATOK、その30年の歩み(前編)