日本語とスワイプ入力

今、アルファベット圏を中心にソフトウェアキーボードを一筆書きでなぞって入力するスワイプ入力という入力方法が普及してきています。このスワイプ入力については以下の2つ記事で詳しく取り上げられていますので、ぜひご覧下さい。

スマホの最も生産的な入力方法はフリックではなく「ひと筆書き」だ

スマホの入力でも日本はガラパゴス、世界は《ひと筆書き》入力が主流だ


スワイプ入力という技術革新

まず、スワイプ入力で英語入力した場合の本気の速さを次の動画でご覧下さい。(20秒くらいから)



片手の親指だけで、とんでもない速さで入力していることが見て取れると思います。
日本でもフリック入力が速い人がいますが、英語と日本語とで直接比較は難しいものの、これほどの高速入力はできないのではないでしょうか?

またスワイプ入力は、単語ごとにスクリーンをなぞって入力する方法なので、画面にタッチする回数が少なく、指の負担も軽減されます。そのため速く入力しようと頑張らなくても十分に速さを保ちながら楽に入力できそうです。

ところが、このスワイプ入力の日本語対応版が数年前に1度投入されましたがすでに撤退し、その後、マイクロソフトやGoogle他、複数の企業が多くの言語圏にスワイプ入力を投入するようになりましたが、各社とも日本語には対応していません。

世界的にスワイプ入力が普及する中で、日本語は事実上スワイプ入力非対応言語になってしまっています。

なぜ日本にはスワイプ入力が投入されなくなったのか、ということについては、もしかしたら「日本では既にフリック入力が主流になっているので、スワイプ入力を投入しても支持されないだろう」という企業判断によってかもしれません。しかしこれだけ各社揃って日本語版を出さないのには、何か日本語の特性にスワイプ入力には適さない要因があるのではないか、とも考えられます。

そこで日本語とスワイプ入力について考察してみました。


英語でのスワイプ入力

スワイプ入力は、文字数分を何度も画面にタッチして入力していた従来の状態から、複数の文字分を画面をなぞって入力できるようにしたことで、タッチを減らして入力できるようにしたものです。

ただし、なぞる軌道の上にある文字の組み合わせが複数ある場合、確実に意図した単語が入力できるわけではありません。たとえば「TEXT」と入力するつもりでキーボードをなぞっても、指の通り道に「S」があると「TEST」も候補になります。この方法では確実性を担保することは不可能なので、幾つかの候補が候補行に表示されます。

しかし複数の候補があっても、最初に意図した通りの「TEXT」が入力中の行に表示されるのであれば、他の候補を選択し直す必要がありません。スワイプ入力ではソフトウェア的な手法で、高い精度でユーザーが入力を意図した単語が最初に表示されるように工夫されています。




日本語でのスワイプ入力

一方、日本語で同様のスワイプ入力を実現しようとすると、まず漢字変換の問題にぶつかります。たとえばスワイプ入力で「KOUTEI(こうてい)」となぞる場合、指の通り道に「R」もあるので「KOUREI(こうれい)」も認識されます。

平仮名だけなら2択の候補選択で済みますが、漢字変換の候補もあるので「工程・行程・肯定・公邸・・高齢・好例・恒例」と一気に候補が増えてしまうことになります。また素早い操作ではどこをなぞっているかが曖昧になるので「JOUREI(条例)」なども候補に入ることがあります。




このように日本語では漢字変換とスワイプ入力の2重の候補選択が生じるため、アルファベット系の言語に比べてスワイプ入力では不利だと思われます。

また、日本語に漢字変換が必要なのは、漢字に同音異義語が多いためですが、1つの漢字に対するヨミの音も短い(大抵仮名で2文字)ので、漢字語句では発音も僅かな差になるケースが非常に多くなっています。

たとえば子音1文字が違うだけで「KOUJOU(こうじょう)」「SOUJOU(そうじょう)」「NOUJOU(のうじょう)」「TOUJOU(とうじょう)」「HOUJOU(ほうじょう)」「JOUJOU(じょうじょう)」「DOUJOU(どうじょう)」「GOUJOU(ごうじょう)」など、多くの単語が存在することになります。

もちろん2文字の変更を許容すれば、さらに多くの単語が存在することになります。たとえば、上の例でJをHに入れ替えると「KOUHOU(こうほう)」「SOUHOU(そうほう)」「NOUHOU(のうほう)」「TOUHOU(とうほう)」「HOUHOU(ほうほう)」「JOUHOU(じょうほう)」「DOUHOU(どうほう)」「GOUHOU(ごうほう)」となります。

このように日本語では1字違い2字違いの単語が非常に多く存在しています。

そしてスワイプ入力では一筆書きでスクリーンをなぞるので、明確に1つ1つのキーをタッチするのとは異なり、 なぞる軌道の形も捉えて判別していますので、なぞった軌道近くのキーもタイプを意図したキーの候補とみなされる場合があります。

そうすると、QWERTY配列の場合、HとJのキーは隣り合っていますので、「KOUJOU」と「KOUHOU」のどちらも候補として拾いがちになります。QWERTY配列ではこのようなケースが多発します。

もちろん英語の「TEXT」と「TEST」の例のようにどの言語にも同じような問題がありますが、日本語の場合は、まず1字2字違いの語句が多いことでスワイプの軌道から発生する候補が多くなり、さらにそのそれぞれに対して同音異義語の候補が生れる、という2重に不利な面があってスワイプ入力にとってはハードルが高い言語となっていると思われます。

また、スワイプ軌道と漢字変換で2重に候補が発生することで、漢字変換の候補が多いときに、候補表示の順番でも問題がおきます。たとえば、「こうてい」「こうれい」の両方の漢字変換候補を同時に並べる場合、「こうてい」「こうれい」のヨミ順に並べると、

<肯定・校庭・工程・行程・公邸・皇帝・更訂・高低・公定・後庭・黄帝・好例・高齢・恒例・交霊・孝霊・高冷・皇霊・伉儷>

などのようになって、入力したい単語が「恒例」だった場合、そうとう後の方まで候補を探さないと見つかりません。

といって「こうてい」「こうれい」総合の頻度順にすると、肯定・好例・校庭・高齢・工程、などのようヨミの違う単語がランダムに並ぶことになります。また実際には「条例」など他の候補も入るため、目的の漢字を見つけにくくなってしまいます。

これは勝手な憶測ですが、様々な言語にスワイプ入力を対応させている企業では、スワイプ操作による候補発生の割合や、候補選択が行われる割合を、言語ごとに数値化してすでに把握済みなのかもしれません。そしてその数値によってスワイプ入力への適正を判断しているのかもしれないと考えます。


アルテ日本語入力キーボードで取り組んだ「定形スワイプ入力」

しかしもし日本語とスワイプ入力は相性が悪かったとしても、日本語でもキーボードの画面をなぞって複数の文字を入力するという考え方は応用できる可能性があります。

アルテ日本語入力キーボードではそこに着目し、なぞる範囲を増やして日本語ではどこまでタッチを少なく出来るのか、ということに取り組んでみました。その結果、濁点の入力、および、拗音、拗長音、連母音など一定のパターンについてはなぞって入力することを可能にできました。たとえば「授業料」と入力するのは、アルテローマ字入力でもターンフリック入力でも3回の操作で完了します。

この方法ではアルファベット圏のスワイプ入力と異なり、定形パターン以外はなぞり書きできませんが、なぞるパターンと出力される仮名文字が1対1で対応する確実性は担保されています。

英語に代表されるスワイプ入力は「単語全体をなぞることを前提に(候補選出に不確実性があっても)ソフトウェア制御で確実性を高めていく」というアプローチです。

一方、アルテ日本語入力キーボードが取り組んだのは「まず確実性の確保を前提に(全ての語句はなぞれなくても)なぞって入力できる定形範囲を増やしてゆく」というアプローチです。

このように最優先にしていることが違っても、複数回のタッチをなぞる操作に置き換えて速く楽に入力できるようにする、という点では同じコンセプトに基づいていると言えます。

またアルテ日本語入力キーボードのいわば「定形スワイプ」は、漢字語句によく現れるパターンをスワイプで入力できるようにしています。たとえば「KOU・JOU」の下線部は母音が連なる連母音といわれる部分で、定形パターンとしてスワイプできます。「JUGYOURYOU」のような拗音・拗長音も漢字語句で良くあるパターンで定形スワイプの対象となります。欧米型のスワイプにとって候補多発の元となりがちがった漢字語句ですが、定形スワイプでは逆に漢字語句の特徴を活用している形になっています。

定形スワイプと欧米型のスワイプを単純比較することはできませんが、だだ日本語には欧米型のスワイプ入力が適さなくとも、それが行き詰まりを意味するのではなく、日本語独自の伸び代も確かにまだ残されているのだと考えます。


12キーでの「フルスワイプ入力」の可能性

ここまでは、スワイプ入力における日本語の不利な点に関して述べてきました。しかし、QWERTY配列を使うという前提を変えれば話は違ってくるかもしれません。

たとえばアルテローマ字入力で「こうてい」と入力する場合、現状でもKOU(こう)・TEI(てい)は2スワイプで入力できます。その2つのスワイプの間を真ん中の図の赤い線でつなぐ処理が出来れば、「こうてい」の4文字を1スワイプで入力できることになります。この例では、赤い線でつなぐ時にNを通過しますが「こうんてい」という言葉は無いので、他の候補が出力されることなく「こうてい」と入力できることになります。




もちろんアルテローマ字入力に欧米型のスワイプ入力を搭載した場合でも、1つのなぞる軌道から複数の候補が出力される場合があります。しかしスワイプ入力以前の段階でも、清音、濁音、拗音、拗長音、連母音に関しては入力軌道に対応して出力される文字が1対1で対応するため、QWERTY配列をベースにするより格段に複数候補の発生を抑えることができます。

またQWERTY配列ではキーの数が多く密に詰まっているので、なぞる軌道の通り道に近接するキーの文字も、なぞる過程で通過した文字とみなして候補が出力され、かなり多くの候補が発生します。一方12キー配列では個々のキーが大きく、また密に詰まっていないため、”みなし通過” による候補発生が抑えられます。

さらに日本語は分かち書きしないので、英文でも不可能だった短文まるごとスワイプする「フルスワイプ入力」も展望できます。たとえば『京都で下車』という文は、現状のアルテローマ字入力ではKYOU・TO・DE・GE・SYAと5回の部分スワイプで入力できますが、KYOUTODEGESYAと1回のスワイプで入力することは、欧米型のスワイプ技術を組み込むことで実現可能と考えられます。

一方英語では分かち書きになるので、Get off at Kyotoと4回のスワイプです。共にアルファベットで13文字なのは偶然ですが、12キーでの「フルスワイプ入力」の方がさらに高い入力効率に到達できる可能性があります。

* 数年前(2013年)にリリースされた日本語版スワイプキーボード「Swype」でも、スワイプ軌道を学習させれば「京都に下車」を1回のスワイプで入力可能でした。フルスワイプを可能にする技術要素はすで存在しています。

* 12キーをベースとした「フルスワイプ入力」は欧米型スワイプの技術要素が必要なため、まだ試案の段階となっています。



最後に

海外でのスワイプ入力の普及は、いわゆるクリティカルマスを越え、一層の普及と精度向上に向かっています。どこかでその潮流が変わって後退が始まり、従来レベルまで後戻りすることは最早なさそうす。むしろ今よりも高い水準に至ってから、それが社会の標準になってゆくと予想されます。

一方、もし今後も日本語入力に進化が起きず、海外と進歩の歩みを共にできなければ、月日がたっても、フリック入力が苦手な人の割合は今とそう変わらず、フリック入力を習得しても、海外のスワイプ入力より効率が低いまま、ということになりそうです。

そう考えれば、日本語にもスワイプ入力に比肩する入力方法が得られるかどうかは、結構重要な問題かもしれません。

このような話題では、とかく入力方法の良し悪しの論議となりがちですが、ある人にとって入力しやすい入力方法は、その人にとって一番生産性が高いに違いありません。そのため、どの入力方法が良いかということではなく、一人一人が自分に合うと思う入力方法を選択できた上で、その社会での総合的な文字入力の生産性が向上することが重要と考えます。

しかし、こうした観点で各言語圏がもつ入力方法の総合力を比較した場合、日本のガラケー、QWERTY、フリックという選択肢の総合では、スワイプ入力の普及で文字入力の生産性が高まる海外に追いつけない事態となってきています。

スワイプ入力を開発している企業が、経営的な判断で日本語対応を行わないのか、それとも本当に日本語にはスワイプ入力に不向きな特性があって対応が難しいのか、実際のところは分かりませんが、日本語対応のスワイプ入力「Swype」が2013年にリリースされてから、もうすでに5年近くが経とうとしています。その間に、複数の企業が多くの言語圏にスワイプ入力を投入し、英語圏のランキングでもスワイプ入力搭載のキーボードが上位を占めるようになりました。

この趨勢が続けば、日本はタッチインターフェイスを活用した文字入力の生産性で海外に大きく水をあけられるかもしれません。アルテ日本語入力キーボードは、こうした状況への危機感に後押しされて開発しました。

もし今後もQWERTYをベースとした日本語対応のスワイプ入力が投入されなかったとしても、日本語には「定形スワイプ」や12キーをベースとした「フルスワイプ」など、まだ進化の可能性が備わっていると考えます。

従来の入力方法だけでなく、日本語に備わっている伸び代を最大限活かした入力方法が選択肢に加わることには意義があると考えます。そうした選択肢からも選べて、日本語入力の生産性向上に繋がることが重要だと考えています。