寝ながらでも、ジョギングしながらでも文章が書ける
生産性アップの鬼、野口悠紀雄はなぜ今「音声入力」に着目するのか
2016/5/20
早稲田大学大学院ファイナンス総合研究所顧問の野口悠紀雄氏は、日本を代表する構造改革派の経済学者だ。
一方、1993年に刊行しベストセラーになった『「超」整理法』など、一般ビジネスマンの役に立つ仕事術の本を多数発表してきた、いわば「生産性アップの鬼」である。
そんな野口氏が次に着目したのは、スマートフォンの音声入力だ。iPhoneのSiriや、Androidに「OK Google」と語りかけるCMが有名だが、野口氏は「音声入力は文章を書く方法を劇的に変える」という。今月20日には「1冊まるまる話して書いた」という本『話すだけで書ける究極の文章法』を発刊した。
そこで今回、野口氏に、音声入力によって変わる仕事スタイルと、その具体的方法について聞いた。
「話して書く」試行錯誤の歴史
──スマートフォン音声入力に着目したきっかけとは。
野口:スマートフォンに音声認識の入力機能があることは前から知っていました。ただ、単語だけではなく、長い文章もかなり正確に読み込めることを知ったのは最近です。
私は昔から仕事の生産性を向上させたいと願っており、音声入力で原稿を書くことに挑戦してきました。しかし、新しい道具に飛び付いては、失望を繰り返していました。
たとえば、ポータブルのテープレコーダーが発売されたときは、「いつでもアイデアが吹き込める」と思ったものです。しかしレコーダーに録音しても、もう一度最初から聞き返す必要があり、手書きのメモよりかえって手間がかかるとわかりました。
また、PCが普及してからは、IBMが発売した音声入力ソフトもトライしました。しかしこれも、自分の声を認識させる必要があり、面倒。しかも、性能が悪い。そのため私は、音声入力で原稿を書くのは無理だろうと考えていました。
しかし、スマートフォンの音声入力は違ったのです。
音声入力には人工知能の技術が使われていますが、その発展により、パターン認識の精度が上がりました。これにより、教育しなくてもすぐに自分の声を認識し、正確にテキストにしてくれるようになりました。諦めかけていた「話して書く」スタイルが現実になり、私にとっては革命的な変化でした。
【iPhoneの音声入力で原稿を書く様子】
文章を書くためにジョギングする
──音声入力を使うことで、文章を書くスタイルはどのように変わりましたか。
これまで文章を書くときは、最初にしっかりと構成を考えて、それに沿って調べものをしながら、少しずつ文章を紡いでいくというスタイルでした。
しかし音声入力を使うことで、まずは断片的なアイデアをアウトプットし、それを並び替える方法に変わりました。
一度アイデアを出してしまえば、それを並び替えたり足りない要素を付け加えたりするのは簡単です。音声入力によって、文章を書く最初のハードルが下がったといえます。
メモの仕方も変わりました。
これまで私は、常にメモ帳とペンが手放せませんでした。思いついたことがあれば、すぐにメモをしてきました。しかし、そのメモがどこかにいってしまい、情報を生かしきれていませんでした。
ところが、Googleドキュメントを開いて音声入力でメモすれば、紛失することはありません。そこで、ちょっとしたアイデアを思いついたときや、本や新聞を読んで気になる情報を見かけたときは、音声入力でどんどんメモするようになりました。
今では散歩をしたり家の中を歩いたりしながら、音声入力で原稿を書いています。机に向かうのは、それを編集するときだけです。肉体的に疲れているときでも、頭が回っていますから、寝転がりながら仕事を進められます。これにより、可処分時間が大幅に増え、仕事が楽になりました。
また、私はジョギングが習慣なのですが、1時間ジョギングをすれば、3000〜4000字ぐらいの原稿は書けてしまいます。体を動かすとアイデアは出やすいですから。ですから、今ではむしろ仕事を進めるために、ジョギングをするようになりました。昔は、ジョギングは仕事の息抜きでしたが、今では仕事そのものになったといってよい。
知り合いの編集者は、打ち合わせをした帰りの電車で、話した内容を音声入力でメモにし、そのまま相手に送ってしまうのだそうです。最近のスマートフォンはノイズキャンセリング機能が優れているので、電車の中でも言葉をきちんと認識してくれます。
もっとも、「人前でスマートフォンに向かって話すのが恥ずかしい」という人は多いでしょう。ある程度は慣れの問題ですが。
今や机の前でなくてもできる仕事は、どんどん広がっているのです。ただし、自動車を運転しているときはやらないほうがよいと思います。集中力が切れて危ないですから。
天才並みの「集中」が可能に
音声入力によって一度原稿ができてしまえば、それを編集することは簡単です。白紙の状態から何かを書こうとする場合と、もともとある文章を直す場合とでは、前者の方が圧倒的にエネルギーがかかります。集中しきれずに、つい別のことをしてしまう経験を持つ人も多いでしょう。
なぜかといえば、人間はもともとそういう脳の構造をしているからです。原始時代の人間は、常に外敵にさらされており、外部刺激に気を配る必要がありました。一つのことだけを考え続けていると、敵に襲われてしまう危険があるからです。つまり、集中することは、人間にとって不自然な行為なのです。
ニュートンやアインシュタインのように、寝ても覚めても一つのことに集中し、科学的な偉業を果たした人々もいました。こうした天才たちは、常人離れした集中力を持っていましたが、多くの人間にとって「何もないところで集中し続ける」のは難しい。
ただし普通の人間でも、考える「対象」を目で見ていれば、集中することができます。音声入力を使えば、普通の人でも天才並みの集中力を持つことを可能にしてくれます。
ちなみに入力の際は、Googleドキュメントを使うことをおすすめします。スマートフォンで入力した内容がリアルタイムでほかの端末にも同期されるため、編集が容易です。
たとえば、iPhoneを使ってGoogleドキュメントに音声入力をしていきます。すると、iPadやPCで開いたGoogleドキュメントにも、リアルタイムで内容が同期されます。一覧性や細かい操作はiPadやPCのほうが優れていますから、気になる点があれば、すぐに編集することができます。
これによって私は、紙で原稿を編集する頻度が減りました。きちんとした原稿の場合、最終的に紙に打ち出して編集していますが、iPadやPCで編集した段階で、かなりの精度の文章ができあがります。
【スマートフォンで入力した内容は、Googleドキュメントを使えば、リアルタイムにほかの端末に同期される】
──著書では、「スマートフォンに慣れていない人こそ、音声入力を使うべきだ」と述べています。
そうです。私はもともとタイプライターに親しんでいたため、PCが普及し始めた当初から、キーボードで文字を打つことに抵抗がありませんでした。
そのため、スマートフォンが登場したときも、フリック入力よりもキーボードのほうが早いと考え、フリック入力は習得しませんでした。いわば、仕事のスタイルが変えられなかったのです。
一方、若い人の中には、キーボードよりもフリック入力のほうが早い人も多い。いわば私は、一世代前の技術に慣れていたため、スマートフォン時代には取り残されてしまったのです。
一世代前の技術に親しんだ人を、いきなり新たな技術を身につけた人が追い抜くことを「リープフロッグ現象」といいます。
ただし今では、音声入力を使うことで、フリック入力よりも早く文章を書くことができます。もし私がフリック入力に慣れ親しんでいれば、音声入力は面倒と考え、その価値を過小評価していたかもしれません。ここでもリープフロッグ現象が起きています。
そして、音声入力の恩恵をもっとも受けるのは高齢者です。
多くの高齢者は、フリック入力はもちろん、キーボード入力も得意ではありません。しかし音声入力はスマートフォンに話しかけるだけですから、誰でもできます。先入観がない分、若い人よりも早く習得するかもしれません。生産性において、若い人が高齢者に負ける可能性は十分にあります。
問題はむしろ人間にある
──野口さんの著書を読み、私も実際に音声入力で原稿を書くことを試みました。その中でいくつか課題も見えてきました。一番実感したのは、「案外、書く内容がスラスラと思い浮かばない」ということです。
その通りです。文章を書くことが簡単になり、「むしろ問題は、正確に話せない人間にある」ことが明るみに出ました。実際にスマートフォンに向かって話そうと思うと、言葉が出てこない。よどみなく話すことが、いかに難しいかがわかります。
実は人間は、頭の中でアイデアを考えても、それが相互に矛盾していることも多い。だからこそ音声入力で文字にすることにより、頭の中を「見える化」することが重要なのです。いわば、「頭の中をCTスキャンする」イメージでしょうか。
この方法は、長いメッセージを論理的に話すための訓練にもなります。多くの人は、140〜150字程度の意見ならあまり準備しなくても話すことができます。ちょうどツイッターの1投稿ぐらいですから。しかしそれ以上の長さになると、論理的に話せる人はまれです。
音声入力で何千字もある原稿を書くには、頭の中で長い文章を論理立てる必要がある。すると、副産物的に論理的に長く話す練習にもなる。これは多くのビジネスマンにとって必要な素養です。
たとえば上司から「今の組織の課題は」と聞かれることも多いでしょう。そのとき、140字程度の思いつきを話すのと、長い内容を論理的に話すのとでは、上司の評価も変わってきます。
会議でプレゼンテーションするときも、事前に発言内容を音声入力で文字にすることをおすすめします。そうすることで、どこが冗長で、どこがダブっているかがはっきりとわかります。
──また、ツール自体の問題として、音声入力の精度も発展途上だと感じました。
だいぶ使えるようになっているとはいえ、もちろんまだ完璧とはいえません。
私が使っているのはiPhoneとAndroidスマートフォンですが、iPhoneとAndroidには一長一短があります。iPhoneは「丸」「点」「改行」と言えば句読点や改行処理を行ってくれる代わりに、固有名詞をはじめとする名詞の理解は弱い。「野口悠紀雄」という私の名前も認識してくれません。
一方Androidは、単語レベルではiPhoneより精度が高い。つまり、検索には向いている。しかし句読点や改行はまったく反応しないうえに、長文は少し精度が落ちます。
両者に共通する課題として、音声入力モードが1分以上は継続しない点も挙げられます。長い文章を書くときに、いちいちスイッチを押さなければならないのは面倒。本来なら音声入力をつけっぱなしにして、長く話し続けられるようにしたいのですが。
音声入力機能はまだまだ発展途上ですから、今後、性能が劇的に向上すると思います。ツールごとの使い分け方法も本書に書いてありますから、ぜひ読んでみてください。
──NewsPicksの読者は「フリック入力派」が多いと思います。何かメッセージはありますか。
音声入力でのインプットのハードルが下がれば、自分の考えを論理的によどみなく言えるようになります。現代社会はアイデアに対する価値が高まっていますから、この能力はすべての現代人に不可欠です。
「フリック入力が得意だからそんなことはしなくてもいい」と考える人もいるかもしれません。ただ、あなたはその時点ですでに古い人間になりつつあります。後ろからやってくるフロッグに追い越されないよう、まずは一度トライして、音声入力の便利さを体験してみてください。