象形文字の“Google翻訳”が可能に! グーグルがヒエログリフの解読補助ツールをつくった理由

古代エジプトで使われた象形文字、ヒエログリフ。長い時間を要する解読作業を少しでも効率化するべく、グーグルは機械学習を使った解読補助ツールを開発した。一般向けに、ヒエログリフについて学んだり、メッセージを送れるモードも公開されている。
象形文字の“Google翻訳”が可能に! グーグルがヒエログリフの解読補助ツールをつくった理由
IMAGE BY LIFE PHOTO COLLECTION/GOOGLE

友人が送ってきた絵文字ですら、その意味を読みとることが難しい場合がある。そう考えると、ヒエログリフを解読するエジプト学者たちの苦労は想像に難くない。

なかには、ロゼットストーンのおかげでヒエログリフの謎は解けたと思っている人もいるだろう。だが、古代エジプト語と英語の対訳辞書があるわけではないのだ。

紀元前196年に書かれたロゼッタストーンの文字は、ヒエログリフ解読の重要な鍵となった。PHOTOGRAPH COURTESY OF BRITISH MUSEUM/GOOGLE

文の始まりも曖昧な言語

略式の文章体で書かれた現代アラビア語もそうだが、ヒエログリフには母音が含まれていない。それゆえ、意味の解読が格段に難しい。それぞれの文字が複数の語を表すのだ。

さらに、ピラミッドを建設した茶目っ気溢れる古代エジプト人たちは、そのときの気分に応じてヒエログリフを左から右、右から左、上から下などさまざまな方向に書いていたので、さらなる混乱が生まれる。文の始まりを識別する方法として、人や動物が文頭の方向を向いているというヒントもあるが、判読が難しいものや不完全なものも多い。加えて、ヒエログリフには終止符が使われないので、文章の始まりと終わりを示すものもない。

そこでグーグルは、「Fabricius」という機械学習ベースのオンラインツールを開発した。このツールは、画像からヒエログリフをほぼ一瞬のうちに識別し、3種類の翻訳例を提示するものだ。

「Fabriciusは、ヒエログリフを辞書化するという発想をベースにしています。形の類似性に基づいて、それぞれのヒエログリフを素早く識別できるのです」と、グーグルのアート&カルチャー部門のデジタル考古学者、チャンス・コフェナーは語る。「ヒエログリフの多くは形が酷似しており、現在は解読に長い時間がかかっています。もっと効率よく、迅速にするために、このツールをつくりました」

Fabriciusを使えば、ヒエログリフを書いたりレタッチしたり、「Google フォト」の機械学習技術を利用して識別したりできる。さらにFabriciusは、特定の語句の順序を計算して、翻訳の提案を導き出す。ただし、現時点ではソースデータが不足していることから、機械学習による翻訳はされていない。

グーグルが開発した「Fabricius」で、画像のヒエログリフをレタッチしている様子。

「Google Cloud」の英国およびアイルランドにおけるカスタマーエンジニアリング部門を率いるイアン・パティソンは、次のように説明する。「機械学習を利用して英語からアラビア語に翻訳する場合、膨大な数の翻訳済みの語句がすでに存在するので、それを利用してトレーニングセットを構築できます。どんな機械学習でもデータが多いほどよい結果が得られるのです」

つまり、画像がFabriciusにアップロードされればされるほど、その分析力や識別能力が向上するということだ。

Fabriciusは、機械学習と人工知能(AI)を古代言語の解読に役立てられないだろうかという実験的なアイデアから始まった。「まだ完全ではありません」と、コフェナーは言う。「ですが、プロセスにおける一歩前進だと感じています。専門家たちの作業効率を高めるツールを見つけたのですから」

画像から抽出したヒエログリフの形をもとに、類似する文字の候補を提案している。

一般向けの「Learn(学ぶ)」「Play(遊ぶ)」モード

ヒエログリフには、大きくわけて3つの区分がある。語を表す表語文字、音を表す表音文字、そして語のあとに付けて意味を明確にする限定符(決定符)だ。

有名なロゼッタストーンを所有する大英博物館によると、ヒエログリフは7,000文字ほど存在したが、日常的に使われていたのは700文字程度だったという。26のアルファベットで成り立つ英語のような言語で書かれたテキストと比べ、古代エジプト語の解読がはるかに複雑になる理由がここにあるが、それは同時に楽しみの一部でもある。

実は、Fabriciusは考古学者やエジプト学者だけのためのツールではない。専門家向けの「Work(研究)」のほかに「Learn(学ぶ)」と「Play(遊ぶ)」というふたつのモードが用意されているのだ。

「Learn」モードは、6段階のゲーム仕立ての学習プロセスで構成されている。ヒエログリフをなぞり、識別し、読む順序を理解し、解読できるようにするプロセスだ。モバイル機器用に最適化されているが、デスクトップPCやノートPCでも機能する。「最終的には、ヒエログリフでオリジナルの短い文をつくって友人たちとシェアできるようになります」とコフェナーは言う。

「Play」モードでは、逆引き辞典型の検索ツールを使って、ヒエログリフのメッセージを送れる。「Thank you(ありがとう)」のように頻繁に使われる言い回しが提案されるほか、好きなメッセージを入力するとヒエログリフの訳文が自動的に提案される。

ただし、文字通りの訳文になることはめったにないことには注意が必要だ。例えば、「happy birthday(誕生日おめでとう)」を実際に古代エジプト語で表現すると「glorious festival of your delivery(あなたの出産の輝かしき祝日)」になり、「hello」は「greetings to you(あなたにご挨拶)」になる。

完成したメッセージはデジタルポストカードにして、メールやインスタントメッセージで送信できる。受け取った相手がポストカードをクリックするとFabriciusが開き、何が書いてあるのかわかる仕組みだ。

「古代エジプト時代に存在していた内容しか翻訳できません。現代人独自のヒエログリフをつくるようなことはしたくなかったのです」と、コフェナーは言う。

ロゼッタストーン再発見の日に公開

グーグルでは、Fabriciusのコードをオープンソースとして公開している。このため、ほかの団体も独自の目的でこのツールを利用できる。

Fabriciusという名は、16世紀の詩人であり考古学者でもあったゲオルグ・ファブリシウスにちなんで名づけられた。そして、1799年7月15日にロゼッタストーンが再発見されたことを記念して、221年後の20年7月15日に公開された。

現在Fabriciusは、任意の文字や言語に適用可能だが、グーグルは今後の計画については固く口を閉ざしている。「まだ解読されていない言語を解き明かすことに利用できれば、素晴らしいでしょうね」と、コフェナーは言う。「言語は、文化の歴史を保存するための最良の方法のひとつですから」

※『WIRED』による言語の関連記事はこちら


RELATED ARTICLES

限定イヴェントにも参加できるWIRED日本版「メンバーシップ」会員募集中!

次の10年を見通すためのインサイト(洞察)が詰まった選りすぐりのロングリード(長編記事)を、週替わりのテーマに合わせてお届けする会員サーヴィス「WIRED SZ メンバーシップ」。毎週開催の会員限定イヴェントにも参加可能な刺激に満ちたサーヴィスは、1週間の無料トライアルを実施中!詳細はこちら


TEXT BY MATT SMITH

TRANSLATION BY MAYUMI HIRAI/GALILEO