『民法への招待』クメール語版公開の道程
2022-01-01
新生「MasaoIkeda.com」が完成した。以前のバージョンは『民法への招待〈第3版・クメール語版〉』のPDFを公開する簡易なwebサイトだったが、このたび『民法への招待〈第6版・クメール語版〉』の翻訳完成を機に、公開環境を「Scrapbox」に移し、書籍全文PDFの掲載に加え、クメール語のテキストをwebサイトで直接読める理想的な形態へと進化したのだ。クメール語表記の実現は、Scrapboxを開発しているNota社のCEO、CTO、エンジニアの方々のご尽力によるものである。京都に本社のある日本の会社だ。ここに敬意と感謝を表し、その経緯を記したい。 革新的な「知識共有サービス」として2016年11月にリリースされた「Scrapbox」は、汎用性が高く、チームの情報共有や情報の公開など、その用途は多彩だ。一人でもチームでも利用でき、目的に応じて、公開、非公開(メンバーのみ公開)、いずれも可能。2017年2月に使い始めた筆者はその有用性と発展性を直感し、即、学部と大学院のゼミや授業で全面的に採用した。 ゼミのメンバーたちとともに使い方を模索するうち、教育、研究分野における想像以上のポテンシャルが明らかになっていった。一般的なワープロソフトと比べて習熟がはるかに容易で利便性が高く、メンバー間での情報の流通がスムーズになることからアウトプットが劇的に増加し、学生たちのチームワークによる自律的な学習、研究が加速した。
筆者が利用している教育、研究用途の例を挙げよう。授業、ゼミ、講演等で一般的に配布されるいわゆる「レジュメ」、各種プレゼンで投影する「スライド」、講演や講義を書き取る階層化された「ノート」、単独やチームで執筆する「原稿」、日々の業務で交わされる「書類」、司法試験などの論述「起案」、学生同士や教員による「添削」、各種の情報を集約して発展的に利用していく「データベース」、etc...。文字、画像、動画、コードといったデジタル情報を一手に扱えて検索性能が高い。工夫次第で無限に広がる知識ベースだ。スクリプトやCSSを書けばユーザのニーズに合わせて自在にカスタマイズできるなど、柔軟性に富む。
これはクメール語情報の共有や公開、そしてカンボジアでの法学教育にも応用できる。そう確信した筆者は、2017年3月、試しにクメール語を記載して愕然とした。大半が文字化けしてしまうのだ。どうすれば解消できるか。開発者たちの支援が必要だ。
サービス開始直後から積極的に利用していた筆者は各種のイベントに参加してエンジニアと交流し、教育現場におけるScrapboxの有用性を何度も講演させていただいた。その過程で、カンボジアにおける法学教育の現状とクメール語表記実現の必要性を訴え、クメール語に対応していただけるようお願いした。ありがたいことに、Scrapboxを開発、運用しているNota社CEOの洛西一周氏、CTOでScrapbox発明者かつ慶應義塾大学環境情報学部の増井俊之教授、開発本部長の秋山博紀氏、そしてエンジニアの橋本翔氏、飯塚大貴氏らが問題の解析と技術的実現手法を模索してくださった。 課題は合字(ligature)にあった。クメール文字はタイ文字、ミャンマー文字、ラオ文字と同様、ブラーフミー系文字(brahmic scripts)に属し、世界の文字体系の半数を占めるとされるアブギダ(abugida)文字体系(原則として子音には決まった母音が付くが母音を変更したり無くしたりする場合は符号が付加される文字体系)の一種だ。書記言語において意味上の区別を可能にする最小の図形単位(1文字)を「書記素(grapheme)」といい、クメール文字の書記素は子音、母音、子音、そして記号類の組み合わせから成る。Scrapboxなど多くのwebサービスで用いられるJavaScriptでクメール語の文字列を扱うには、書記素を構成するまとまり「書記素クラスタ(grapheme cluster)」ごとにテキストデータを区切って1文字ずつ抽出する技術を実装する必要がある。Scrapboxだけの問題ではなかったのだ。クラスタの区切りを誤って文字を取り出した場合、文字化けが発生する。
例えばクメール語の「ប៉ុស្ដិ៍」(Khmer Dictionary: ប៉ុស្តិ៍)という1文字(書記素)は、「ប」、「៉」、「ុ'」、「ស」、「្」、「ដ」、「ិ」、「៍」という8つのパーツを合成して成り立つ。「ポー」と発音され、「郵便局」や「役職」などを意味する外来語だ。おそらくフランス語の「poste」が語源であろう。また絵文字の例として「👨👩👦👦」という書記素は「👨」、「👩」、「👦」、「👦」の4つが合成された書記素クラスタだ。 2018年12月、JavaScriptが文字を扱う際に分割抽出するのが困難だった合字を実際の1文字(書記素)ごとに分割するためのコードを、洛西氏、橋本氏、飯塚氏がScrapboxに実装してくださった。とうとうScrapboxでクメール語の表記が実現したのだ。これによりクメール文字はもとより、同じくアブギダ文字体系に属するアラビア文字、ベンガル文字、サンスクリット語やインドの各言語を表記するデーバナーガリ文字、グジャラート文字、ヘブライ文字、カンナダ文字、ラオス文字、マラヤーラム文字、ミャンマー文字、タミル文字、タイ文字、そしてチベット文字の表記も同時に可能になった。 新生 MasaoIkeda.com がカンボジアにおける法整備支援、法学教育、そして経済発展に寄与することを願っている。末筆ながら、Nota社のみなさま、JJLのみなさま、そしてクメール語訳とその公開をご快諾いただいた池田眞朗先生に心より感謝申し上げたい。 shorten URL for this page : https://flic.kr/p/XBT7ya https://live.staticflickr.com/4357/36505672361_bc1cf430c4_3k.jpg