最近、ちょっとはまっているのが、インターネット上での文献収集です。ここで いう「文献」というのは、電子化テキスト、つまりもともと印刷物の形で存在する文 献を主に再利用可能性を高める目的で電子化したものです。以前からそういったプロ ジェクトがいろいろ存在することは知っていたのですが、探せば本当にいろいろある ものですね。著作権の切れた文学作品から、漢籍・お経にいたるまで、ありとあらゆ るものが「転がって」います。
私にとっての電子化テキストならではの楽しみは、なんといっても自分の好きな 体裁で、必要な分量だけプリントアウトできることです。テキスト形式やHTML形式の ものだと加工も非常に容易なので大助かりです(特にHTMLならタグを判断して適切に 変換するスクリプトを書いてしまえば完璧です。もともとHTMLはその制定目的自体が 「文書情報の再利用可能性を高める」ことにあるのですから当然ですが。まあこの問 題はまた別のテーマの時に詳しく触れることもあるでしょう)。昨日今日は青空文庫収録作品を読みあさっ ています。
ちょっとしたサンプルとして、私が組んだ「論語」 をご覧にかけましょう。漢籍の注釈書の伝統的なスタイルにのっとって・・・ 「訓読を」収めてあります(本当の注釈書はこの小さい字の部分に(当然)漢文で注 が書いてあるわけです)。ただこれは、小さい字の部分を手作業で挿入し、体裁を目 で見て調整しているので、スクリプトで一括処理という訳にもいかず手間がかかって います。おかげで今までに出来ているのは「論語」全体の4分の1程度です。
こういった体裁はあくまで個人個人の好みで決めればいいことです。もっとも、 私のように組版まわりの作業が好きな人間ならともかく、興味がない人にはどうでも いいことかもしれません。しかし、書体が変わるだけでも文章の雰囲気はがらっと変 わるものです。いかめしい古典も丸文字で印刷し直してみれば、親しみが持てるよう になるかもしれません。
もっと実用的な活用法もあります。外国語のテキストを行間を空けて印刷するの です。単語や構文の意味が広々した行間に心おきなく書き込めれば、外国語の購読も 進むようになります。私はフランス語の授業で配られたテキストをOCRで読みとり、 これを行間を空けて打ち出したものを友人に配ったものですが、OCRにかけること自 体が一苦労で、肝心の勉強を始める前に疲れてしまうこともしばしばでした(いや、 いつもそうでした)。もともとテキストが電子化されていれば、この作業ははるかに 容易になります。今後、電子化テキストの利用法が広まれば、教える側でも単に本の コピーを配るのではなく、学習しやすさに配慮したプリントを少ない手間で作成する ことも可能になるでしょう。
これは私の持論なのですが、テクノロジーの進歩が人間性を後退させることがあっ てはならないと思います。問題を外国語学習に限ってみても、機械翻訳が自然な訳文 を吐くようになって、みんなが学習を止めてしまうとなれば、それは人間性の後退で す。しかし、テクノロジーの利用によって学ぶことそれ自体に伴う不便を軽減しよう という試みは推奨されるべきです。今回ご紹介した電子化テキストの利用もこれに当 てはまりますし、「忘れてしまった不規則動詞の活用をコンピュータプログラムに教 えてもらうこと」もそうです。
ちょっとずるい論の運びでしたか? でもConjuの理念(というほど高尚なもので はありませんが)は本当はここにあるのです。Conjuが「活用表を調べてきなさい」 という宿題の答えを与えるために提供されている訳ではないことは明らかですしね。 確かに「初学者向け」とは言っていますが、「昔一生懸命勉強したけど忘れてしまっ た」人にも大いに使って欲しいと思います。「一つ頑張って原文に当たってみよう。」 と思い立ったときに、「逆引き可能のてくのろじー」が大きな障害の一つを取り除け ることを作者は願っています。
最後に、世界中のあらゆるテキスト電子化プロジェクトに関わる方々に改めて感 謝の意を表して、この文章を終わることにしましょう。