「デジタル人文学(Digital Humanities)」という言葉が学術界で広く使われるようになって久しいですが、古典研究の現場においてその具体的な実践はどのように進んでいるのでしょうか。本稿では、テキストマイニング・自然言語処理・AI解析といったデジタル技術が日本古典研究に与える影響を考察するとともに、伝統的な文献学的手法との関係についても検討します。
デジタル人文学とは何か
デジタル人文学とは、人文学の研究対象や研究方法にデジタル技術を組み合わせた学際的な研究領域です。テキストのデジタル化から始まり、コーパス分析・ネットワーク分析・地理情報システム(GIS)・3Dモデリングなど、多様なデジタル技術が人文学研究に応用されています。
日本においては、国立国語研究所が整備した『日本語歴史コーパス』などのデジタル資源の整備が進んでいるほか、各大学でデジタル人文学の研究プロジェクトが立ち上がり、古典籍のデジタル化と研究利用が加速しています。
テキストマイニングの可能性
大量のテキストデータを統計的に分析するテキストマイニングは、従来の人文学研究では不可能だった大規模な分析を可能にします。例えば、江戸時代の出版物数千点を対象に、特定の語彙の出現頻度や共起パターンを分析することで、当時の知識体系や世界観の変容を追跡することができます。
「膨大なテキストから俯瞰的なパターンを見出すデジタル手法と、個々の文書の内的意味を深く読み解く伝統的な読解とは、相互補完的な関係にある。」
AI技術の古典研究への応用
近年急速に発展した深層学習(ディープラーニング)技術も、古典研究への応用が進んでいます。特に注目されているのが、くずし字(崩し字)のAI自動認識技術です。従来、古文書の解読には専門的な訓練を受けた研究者が必要でしたが、AI技術の発展により、未解読の古文書テキストを自動的にテキストデータ化することが、ある程度可能になってきました。
くずし字認識の現状と課題
2019年に公開された「KuroNet」などのくずし字認識システムは、高い認識精度を誇り、研究者の作業効率を大きく向上させました。一方で、損傷した文書や特殊な筆致の文字の認識精度はまだ十分ではなく、専門的な研究者による確認・修正作業が依然として必要です。
伝統的手法との対話
デジタル技術の導入に対して、伝統的な文献学・古典研究の立場からは慎重な見方もあります。個々のテキストへの深い読み込みや、文化的文脈の理解、写本の物質性への着目など、人文学的研究の本質的な部分はデジタル技術では代替できないという指摘は正当です。
重要なのは、デジタル技術を伝統的研究手法の「補完」として位置づけることです。大量データの処理やパターン認識においてはデジタル技術が優れており、個別事例の深い解釈や文化的意味の読み解きにおいては人文学的知見が不可欠です。両者を適切に組み合わせることで、それぞれ単独では不可能だった研究成果を生み出すことができます。
弊社の取り組み
エンシェントスペルグリモワール株式会社では、デジタル人文学の最新動向を踏まえながら、クライアントの古典研究・古文書調査に最適な方法を提案しています。デジタル技術の活用と伝統的な書誌学・文献学的手法を適切に組み合わせることで、より精度の高い調査・分析を実現します。デジタルアーカイブの整備やテキストデータ化のご相談は、ぜひお気軽にお問い合わせください。