
2024年の進捗状況
翻訳機能については基礎研究を支援している。荒木健治北海道大学名誉教授らの研究では、ベクトル変換モデルを利用することにより正確度が上昇した。しかし、残念ながら実用レベルには届いていない。
アイヌ語同士のチャット機能についてはGPT(Generative Pre-trained Transformer)を利用してオリジナルのAIチャットのプロトタイプを作成した。今後、アイヌ語を勉強中の若者によってブラッシュアップされることを期待したい。
田中蒼大郎, 越前谷博, 荒木健治.
ベクトル間類似度に基づくベクトル変換モデルを用いた低資源言語のためのニューラル機械翻訳. 情報処理学会研究報告, Vol. 2024-SLP-154, 20, p1-6, 2024-12-05, ISSN,2188-8663.
背景
おそらく動物種の絶滅については聞いたことがあるでしょう。人間の民族も言語を失うと消滅する運命にあります。The Summer Institute of Linguistics’ Ethnologueのデータを使用すると、NettleとDanielは、世界の人口の90%が100の最も使用されている言語を話すと計算しています。地球上の人々の約10%が少なくとも6,000の言語を話しています[1]。
話者が100人未満の言語は絶滅に非常に近いため、日常的に使用するという復活はありそうにありません[1]。アイヌ語のネイティブスピーカーの数は、1996年に15人と推定されました[2]。 2020年、状況は絶望的です。私たちはこの状況を非常に心配しています。
私たちのメインのプロジェクトは、AI(人工知能)テクノロジーによるアイヌ語のネイティブスピーカーの復活です。彼女の名前は「AIピリカ」です。 「ピリカ」はかわいいアイヌの女の子を意味します。
AI ピリカは感情が持てないと心配している方もいるかもしれません。しかし、私たちはシステムに感情を組み込みます。
世界中の絶滅危惧言語に応用できることを楽しみにしています。
[1] Nettle and Daniel. 2000. Vanishing Voices. Oxford University Press.
Moseley, Christopher (ed.). 2010.
[2] Atlas of the World’s Languages in Danger, 3rd edn. Paris, UNESCO Publishing. Online version: http://www.unesco.org/culture/en/endangeredlanguages/atlas
[3] Proceedings of the IASTED International Conference COMPUTATIONAL INTELLIGENCE. November 20-22, 2006, San Francisco, CA, USA.