「弘前大学×AI×津軽弁プロジェクト」が現在、津軽弁音声データの提供を呼び掛けている。
津軽弁ではなく「津軽語」とし、「か゜き゜く゜け゜こ゜」という発音もある
同プロジェクトが始動したのは2017(平成29)年。人工知能(AI)技術を使い、津軽弁の音声を標準語テキストに変換し自動翻訳するソフトの開発を目指す。津軽弁で困ることがあるというコールセンターや医療現場で役立つことが期待されている。
2020年11月には、公募などで集めた約1万件の津軽弁文例データを索引できる「津軽語辞書」を一般に公開した。同プロジェクトに携わる大学院理工学研究科の今井雅教授は「一般的に言語の自動翻訳には約20万件のデータが必要になるといわれている。データはまだ足りない」と話す。
今回募集する音声データは、同プロジェクトのホームページから投稿でき、今井さんによると、どんなささいな音声でも構わないという。「年齢性別問わず津軽弁を募集している。例えばスマホにある録音機能を使い、録音したデータを送ることもできる。日常会話といったものではなく単語一つでも欲しい」と今井さん。「近日中に簡単に投稿できるようなアプリも開発している」とも。
募集受け付けは3月31日までとしているが、文例データと共に募集は続けるという。「いったん精査し、テキスト化してデータとして加えていき、精度を高めていく」と今井さん。
今井さんは県外出身で、近所に住む地元住民とのコミュニケーションに困ることもあるという。「津軽弁は同じ言葉でも発音やイントネーションによって意味が異なることがある。音声データを収集することによって、最終ゴールでもある津軽弁を誰でも理解できるシステム作りに近づくことができる」と話す。