具体的な課題
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/04/08 10:23 UTC 版)
自然言語処理(理解)における課題をいくつかの例を用いて示す。 次の2つの文、 We gave the monkeys the bananas because they were hungry.(猿が腹を空かせていたので、バナナを与えた。) We gave the monkeys the bananas because they were over-ripe.(バナナは熟れ過ぎていたので、猿に与えた。) は、品詞としては全く同じ順序の並びである。しかし、they が指すものは異なっていて、前者では猿、後者ではバナナとなっている。この例文の場合、theyの指す内容は英語の文型の性質によって決定することができる。すなわち、「they(主語)= hungry(補語)」の関係が成り立ち、補語には主語の性質を示すものがくるので、hungryなのはthe monkeys、したがって、「they = the monkeys」と決まる。後者も同様に、over-ripeというのはthe bananasの性質だから、「they = the bananas」となる。つまり、これらの文章を区別し正しく理解するためには、意味、すなわち、猿の性質(猿は動物で空腹になる)とバナナの性質(バナナは果物で成熟する)といったことを知っていて解釈できなければならない。 単語の文字列を解釈する方法は様々である。例えば、 Time flies like an arrow.(光陰矢の如し) という文字列は以下のように様々に解釈できる。 典型的には、比喩として、「時間が矢のように素早く過ぎる」と解釈する。 「空を飛ぶ昆虫の速度を矢の速度を測るように測定せよ」つまり (You should) time flies as you would (time) an arrow. と解釈する。 「矢が空を飛ぶ昆虫の速度を測るように、あなたが空を飛ぶ昆虫の速度を測定せよ」つまり Time flies in the same way that an arrow would (time them). と解釈する。 「矢のように空を飛ぶ昆虫の速度を測定せよ」つまり Time those flies that are like arrows と解釈する。 「"time-flies"(時バエ)という種類の昆虫は1つの矢を好む」この解釈には集合的な解釈と個別的解釈がありうる。 「TIMEという雑誌は、投げると直線的な軌跡を描く」 英語では特に語形変化による語彙の区別をする機能が弱いため、このような問題が大きくなる。 また、英語も含めて、形容詞と名詞の修飾関係の曖昧さもある。例えば、"pretty little girls' school"(かわいい小さな少女の学校)という文字列があるとする。 その学校は小さいだろうか? 少女たちが小さいのだろうか? 少女たちがかわいいのだろうか? 学校がかわいいのだろうか? 他にも次のような課題がある。 形態素解析 中国語、日本語、タイ語といった言語は単語のわかち書きをしない。そのため、単語の区切りを特定するのにテキストの解析が必要となり、それは非常に複雑な作業となる。 音声における形態素解析 音声言語において、文字を表す音は前後の音と混じっているのが普通である。従って音声から文字を切り出すのは、非常に難しい作業となる。さらに、音声言語では単語と単語の区切りも(音としてのみ見れば)定かではなく、文脈や文法や意味といった情報を考慮しないと単語を切り出せない。 語義の曖昧性 多くの単語は複数の意味を持つ。従って、特定の文脈においてもっともふさわしい意味を選択する必要がある。 構文の曖昧性 自然言語の構文(構文規則)は曖昧である。1つの文に対応する複数の構文木が存在することも多い。もっとも適切な解釈(構文木)を選択するには、意味的情報や文脈情報を必要とする。 不完全な入力や間違った入力 主語の省略や代名詞の対応などの問題(照応解析)。音声におけるアクセントのばらつき。構文上の誤りのある文の解析。光学文字認識における誤りの認識など。 言語行為 文章は文字通りに解釈できない場合がある。例えば "Can you pass the salt?"(塩をとってもらえますか?)という問いに対する答えは、塩を相手に渡すことである。これに "Yes" とだけ答えて何もしないのはよい答えとは言えないが、"No" はむしろありうる答えで、"I'm afraid that I can't see it" はさらによい(塩がどこにあるかわからないとき)。
※この「具体的な課題」の解説は、「自然言語処理」の解説の一部です。
「具体的な課題」を含む「自然言語処理」の記事については、「自然言語処理」の概要を参照ください。
- 具体的な課題のページへのリンク