雑談ではお互いの人となりを知りあう過程で、様々な話題が交わされます。
以前、私の研究グループで人間同士のチャットを収集したときのこと。人間同士をランダムにマッチングして、自由なトピックで話してもらいました。そして、収集した数千対話について、発話のそれぞれにトピックを示すラベルを付与していきました。たとえば、この発話は「映画」、この発話は「ラーメン」、この発話は「京都」といった具合です。
この結果、雑談には本当に多様な話題が含まれていることが確認できました。図は頻度が多かったトピックを示しています。一番多かったトピックは「旅行」、2位は「料理」、3位は「映画」でした。これらについては「確かに多そうだな」という印象を持つ方も多いと思います。
しかし、一番高頻度の「旅行」であっても、その頻度は全体の0.7%もありません。グラフは非常にロングテール。このままずっと右端まで続いていきます。人間同士における雑談の話題の広がりは大変なものです。
また、収集した対話の発話のそれぞれについて、発話意図を示すラベルも付与しました。発話意図とは「質問」とか「挨拶」といった、発話が持つ意味のラベルのことです。たとえば、「スカイツリーを知ってますか?」であれば「質問」ですし、「こんにちは」であれば「挨拶」といった感じです。