こんにちはAI Shiftの戸田です。
来週3月15日(月)から3/19(金)で開催される言語処理学会第27回年次大会(NLP2021)にてAI Shiftから2件発表を行います。
今回はそこで発表する内容や、議論したいポイントについて取り上げたいと思います。
発表内容
① ポスター発表
- 日時: 3月18日(木) 11:00-12:30 Zoom
- セッション: P8:ポスター:対話(3)/固有表現(2)/含意・言い換え(1)
- 発表: P8-1: 提示候補とクエリの差分を用いたチャットボットの新規問い合わせ抽出手法
- 著者: ○戸田隆道, 友松祐太, 杉山雅和 (AI Shift)
近年カスタマーサポートの分野において普及が進んでいるチャットボット、そのメンテナンス作業のコストを削減する手法について発表します。
今回対象となるメンテナンス作業は、回答までたどり着けず、途中で離脱してしまったユーザーのクエリを、正しい回答に紐付ける作業で、我々は「回答候補の紐付け」と読んでいます。これは大きく分けて既存の回答に紐付ける場合と、新規に回答を作成して紐付ける場合の2通りのパターンが存在し、私達は前者に関して、作業を効率化するために発話のクラスタリングを行う手法を考案し、昨年の言語処理学会で発表しました。
今年の発表では後者の新規に回答を作成して紐付ける場合に関して、効率化の手法を提案します。
議論したいポイント
議論したいポイントは2点あります
1. 短い文章の集合に対してのキーフレーズ抽出手法
今回発表する手法において重要な部分としてキーフレーズの抽出があります。キーフレーズ抽出手法として、近年はEmbedRankのような分散表現をベースにした手法がよく使われますが、チャットボットの対話データのように、短い文章に対してはあまり有効ではありません。
我々が今回発表する手法では、このことを考慮し、係り受け解析を用いたキーフレーズ抽出を行っています。
2. 突発的に増加する質問について
カスタマーサポートの問い合わせは、時期によらず普遍的に質問される内容もありますが、突発的に増加する問い合わせも多くあります。例えば新サービスがリリースされた際のそのサービスに対する質問や、障害が起きた際の対応などです。
こういった問い合わせの種別の分類について、どういったアプローチを取ればよいか、我々は現在検討中ですが、ご意見や解決案などございましたら議論させていただきたいです。
②ワークショップ2 AI王 〜クイズAI日本一決定戦〜
ポスターセッションに加え、ワークショップとして開催されるクイズAI王〜クイズAI日本一決定戦〜にも参加させていただきます。
このワークショップは日本語を対象とした質問応答研究を促進させることを目的として、クイズ問題を題材とした質問応答データセットJAQKET[鈴木ら 2020]を用いた日本語質問応答システムの正解率を競うライブコンペティションです。
こちらはコンペティション終了後、解法についてTECH BLOGの方で紹介させていただきたいと思います。
その他
AI Shift以外にもCyberAgentグループから2件発表があり、スポンサーとしても出させていただいているため、そちらの発表もぜひお越しください。
当日皆様と活発な議論ができることを楽しみにしております。