こんにちは、AI Shiftの友松です。
本日6月8日(火)から6月11日(金)まで2021年度 人工知能学会全国大会(第35回)が開催されています。本会議でAI Shiftから明日6/9(水)に2件発表を行います。
そのうち1件は東京都立大学小町研究室との共同研究の内容になります。
今回はそこで発表する内容や、議論したいポイントについて取り上げたいと思います。
発表内容
2件の発表はいずれも[2Yin5] インタラクティブ2, 2021年6月9日(水) 17:20 〜 19:00 Y会場 (ポスター会場2)にて行われます。
[2Yin5-01]用例ベースチャットボットの運用自動化に向けた回答紐付け支援システム
著者: 〇戸田 隆道1、友松 祐太1、杉山 雅和1 (1.株式会社 AI Shift)
発表概要
チャットボットのメンテナンス作業の一つである回答候補の再設計の効率化手法とその評価について発表します。回答候補の再設計は既存への紐付けと新規作成の2パターンがありますが、両者それぞれに対して効率化手法を提案します。
議論したいポイント
特に新規作成のパターンに関して、現状とてもシンプルな手法なので、結果の解釈はしやすいですが、ドメインによっては満足な抽出が行えてないケースがあります。手法の改善や、評価の妥当性などについて議論できたらと思っています
[2Yin5-04]日本語音声認識誤り訂正のための擬似誤りデータ作成と評価
著者:〇杉山 雅和1、吉村 綾馬2、友松 祐太1、小町 守2 (1.株式会社AI Shift、2.東京都立大学)
発表概要
日本語音声認識誤り訂正への適用を目的として擬似音声認識誤りデータを作成し誤り訂正を行った結果について発表します。日本語音声認識誤りに使用できる大規模な学習データがないことから大規模日本語コーパスに擬似誤りを付与して事前学習を行い、実際のドメインの擬似誤りデータでfine-tuningを行って、作成した擬似誤りデータの有効性の評価を行っています。
議論したいポイント
日本語音声認識誤り訂正に適したデータセットの要件や擬似誤り付与のルールについて議論させていただきたいです。また、今回はデータセットの作成・評価がメインであったため暫定的にE2Eの手法を用いましたが、より課題に即した手法についてもお話できればと考えています。
終わりに
AI ShiftではChatbot, Voicebotに関連した自然言語処理, 対話システム, 音声言語処理に関する研究を行っています。当日はぜひ活発な議論ができると嬉しいです。