こんにちは、AIチームの杉山です。
この記事は前回の続きで第10回対話システムシンポジウム2日目の参加報告になります。
第10回対話システムシンポジウム2日目は以下のスケジュールで行われました。
〇 12月3日(火)
10:00-12:30 一般ポスター・若手萌芽ポスター・デモ発表
12:30-14:00 昼休憩
14:00-15:00 招待講演2(神田崇行先生)
15:00-15:05 休憩
15:05-15:45 国際会議報告
15:45-16:25 対話システムシンポジウム10周年記念企画
16:25-16:45 若手奨励賞表彰・閉会
一般ポスター・若手萌芽ポスター・デモ発表
このセッションでは以下の内容で発表が行われました。
[一般ポスター] 5件
15.事態の一貫性推定に基づく雑談対話応答選択モデル
◯田中翔平,吉野幸一郎,須藤克仁,中村哲(奈良先端大)
16.超高齢化時代が対話システムに求める物理層の基盤的特性
◯市川熹(千葉大/工学院大/早大),嶋祐二(工学院大),堀内靖雄(千葉大),原大介(豊田工業大),酒向慎司(名工大)
17.与えた発話意図の再予測を用いた応答生成モデルの検討
◯隆辻秀和,吉野幸一郎,須藤克仁,中村哲(奈良先端大)
18.チャットボット運用における対話クラスタリング
◯戸田隆道(サイバーエージェント),黒岩稜(東大),友松祐太,杉山雅和(サイバーエージェント)
19.親密性を考慮した対話システムのためのマルチモーダル雑談コーパスの構築と分析
◯山﨑善啓,千葉祐弥,能勢隆,伊藤彰則(東北大)
[若手萌芽ポスター] 6件
20.聞き手の反応をモニターしながら説明する音声ガイドシステム
◯森本洋介,森大毅(宇都宮大)
21.対話コーパスに基づく新たなシステム対話行為の設計の検討
◯西本遥人,武田龍,駒谷和範(阪大)
22.対話ロボットの言語的協同による共感促進の効果とユーザの対話継続欲求への影響
◯楊潔,菊池英明(早大)
23.感情表現を用いて説得を行う音声対話ロボット
◯浅井沙良,品川政太朗,吉野幸一郎,Sakriani Sakti,中村哲(奈良先端大)
24.負例を厳選した対話応答選択テストセット構築の試みと分析
◯佐藤志貴(東北大),赤間怜奈,大内啓樹,鈴木潤,乾健太郎(東北大/理化学研)
25.ロバストな対話システムのための発話スタイルに非依存なエンコード・デコード手法の提案
◯古舞千暁,滝口哲也,有木康雄(神大)
[デモ] 9件(他に11.と14.のデモ)
26.FAQ集から構築可能なQA対話システム
◯吉田尚水,岩田憲治,渡辺奈夕子,小林優佳,藤村浩司(東芝研究開発センター)
27.コーチングを行う対話システムの実現に関する研究
◯下田耕太郎,西野哲朗(電通大)
28.Attention機構による低頻度な対話行為の特徴を捉えた対話行為推定
◯泉春乃,加藤昇平(名工大)
29.業務効率化のための半自動知識獲得を行う抽出型読解システムの構築
◯関沢祐樹(Nextremer)
30.質問生成ソリューション「なんでもQuestion」の紹介
◯土居誉生,石垣泰地,小澤仁護,稲田徹(SCSK)
31.FoodChatbot: 料理ドメインの雑談対話システム
◯中野幹生(HRI-JP),駒谷和範(阪大)
1. ソニーにおけるキャラクタとの対話システムの取り組み
◯菅野沙也,肥田礼夢,宮崎千明,井上正則,土居正一,青山一美(ソニー)
33.おーぷん2ちゃんねる対話コーパスを用いた用例ベース対話システム
◯稲葉通将(電通大)
34.Risky Politeness:対話欲求侵害リスクの高い発話方略によって人間らしさを表出する雑談対話システム
◯宮本友樹,磐下大樹,遠藤水紀,永井望,片上大輔(東京工芸大)
対話シンポジウムには初めて参加させていただいたのですが、対話に焦点を当てたシンポジウムであるがゆえに参加者が試すことのできるデモ発表が多い印象でした。また音声を用いたデモも多数出展されておりワイワイと賑やかな雰囲気でした。
またNLP的観点では、言語モデルのBERT^1を当然のように用いた発表が多く、まずWord2Vecを試す時代は過去のものになったようにも感じました。
私たちAI Shift(表記上はサイバーエージェントになっていますが)からも1件発表させていただき、途絶えることなく多くの方にお越しいただきました。
非常に有意義な議論をさせていただいた聴講者のみなさま、また内定者バイト期間に爆速で成果を出してくれた東京大学の黒岩くんに改めてお礼申し上げます。
私たちの発表内容は前々回に紹介しましたので、ここでは個人的に印象に残った発表について簡単に紹介させていただきます。
23.感情表現を用いて説得を行う音声対話ロボット
◯浅井沙良,品川政太朗,吉野幸一郎,Sakriani Sakti,中村哲(奈良先端大)
こちらの発表は説得を行うロボットに感情音声を用いることで、説得し易さが変わるのではないかという仮説を検証するために、感情ラベル付きテキストと感情ラベル付き音声をそれぞれクラウドソーシングによる拡張、声優による読み上げを用いて作成した、というものでした。また作成した感情ラベルテキストだけを用いるよりも感情ラベル付き音声を用いた方が感情伝達制度が良いという結果が確認されたため、今後は実際に感情表現を用いて説得を行うロボットでの実験を行う予定とのことでした。
感情テキストを作成するところで、スタイル変換の技術を用いることである程度自動的に作成することもできるのではないかと質問させていただいたところ、既にそちらのアプローチは試したがうまくいかなかったらしく、テキストのスタイル変換を研究で試している(うまくいっていない)身として、そうだよな・・・という辛さをシェアする形になりました。
今後の実験結果によっては、AI Shiftでも今後音声プロダクトを開発していくにあたり、交渉や説得を行うようなタスクでは感情表現を乗せた音声を用いた方が成功しやすくなるのでは、という示唆を得ることができ有意義な議論ができました。
26.FAQ集から構築可能なQA対話システム
◯吉田尚水,岩田憲治,渡辺奈夕子,小林優佳,藤村浩司(東芝研究開発センター)
こちらの発表は、既存のFAQを用いてQAでの絞り込みを行う対話システムの自動作成に取り組んだものでした。
問い合わせに対応する回答候補の検索の結果、候補数が多い場合に絞り込みの例を出すにあたり、
従来は人が良き単語を選んでシナリオを作ることになることが多いのですが、
直前のクエリに対して情報量の大きい単語を選択することで自動で絞り込みの応答を生成できるとのことでした。
私たちもサービスとして運営している、チャットボットでは絞り込みを行う場合のシナリオ作成にはシナリオ作成の経験やコストがかかります。それを省力化する方向の研究だったので、これ以外の手法も含めて議論させていただき今後の展開も楽しみな内容でした。
またこのような絞り込みの機構は、例えばインタフェースが音声になると一度に複数の応答をしてもユーザーは覚えきれないため、
絞り込みを行う機能がテキストチャット以上に重要になると考えられますがそこの解決策として非常に有用なアプローチだと感じました。
招待講演2「街角でのヒューマンロボットインタラクション」神田崇行先生(京都大学)
後述の中野先生のお話で、対話システムの実用化までの段階として
- シミュレーション
- 被験者実験
- 実証実験
- 製品・サービス+ビジネスモデル
というお話がなされたのですが、神田先生のお話はまさに2と3の間に壁の高さに関するお話でした。
道案内をするロボットはどのように伝えるのが一番伝わりやすいのか、ティッシュ配りをするロボットはどのように歩行者に近づいて手を出すのが受け取ってもらいやすいのかなど、実際に街中で実証実験することで表出する問題の数々を、仮説立案・検証だけでなく実際のベテランの人の動きを取り入れることで解決を試みていたのが印象的でした。
余談ですが、私もかつて小売店で音声対話による移動式ロボットの実証実験を行った経験があるのでどうすれば使っていただけるかの試行錯誤や、どのような(よくない)使われ方をするかといった事例についてのお話には首肯するばかりでした。
質疑ではロボットの持つ身体性は、今流行りのヴァーチャルキャラクターに比べてどのように働くか、など示唆に富んだものが多く大変勉強になりました。
国際会議報告
対話システムに関連する主要な国際会議について以下の次第で参加報告が行われました。
ACL: 高山 隼矢(大阪大学)
NLP4ConvAI: 田中 翔平(NAIST)
SIGDIAL: 松山 洋一(早稲田大学)
INTERSPEECH: 小林 優佳 (東芝)、稲熊 寛文(京都大学)
ICMI: 田中 宏季(NAIST)
SLUD研究会からこれらの学会での発表者を増やすことを目的に、各学会の特色や採択率など参考になる情報が提供されました。SIGDIALは英語が微妙でも内容が面白ければメンターがつきで通してくれる制度があるなど、参考になる情報ばかりで、会終了後、私たちのチームでもこれらの学会に通せるように頑張ろう!と盛り上がりました。
対話システムシンポジウム10周年記念企画「対話システム研究の10年を振り返って:これまでとこれから」 SLUD研究会主査 中野幹生先生(HRI-JP)
最後に、SLUD研究会主査の中野先生から、この10年を振り返りと様々な研究者を対象に行ったアンケート結果の紹介がありました。
私は10年目にして初参加ではありましたがこれまでの10年が概観できる内容で、非常に参考になりました。
アンケートは、対話システムのこれまでの10年を支えた技術、今後重要になるであろう技術などについてのものでした。社会的信号処理が挙がるのはいかにも対話システムシンポジウムらしいと思いました。
アンケート結果と資料は今後公開されるとのことで、昨今学会での資料が公開されることが多くなってきており、有難い限りです。
終わりに
以上で、3回に渡った第十回対話システムシンポジウムの参加報告を終わります。
初めての分野ではありましたが、発表の毛色がこれまで参加してきた学会と比べて以下のように異なっており新鮮でした。
- まず研究のテーマやタスク、そのための実験の設計が重要かつ難しそう
- 独自の実験になるので独自のデータを作る必要があることが多い
- 対話データはクラウドソーシング+Augmentationが多い
- 実験の評価も定量的にできるとは限らず、7段階のリッカート評価などが多い(Shared Taskで0.1ポイントを伸ばす感じではない)
- データ生成、実験、評価全てに人が絡むので、追試のコストが高そう
全体的な印象としては企業研究者の方が多く、それも相まってしっかりとコミュニティが確立されているように感じました。
今後もAI Shiftではテキスト・音声を用いて対話システムの開発を行いますので、次回以降も継続的に参加していきたいと思います。