こんにちはAIチームの友松です。
本記事はAI Shift Advent Calendar 2022の25日目、最終日の記事です。
AI ShiftのTechBlogは2019年の12月24日に開設し、そして、昨日12月24日をもちまして3周年を迎えました。
昨年、一昨年に引き続き今年1年間の振り返りができればと思います。
今年は、Tech Blogだけではなく、学会発表や外部登壇についても振り返りを行います。
Tech Blog
投稿件数
まずは記事投稿数に関してです。
記事投稿数はTechblog開始の2020年(2019年は年末からスタートだったのでマージ)には46件, 2021年には56件, 2022年は58件と年々ペースを落とすことなく記事を出すことができました。
また、去年に引き続きAI Shift Advent Calendarを実施し12/1〜12/25の期間毎日途切れずに記事を投稿することができました。
Adventarから記事を見ることができるので是非覗いてみてください。
アクセス数
アクセス数の詳細な数字は伏せますが、2020年のアクセス数を1としたときに
2020:1.0 -> 2021:4.58 -> 2022:4.46
という推移になっています。
今年のアクセス数トップ10
- 第1位 社内SQL研修のために作った資料を公開します(2021)
- 第2位 Kaggleで学んだBERTをfine-tuningする際のTips②〜精度改善編〜(2021)
- 第3位 Kaggleで学んだBERTをfine-tuningする際のTips①〜学習効率化編〜(2021)
- 第4位 文書分類における古典的手法とBERTの判断根拠の比較(2021)
- 第5位 スペクトラルノイズ除去による雑音除去(2021)
- 第6位 Kaggleで学んだBERTをfine-tuningする際のTips③〜過学習抑制編〜(2021)
- 第7位 GiNZA v5のTransformerモデルによる固有表現抽出(2022)
- 第8位 Tableau, Pythonで高度な分析(poetryを用いたtabpy環境の構築と扱い方)(2021)
- 第9位 Googleスプレッドシート+BigQueryで追加作業が必要なレポーティングを効率化(2020)
- 第10位 openSMILEを使った音声分類(2022)
トップ10のうち、7つが2021年, 1つが2020年に公開された記事で特に1位の記事は昨年も1位で引き続き多くの方に読んでいただけています。
昨年は1位の記事が大バズリしたため、今年のアクセス数合計は昨年比で落ち込むかなと思いましたが、日常的に見ていただいているベースのアクセス数が年々増えているため、昨年とほぼ同水準まで伸びました。2022年12月31日までに昨年のアクセス数も超えられそうな見込みとなりました。
2020年の振り返り記事でも触れていますが、当初立てたブログの目標である、「更新頻度を重要視する。アクセス数はKPIとしては追わない」という方針は今でもキープしており、モチベーションを落とさずにTech Blogの更新を継続できており、アクセス数はその結果として着いてきたものだと思っております。AI ShiftのTech Blogを読んでいただいている皆様ありがとうございます。
AI ShiftのTech Blogの更新通知はTwitterのAI Shift公式アカウントから毎回投稿を行っているので是非フォローをお願いします。
学会発表
発表一覧
学会 | タイトル | 著者 |
---|---|---|
PACLIC 2022 | Japanese named entity recognition from automatic speech recognition using pre-trained models(※1) | Seiichiro Kondo, Naoya Ueda, Teruaki Oka(Tokyo Metropolitan University), Masakazu Sugiyama, Asahi Hentona (AI Shift) and Mamoru Komachi(Tokyo Metropolitan University). |
日本音響学会2022年春季研究発表会 | 自動音声対話における音素情報を用いたリアルタイム End-of-Turn 判定(※2) | 池口弘尚、李晃伸(名古屋工業大学)、東佑樹、下山翔、戸田隆道(AI Shift) |
言語処理学会第28回年次大会 | テキスト生成モデルを利用した対話型広告におけるシナリオ設計に有用なキーフレーズの抽出 | 戸田隆道、友松祐太、杉山雅和、邊土名朝飛、東佑樹、下山翔(AI Shift) |
単語の分散表現および音素列の類似性を考慮した単語アラインメントに基づく教師なしEntity Linking | 邊土名朝飛、友松祐太、杉山雅和、戸田隆道、東佑樹、下山翔(AI Shift) | |
事前学習モデルを用いた音声認識結果からの固有表現抽出(※3) | 今藤誠一郎、上田直生也、岡 照晃(東京都立大学)、杉山 雅和、邊土名朝飛(AI Shift)、小町 守(東京都立大学) | |
クラウドソーシングに基づく日本語タスク指向型対話収集基盤の構築に向けて(※4) | 邊土名朝飛、友松祐太(AI Shift)、阿部香央莉、佐々木翔大、乾健太郎(東北大学) | |
第36回人工知能学会(JSAI2022) | ユーザ発話とEntityの音声類似度を考慮したEntity Linking手法の検討 | 邊土名朝飛、戸田 隆道、友松 祐太、杉山雅和、東佑樹、下山翔(AI Shift) |
NLP若手の会 第17回シンポジウム (YANS 2022) | 特定の文脈における正規表現を用いた電話音声認識のドメイン適応の検討 | 東佑樹、友松祐太(AI Shift) |
MC Dropoutに基づく確信度を用いた回答可否の予測を伴う対話システム | 二宮大空、下山翔、戸田隆道、邊土名朝飛、杉山雅和、友松祐太(AI Shift) | |
第13回対話システムシンポジウム | チャットボット事業におけるDense Retrieverを用いたZero-shot FAQ検索 | 二宮大空、邊土名朝飛、杉山雅和、戸田隆道、友松祐太(AI Shift) |
※1, ※3: 東京都立大学小町研究室との共同研究
※2: 名古屋工業大学李研究室との共同研究
※4: 東北大学乾研究室との共同研究
2022年は査読付き国際学会1本+国内学会9本の計10本を投稿することができ、6つの学会への参加をすることができました。
年別の推移でも2019年:2学会,2本 -> 2020年:4学会,7本 -> 2021年:4学会,6本 -> 2022年:6学会,10本と、投稿学会数, 投稿本数ともに増やすことができました。
取り扱うテーマも2019年はチャットボットに伴うNLP系の投稿が多かったですが、最近はボイスボットに関連した音声対話技術に関する投稿が増え、NLPだけではなく、音声認識・発話区間検出・データ収集など扱う技術領域も広げています。
学会関連のTech Blog
学会投稿では発表告知と参加報告についての記事を上げております。
発表告知では発表内容についての解説やポスターのアーカイブを記載しており、参加報告では学会の様子や発表に対する質疑応答などを掲載しております。
査読付き国際学会
- PACLIC 2022
国内学会
- 日本音響学会2022年春季研究発表会
- 言語処理学会第28回年次大会(NLP2022)
- 第36回人工知能学会(JSAI2022)
- NLP若手の会 第17回シンポジウム (YANS 2022)
- 第13回対話システムシンポジウム
各参加報告にも書いていますが、昨年まではコロナ渦の影響で参加したすべての学会がオンライン開催でしたが、今年はオフライン開催も増えてきて現地での交流や、オフラインならではの体験も戻ってきてているように感じます。
年明けに音響学会, 言語処理学会の投稿を予定しており2023年も引き続き多くの投稿を目指していきます。
外部登壇
CA BASE NEXT 2022
学会以外の技術系の外部発表では親会社であるサイバーエージェント主催のCA BASE NEXT 2022で登壇を行いました。CA BASE NEXTとは、サイバーエージェントの20代のエンジニア・クリエイターが中心となって創り上げる技術カンファレンスとなっています。
発表タイトル: ボイスボット事業における研究開発と産学連携
参加報告にて当日の資料、YouTubeアーカイブを公開しているので是非御覧ください。
まとめ
今回は、AI Shift Tech Blogが3周年を迎え、2022年のTech Blog, 学会発表, 登壇について振り返ってみました。
来年も良かった点は引き継ぎ、改善すべき点は改善し、2023年も更にブラッシュアップできればと思います。
また、本日でAI Shift Advent Calendar 2022の最終日を完走することができました。ありがとうございました。ぜひ他の記事も御覧ください。
2022年のTech Blogもこれを持ちまして最後となります。
皆さんよいクリスマス/年末をお過ごしください。