論文読み
[arxiv] A Comparison of Natural Language Understanding Platforms for Chatbots in Software Engineering.
2020/12/04 + 著者 + Ahmad Abdellatif + Khaled Badran + Diego Elias Costa + Emad Shihab Senior Member, IEEE + 所属 + Concordia University, Montreal, Canada.
(まとめ:井上嵩浩 as @takinou0)
どんなもの?
- abstract
どうやって有効だと検証した?
- Intents(質問の意図を正しく分類できているか)、Entity(目的語が正しく取れているか)、Confidence Score(確信度の閾値を変更した際、F値がずっと高いままでいられるか)で比較を行なった。
- データとしては2種類のSE系の質問を用意して、検証を行った。
実際のシステム開発プロジェクトで使われている質問などのレポジトリ
stack overflow (https://stackoverflow.com) に登録されているQ&Aデータ
- 例
- "How to create an JS object from scratch using a HTML button?"
結果
順位はデータによってケースバイケースで変わるが、トータルで見るとwatsonの順位が高い。
技術や手法の肝は?
- 精度を比較してみました、だけなので、あまり肝というものはなかった。
議論はある?
- 特になし
先行研究と比べて何がすごい?
- 論文曰く、2点ある。
- SE領域に関連したFAQのデータを使っていること。
- 類義語のリスト管理機能などの固有の機能や、entity毎の精度の違いなども考慮に含めて、複数の自然言語理解エンジンを比較したこと。
私見
- 比較してみただけの論文なので、実に読みやすかった。
- とはいえ、業務上、チャットボットの製品比較をすることが多いので、調査が既になされているのはありがたかった。
次に読むべき論文は?
- あんまりいいのがない。。。