電話線(4芯)のLAN換装

作業部屋のN/Wは無線LANを使っているのですが、音声通話やyoutubeライブの視聴時に遅延を感じることが時折ありました。

で、既存設備をいじらないままになんとか有線化できないかなー、と配電盤眺めたり、コンセント内のダクトレールをワイヤーで突ついたりしてた(でも通らなかった)んですが、ちょうどいいものがありました。4芯の電話線です。

かつてはちゃんと生きていた電話線ですが、ISDNADSLの時代を経て、今は壁の中に埋まっているだけの存在でした。コンセントや電話の配電盤からも抜かれてるので、電話工事士の資格もいらないぞ(多分)

電話線は2極4芯の青白茶黒が刺さっていたので、これなんとか使えないかな、と調べてみると、4芯あればCategory5の100Base-TXになるらしい。

利用したのはパナソニックぐっとす。 電話線の両端の青白茶黒を、LANの1,2,3,6番に結線してみて、疎通するかどうか確認。

SpeedTestアプリで測ってみて、上り40Mbps, 下り80Mbps。 youtubeの4Kもギリギリ見えるし、この速度なら十分だと思います。 あと、遅延とジッタも改善しました。

よかったよかった。

論文読み abstract & conclusion

¥[arXiv:2102.00509]¥ TruthBot: An Automated Conversational Tool for Intent Learning, Curated Information Presenting, and Fake News Alerting

Introduction に書いてあったこと

  • パンデミックのような危機的状態に至ると、人々は各々で情報を探すが、ソーシャルメディア経路で得られた誤った情報について、信じてしまいやすいとわかっている。
  • 一方、人間は、人間と雑談するよりも、チャットボットと雑談する方を好むことがわかっている。
  • このため、チャットボットを真実の情報を探すのに使うのは良い手だと考えている。

abstract, conclusionに書いてあったこと。

  • 確実な事項や、ファクトチェック情報や、最近のニュースについて得られるトゥルースボットを作った。
  • トゥルースボットが質問を受けた場合、キュレーションした情報か、もしくはwebから検索をして、正しい情報を返す。(今回はCOVID-19のデータを使った)
  • 類似のチャットボットよりもいい成績を示しているところが、本研究の成果である。

論文読み

[arxiv] A Comparison of Natural Language Understanding Platforms for Chatbots in Software Engineering.

2020/12/04 + 著者 + Ahmad Abdellatif + Khaled Badran + Diego Elias Costa + Emad Shihab Senior Member, IEEE + 所属 + Concordia University, Montreal, Canada.

(まとめ:井上嵩浩 as @takinou0)


どんなもの?

  • abstract
    • SaaSとして提供されているチャットボット用の自然言語理解のプラットフォームは複数あるが、質疑応答させる分野によって得意・不得意がある。
    • 分野毎に検証結果があるが、Software Engineeringの領域では検証がされていないため、検証してみた。
    • 比較対象は、IBM Watson, Google Dialogflow, Microsoft Luis, オープンソースRasa の4種類。
    • 製品の精度は与えるFAQデータ次第だが、いくつかの検証方法をを試してみたら、トータルではIBM Watsonが最も良かった。

f:id:takinou0:20210221221343p:plain


どうやって有効だと検証した?

  • Intents(質問の意図を正しく分類できているか)、Entity(目的語が正しく取れているか)、Confidence Score(確信度の閾値を変更した際、F値がずっと高いままでいられるか)で比較を行なった。
  • データとしては2種類のSE系の質問を用意して、検証を行った。
    • 実際のシステム開発プロジェクトで使われている質問などのレポジトリ

      • "List me the changes done in ClassA.java"
      • "Who has the most bug assignments?"
    • stack overflow (https://stackoverflow.com) に登録されているQ&Aデータ

      • "How to create an JS object from scratch using a HTML button?"

結果

順位はデータによってケースバイケースで変わるが、トータルで見るとwatsonの順位が高い。 f:id:takinou0:20210221221359p:plain


技術や手法の肝は?

  • 精度を比較してみました、だけなので、あまり肝というものはなかった。

議論はある?

  • 特になし

先行研究と比べて何がすごい?

  • 論文曰く、2点ある。
    • SE領域に関連したFAQのデータを使っていること。
    • 類義語のリスト管理機能などの固有の機能や、entity毎の精度の違いなども考慮に含めて、複数の自然言語理解エンジンを比較したこと。

私見

  • 比較してみただけの論文なので、実に読みやすかった。
  • とはいえ、業務上、チャットボットの製品比較をすることが多いので、調査が既になされているのはありがたかった。

次に読むべき論文は?

  • あんまりいいのがない。。。

名鉄の重心を探してみよう

この記事について

何をしたの?

名鉄の利用者が一番集まりやすい駅を、運賃と移動時間から算出してみました。

経緯

  1. 2018年から勉強会を主催していたが、名古屋の果て1だったせいか、人が集まらなかった。
  2. 人が集まりやすいところでやらなきゃダメなのでは、と気づく。
  3. 愛知で便利なのは名鉄だから、名鉄駅で一番行きやすい駅で開催すると人がいっぱい集まるはず!
  4. 各駅からの距離が一番小さい駅が、一番行きやすい駅だ!
  5. つまりそここそが「名鉄の重心」。言い換えれば「愛知の中心」である。

仮説

広い仮説 : 名鉄は、名岐鉄道(名鉄名古屋-岐阜エリア)と、愛知電気鉄道(神宮前-豊橋エリア)が合併してできたものなので、二つをつなぐ名鉄名古屋本線状上に重心が来るのではないか?

狭い仮説 : 地図を見ると名鉄の真ん中に鳴海駅があるので、ここが重心なのでは? 急行駅だし。

お試し調査

主要駅の情報取得

駅間の距離を探すのはしんどかったので、代替の変数として運賃で計算することにした。 名鉄の主要駅2同士で、運賃の平均値を算出。 主要駅の運賃は名鉄運賃のご案内にだいたいまとまっているので、埋めるのは楽。

名鉄の重心のあたりづけ 

平均運賃が一番安いところを見ると、 名古屋:614円 金山:603円 知立:692円 なので、どうも、金山の前後に重心があるっぽい

あと、豊橋中部国際空港は運賃が高い。 路線の末端だから当然なのだけど、この辺で勉強会やると、不平不満が出そうだなー、と思う。3

主要駅での平均運賃 一覧

算術平均 不偏標準偏差 名鉄岐阜 名鉄一宮 名鉄名古屋 金山 知立 安城 豊橋 知多半田 中部国際空港 犬山 豊田市
名鉄岐阜 915.0 410.2 300 550 600 980 1040 1470 1160 1340 450 1260
名鉄一宮 774.0 348.7 300 370 440 730 860 1360 920 1120 600 1040
名鉄名古屋 614.0 260.2 550 370 190 500 550 1110 660 870 550 790
金山 603.0 246.6 600 440 190 450 500 1110 600 810 600 730
知立 692.0 284.1 980 730 500 450 230 730 860 1060 980 400
安城 742.0 296.1 1040 860 550 500 230 660 920 1120 1040 500
豊橋 1200.0 326.4 1470 1360 1110 1110 730 660 1420 1630 1470 1040
知多半田 967.0 255.3 1160 920 660 600 860 920 1420 810 1160 1160
中部国際空港 1144.0 270.4 1340 1120 870 810 1060 1120 1630 810 1340 1340
犬山 945.0 369.2 450 600 550 600 980 1040 1470 1160 1340 1260
豊田市 952.0 330.6 1260 1040 790 730 400 500 1040 1160 1340 1260

鳴海も入れてみよう

金山付近の最適解候補を探そう、ということで、狭い仮説:鳴海駅も入れてみる。 結果、もっとも運賃が安い駅になったので、鳴海が名鉄の重心である可能性が高い。 つまり、緑生涯学習センターで勉強会を開くと、みんなが集まりやすくて良いらしい。 みんな、緑生涯学習センターを使おう。

算術平均 不偏標準偏差 名鉄岐阜 名鉄一宮 名鉄名古屋 金山 知立 安城 豊橋 知多半田 中部国際空港 犬山 豊田市
鳴海 579.1 245.1 790 550 300 240 300 400 920 660 870 790 550

本番調査

名鉄全体で確認する。

本当の意味で名鉄の重心を図るには、駅同士の運賃を全駅(瀬戸線は省く)4で取得しなければならない。 全部で254駅あるので、組み合わせは以下の通り。

{}_{254} C_{2} = 32131

手作業で取得するのは現実的じゃない。 できれば、乗換回数・乗車時間なども測りたいので、スクレイピングに手を出してみることにした。

Scrapyをつかってみる。

参考にしたのは公式のチュートリアル。 これが一番わかりやすかった。

で、乗換案内系のサイトから、一週間くらいかけて運賃・乗換数・乗車時間をスクレイピング。 なお、乗車時間は何時に出発するかによって変わるので、 電車の本数がもっとも多い時間帯(8:00)に出発時刻を統一して、3候補の中から一番短いものを採用。

結果

運賃順

運賃が安い順に並べるとこんな感じ。 名古屋駅近辺が来るのは想定された結果だけど、名駅・金山・神宮前でなかったのがちょっと意外。 栄生・堀田こそが愛知の中心であると言っても過言ではない5

  1. 栄生
  2. 堀田
  3. 名鉄名古屋
  4. 金山
  5. 神宮前
  6. 本笠寺
  7. 山王
  8. 呼続
  9. 鳴海

時間順

時間順だとこんな感じ。 特急・急行が止まる駅が優位になる。 金山こそが愛知の中心。みんな市民会館で勉強会をしよう。

鳴海がいい線いっているので、仮説があながち外れてなかったとわかった。 大江が意外と順位高くなるので意外。

  1. 金山
  2. 神宮前
  3. 名鉄名古屋
  4. 栄生
  5. 堀田
  6. 鳴海
  7. 知立
  8. 大江
  9. 須賀口
  10. 前後

つまり、どこで勉強会を開催するといいの?

駅でいうと

順位が高かったこの辺で開催するといい様子。なお、栄生には貸し会議室がなさそう。 - 金山 - 神宮前 - 名鉄名古屋 - 堀田 - 鳴海

貸し会議室・レンタルスペース

公的貸し会議室だと、こんなところ。 - 市民会館@金山 - 緑生涯学習センター@鳴海

名駅・金山には一般の貸し会議室・レンタルスペースが多数あるのだけど良し悪しがわからないので未記載。 お勧めがあったら教えてください。

今後の予定

愛知県の全駅とか、東海三県の全駅で同じことをやるとえらいことになるので、それは避けたい。 とりあえず、鳴海で勉強会を開催する大義名分は一応たったので、勉強会を設定しよう。

Appendix

今回集計したデータ

名鉄全駅 運賃/乗換回数/時間 一覧 名鉄全駅 平均運賃/平均乗換回数/平均時間 一覧


  1. 桜通線 神沢駅こそ、名古屋の果て

  2. 主要駅かどうかの判断には主要駅構内図を利用。ただ、全部を調べるのは大変なので、いくらか駅を落とした。

  3. 個人の感想です。

  4. 瀬戸線は他の瀬戸線と直接繋がっていないため、別枠で扱うべきかなと考えたため、省いた。

  5. もちろん過言である。

勉強中

自然科学の統計学をちょっとずつ読み進めています。

三年くらい前に買った時はあんまりにもよく分からなくて挫折したけど、今はなんとなく理解しながら読んで行けるようになったので、なれというか経験というかは大事ですね。

 

今は4章 最尤法について。

自然科学の統計学 (基礎統計学)

自然科学の統計学 (基礎統計学)

 

 

 

もくもく会と、統計検定の対策やります。

4/29月にもくもく会と統計検定の対策やります。

よければお越しくださいませ。

場所は名古屋の上前津駅で、午前にもくもく会、午後に統計検定をやりますが、席にはどうせ余裕がありますので、終日もくもく会していただいてても大丈夫です。

会費は、1日いて200円です。

 

午前

名古屋データ分析もくもく会#GW突発開催 - connpass

 

午後

統計検定対策回 2019春 - connpass