電話線(4芯)のLAN換装
作業部屋のN/Wは無線LANを使っているのですが、音声通話やyoutubeライブの視聴時に遅延を感じることが時折ありました。
で、既存設備をいじらないままになんとか有線化できないかなー、と配電盤眺めたり、コンセント内のダクトレールをワイヤーで突ついたりしてた(でも通らなかった)んですが、ちょうどいいものがありました。4芯の電話線です。
かつてはちゃんと生きていた電話線ですが、ISDNやADSLの時代を経て、今は壁の中に埋まっているだけの存在でした。コンセントや電話の配電盤からも抜かれてるので、電話工事士の資格もいらないぞ(多分)
電話線は2極4芯の青白茶黒が刺さっていたので、これなんとか使えないかな、と調べてみると、4芯あればCategory5の100Base-TXになるらしい。
利用したのはパナソニックのぐっとす。 電話線の両端の青白茶黒を、LANの1,2,3,6番に結線してみて、疎通するかどうか確認。
SpeedTestアプリで測ってみて、上り40Mbps, 下り80Mbps。 youtubeの4Kもギリギリ見えるし、この速度なら十分だと思います。 あと、遅延とジッタも改善しました。
よかったよかった。
論文読み abstract & conclusion
¥[arXiv:2102.00509]¥ TruthBot: An Automated Conversational Tool for Intent Learning, Curated Information Presenting, and Fake News Alerting
Introduction に書いてあったこと
- パンデミックのような危機的状態に至ると、人々は各々で情報を探すが、ソーシャルメディア経路で得られた誤った情報について、信じてしまいやすいとわかっている。
- 一方、人間は、人間と雑談するよりも、チャットボットと雑談する方を好むことがわかっている。
- このため、チャットボットを真実の情報を探すのに使うのは良い手だと考えている。
abstract, conclusionに書いてあったこと。
- 確実な事項や、ファクトチェック情報や、最近のニュースについて得られるトゥルースボットを作った。
- トゥルースボットが質問を受けた場合、キュレーションした情報か、もしくはwebから検索をして、正しい情報を返す。(今回はCOVID-19のデータを使った)
- 類似のチャットボットよりもいい成績を示しているところが、本研究の成果である。
論文読み
[arxiv] A Comparison of Natural Language Understanding Platforms for Chatbots in Software Engineering.
2020/12/04 + 著者 + Ahmad Abdellatif + Khaled Badran + Diego Elias Costa + Emad Shihab Senior Member, IEEE + 所属 + Concordia University, Montreal, Canada.
(まとめ:井上嵩浩 as @takinou0)
どんなもの?
- abstract
どうやって有効だと検証した?
- Intents(質問の意図を正しく分類できているか)、Entity(目的語が正しく取れているか)、Confidence Score(確信度の閾値を変更した際、F値がずっと高いままでいられるか)で比較を行なった。
- データとしては2種類のSE系の質問を用意して、検証を行った。
実際のシステム開発プロジェクトで使われている質問などのレポジトリ
stack overflow (https://stackoverflow.com) に登録されているQ&Aデータ
- 例
- "How to create an JS object from scratch using a HTML button?"
結果
順位はデータによってケースバイケースで変わるが、トータルで見るとwatsonの順位が高い。
技術や手法の肝は?
- 精度を比較してみました、だけなので、あまり肝というものはなかった。
議論はある?
- 特になし
先行研究と比べて何がすごい?
- 論文曰く、2点ある。
- SE領域に関連したFAQのデータを使っていること。
- 類義語のリスト管理機能などの固有の機能や、entity毎の精度の違いなども考慮に含めて、複数の自然言語理解エンジンを比較したこと。
私見
- 比較してみただけの論文なので、実に読みやすかった。
- とはいえ、業務上、チャットボットの製品比較をすることが多いので、調査が既になされているのはありがたかった。
次に読むべき論文は?
- あんまりいいのがない。。。
名古屋検索勉強会#19 資料作りました
9/25(水)に予定していている、名古屋検索勉強会#19「ウェブのクローリングとインデックス付け」の資料です。 また後で直す気はしますが、とりあえず公開。
名鉄の重心を探してみよう
この記事について
何をしたの?
名鉄の利用者が一番集まりやすい駅を、運賃と移動時間から算出してみました。
経緯
- 2018年から勉強会を主催していたが、名古屋の果て1だったせいか、人が集まらなかった。
- 人が集まりやすいところでやらなきゃダメなのでは、と気づく。
- 愛知で便利なのは名鉄だから、名鉄駅で一番行きやすい駅で開催すると人がいっぱい集まるはず!
- 各駅からの距離が一番小さい駅が、一番行きやすい駅だ!
- つまりそここそが「名鉄の重心」。言い換えれば「愛知の中心」である。
仮説
広い仮説 : 名鉄は、名岐鉄道(名鉄名古屋-岐阜エリア)と、愛知電気鉄道(神宮前-豊橋エリア)が合併してできたものなので、二つをつなぐ名鉄名古屋本線状上に重心が来るのではないか?
狭い仮説 : 地図を見ると名鉄の真ん中に鳴海駅があるので、ここが重心なのでは? 急行駅だし。
お試し調査
主要駅の情報取得
駅間の距離を探すのはしんどかったので、代替の変数として運賃で計算することにした。 名鉄の主要駅2同士で、運賃の平均値を算出。 主要駅の運賃は名鉄の運賃のご案内にだいたいまとまっているので、埋めるのは楽。
名鉄の重心のあたりづけ
平均運賃が一番安いところを見ると、 名古屋:614円 金山:603円 知立:692円 なので、どうも、金山の前後に重心があるっぽい
あと、豊橋や中部国際空港は運賃が高い。 路線の末端だから当然なのだけど、この辺で勉強会やると、不平不満が出そうだなー、と思う。3
主要駅での平均運賃 一覧
算術平均 | 不偏標準偏差 | 名鉄岐阜 | 名鉄一宮 | 名鉄名古屋 | 金山 | 知立 | 新安城 | 豊橋 | 知多半田 | 中部国際空港 | 犬山 | 豊田市 | ||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
名鉄岐阜 | 915.0 | 410.2 | 300 | 550 | 600 | 980 | 1040 | 1470 | 1160 | 1340 | 450 | 1260 | ||
名鉄一宮 | 774.0 | 348.7 | 300 | 370 | 440 | 730 | 860 | 1360 | 920 | 1120 | 600 | 1040 | ||
名鉄名古屋 | 614.0 | 260.2 | 550 | 370 | 190 | 500 | 550 | 1110 | 660 | 870 | 550 | 790 | ||
金山 | 603.0 | 246.6 | 600 | 440 | 190 | 450 | 500 | 1110 | 600 | 810 | 600 | 730 | ||
知立 | 692.0 | 284.1 | 980 | 730 | 500 | 450 | 230 | 730 | 860 | 1060 | 980 | 400 | ||
新安城 | 742.0 | 296.1 | 1040 | 860 | 550 | 500 | 230 | 660 | 920 | 1120 | 1040 | 500 | ||
豊橋 | 1200.0 | 326.4 | 1470 | 1360 | 1110 | 1110 | 730 | 660 | 1420 | 1630 | 1470 | 1040 | ||
知多半田 | 967.0 | 255.3 | 1160 | 920 | 660 | 600 | 860 | 920 | 1420 | 810 | 1160 | 1160 | ||
中部国際空港 | 1144.0 | 270.4 | 1340 | 1120 | 870 | 810 | 1060 | 1120 | 1630 | 810 | 1340 | 1340 | ||
犬山 | 945.0 | 369.2 | 450 | 600 | 550 | 600 | 980 | 1040 | 1470 | 1160 | 1340 | 1260 | ||
豊田市 | 952.0 | 330.6 | 1260 | 1040 | 790 | 730 | 400 | 500 | 1040 | 1160 | 1340 | 1260 |
鳴海も入れてみよう
金山付近の最適解候補を探そう、ということで、狭い仮説:鳴海駅も入れてみる。 結果、もっとも運賃が安い駅になったので、鳴海が名鉄の重心である可能性が高い。 つまり、緑生涯学習センターで勉強会を開くと、みんなが集まりやすくて良いらしい。 みんな、緑生涯学習センターを使おう。
算術平均 | 不偏標準偏差 | 名鉄岐阜 | 名鉄一宮 | 名鉄名古屋 | 金山 | 知立 | 新安城 | 豊橋 | 知多半田 | 中部国際空港 | 犬山 | 豊田市 | ||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
鳴海 | 579.1 | 245.1 | 790 | 550 | 300 | 240 | 300 | 400 | 920 | 660 | 870 | 790 | 550 |
本番調査
名鉄全体で確認する。
本当の意味で名鉄の重心を図るには、駅同士の運賃を全駅(瀬戸線は省く)4で取得しなければならない。 全部で254駅あるので、組み合わせは以下の通り。
{}_{254} C_{2} = 32131
手作業で取得するのは現実的じゃない。 できれば、乗換回数・乗車時間なども測りたいので、スクレイピングに手を出してみることにした。
Scrapyをつかってみる。
参考にしたのは公式のチュートリアル。 これが一番わかりやすかった。
で、乗換案内系のサイトから、一週間くらいかけて運賃・乗換数・乗車時間をスクレイピング。 なお、乗車時間は何時に出発するかによって変わるので、 電車の本数がもっとも多い時間帯(8:00)に出発時刻を統一して、3候補の中から一番短いものを採用。
結果
運賃順
運賃が安い順に並べるとこんな感じ。 名古屋駅近辺が来るのは想定された結果だけど、名駅・金山・神宮前でなかったのがちょっと意外。 栄生・堀田こそが愛知の中心であると言っても過言ではない5。
時間順
時間順だとこんな感じ。 特急・急行が止まる駅が優位になる。 金山こそが愛知の中心。みんな市民会館で勉強会をしよう。
鳴海がいい線いっているので、仮説があながち外れてなかったとわかった。 大江が意外と順位高くなるので意外。
つまり、どこで勉強会を開催するといいの?
駅でいうと
順位が高かったこの辺で開催するといい様子。なお、栄生には貸し会議室がなさそう。 - 金山 - 神宮前 - 名鉄名古屋 - 堀田 - 鳴海
貸し会議室・レンタルスペース
公的貸し会議室だと、こんなところ。 - 市民会館@金山 - 緑生涯学習センター@鳴海
名駅・金山には一般の貸し会議室・レンタルスペースが多数あるのだけど良し悪しがわからないので未記載。 お勧めがあったら教えてください。
今後の予定
愛知県の全駅とか、東海三県の全駅で同じことをやるとえらいことになるので、それは避けたい。 とりあえず、鳴海で勉強会を開催する大義名分は一応たったので、勉強会を設定しよう。
Appendix
今回集計したデータ
もくもく会と、統計検定の対策やります。
4/29月にもくもく会と統計検定の対策やります。
よければお越しくださいませ。
場所は名古屋の上前津駅で、午前にもくもく会、午後に統計検定をやりますが、席にはどうせ余裕がありますので、終日もくもく会していただいてても大丈夫です。
会費は、1日いて200円です。
午前
名古屋データ分析もくもく会#GW突発開催 - connpass
午後