データ穴リストのブログ

文系へっぽこリサーチャーから穴リストへジョブチェンジ中。渋谷の片隅でニヤニヤしております。・・・動いたら、ね。

Tokyo.Rに行ってきた

 
連投する!
 
コードも載せないが、連投する!
 
ブログは更新してこそのブログ!
 
コードも載せない技術(笑)ブログだが、更新することに注力した結果そうなった!
 
ということで書く!
 
 

今日のお題は

…………というネタも、ヒトから聞いてきたよって話なんだけども。
 
この前のTokyo.R#53に、初心者がのこのこ参加してみたよって話です。


あ、ブログタイトルと見た目を変えてみました。
関係ないけど今夜は妻側の両親と回らないお寿司の予定です。

 

まとめてみた。

社内のredmineでひとり寂しく「共有」した表を転載する。
ヘーシャのヘーブにはR使いがいない。
つまりこんなワタシが最もRについて詳しいのである。
ただの不戦勝。みんなでRやって年収あげようぜ。。。?
 
というどーしようもない状況を脱するべく、
ちゃんとしたエンジニアさん達にもRを使ってもらいたい一心で、地道な布教活動を続けている。
 
その成果を紹介。
スピーカー タイトル 備考
初心者セッション
@doradora09 初心者セッション 1

(資料見つからなかったので前回の?中身はほぼ同じかな)

 R言語入門ver2.15

@aad34210 初心者セッション2(欠席により中止)  
@kotatyamtema 初心者セッション3 内容:ゆるふわ文字型データの 取り扱い入門 lEncodeと便利パッケージと正規表現
@kashitan Rによるウイスキー分析 本人ブログ(Tokyo.R #53まとめ)
応用セッション
自己紹介タイム
@y__mattu 実務でもきっと役立つ統計的因果推論(スライド公開なし) ※別の方だけど過去の回で統計的因果推論の話をした資料
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
@u_ribo ハドリーさん、進捗どうですか(Hadley Ecosystem 2016 by Uryu Shinya)  すばらしい。
Toyoda,H 『実験計画 or クロス表のベイズ分析』 5/20?(6月?)の新刊の紹介&stanを動かす関数公開の案内もあった。
はじめての 統計データ分析 ―ベイズ的〈ポストp値時代〉の統計学―
ライトニングトーク
@siero5335 Mxnetで回帰 #TokyoR 53th 僕の今のレベルでは唱えられそうも無い。。とりあえず城の周り回ってからまた来る!
@kato_kohaku それを捨てるなんてとんでもない “Imputation of Missing Values using Random Forest”  一通り出来るようになったら次はココ頑張る。。
@yutannihilation dplyrとは何だったのか ここを理解出来ると書くスピードがあがりそう。
@kazutan Tokyo.R #53 LT「R Markdownのちょいネタ集」  ステキすぎる。
@Korenari_D Rでやってみた金融テキストマイニング  自分の仕事に応用したい。
@kos59125 R で LINEBOT を作ろう ご本人ブログ
http://blog.recyclebin.jp/archives/4573
@kumisky 解約リストと分析と現場 泣ける面白さだった。資料みたいけど、当日のスピーチ込みだからこそな気もする。
@simizu706 また春に会いましょう ベイズ推定で不合格者を決めたい かの有名なHADの先生。陰ながらいつもお世話になっております。
 
 
とにもかくにも、雲の上のようなRエンジニア、R使いの統計家の方々ばかりで、正直内容の7割は理解してない自信がある
(あと会場の9割の方とはお話すら出来てないコミュ障である)。
 
そんな中でも、僕が最も感銘を受けたのは、
やっぱり豊田秀樹先生の報告だ。
無作為抽出はイデアです
この一言にはシビれた。
 
統計的検定、検出力などを長年教えてこられた先生からのこの一言にはとても深い含蓄を感じる。
 
今度の入門書はぜひとも購入して学びなおさなければ。
 ※アフィとかは無い。なんならアフィのあるサイトで買ってあげるとブロガーさんが喜ぶんじゃないだろうか。
 

で、穴リスト的にはどうなの

 勉強会に行って、何も得られることがなかったのなら、それは参加しないのも同義だ。
時間がかかっても、得るのもがあればいい。

ということで、特に楽しそう&自分の仕事に役に立ちそう(&ちょっと頑張れば自分にも出来そう)なお話を参考に、自分でも以下の話をやってみました。

このお話↓

報告はとても面白く、データ的にも興味あるし、レーダーチャートも多次元尺度構成法も仕事で使えるので、これは是非ともということと、
報告ではクラスタリングしたところで終わっていて、結果がどうなってるか、その先がすごく気になったというのもあって、再現してみました。

と言っても、@kashitanさんと@u_riboさんの書いたものを写経してからちょっと足した(そして繋げた)だけですが。

………っていう詳細を書いていく。
あー、でもコードハイライトの出来ない見たままモードで書いてしまったので、
つづきはWEBで!
・・・次のエントリで。書きます。。


あとは、rmarkdownのお話とか、統計的因果推論のあたりが、自分の仕事周りだと活用出来るようになりたいなと。

次の目標はとりあえずいよいよダッシュボードかな。