ヽ(´・肉・`)ノログ

How do we fighting without fighting?

SappoRoR に参加した

普段の勉強会だと,その言語を使ってツールを作る人が一杯いるんだけど,今回はツールを使う人が一杯いて,その違いがおもしろかったです.

ぜひまたやって欲しいなあ.また参加したいです.

以下自分用のメモ

R ことはじめ @sakaue

R概論

統計ソフトです!こまけえこたあいいんだよ

いいとこ

よくないとこ

Excel とか SPSS じゃだめなの?

インストール

いい感じでやってね

インストール方法の説明が丁寧だ

アップデート

コツ

アンインストール

ふつうにできる

起動

アレする

終了

q()

プロっぽい!

help

help(q)

関数と変数が命

四則演算

演算子の結合強度

関数

指定した値に対して何か処理をして返すもの

sqrt(104976) # => 324

変数

1 つ以上の値を収めておく箱

2 つ以上の値を収めておくものを特にベクトルと呼ぶ

hako <- c(1,2,3,4,5)
hako # => 1 2 3 4 5

c(1,2,3) -> hako2
hako2 # => 1 2 3

-> はできるけどあんまり使わない

sqrt(hako)
[1] 1.000000 1.414214 1.732051 2.000000 2.236068

hako の中の全ての値に sqrt が適用されている.すげえ!

まとめ

外部データの読み込み

行列の話

実際のデータは複数行あるはず

行列? -> 数値が縦横に並べられたもの

行列を使うには matrix 関数を使う matrix(要素, 行の数, 列の数)

karada <- matrix(c(180, 170, 165, 175, 190, 75, 65, 60, 70, 80), 5, 2)
karada
     [,1] [,2]
[1,]  180   75
[2,]  170   65
[3,]  165   60
[4,]  175   70
[5,]  190   80

2 行目の値だけ欲しい [2, ]

2 列目 [, 2]

2列目と4列目 [, c(2,4)]

データフレーム

いろんなデータをつっこんだもの いろんな = 質 + 量

外部データの読み込み

demo.csv を作業ディレクトリへ移動して

test <- read.csv("demo.csv")

あっという間に作図

データ集めたら見えるようにしたいよね

  1. 変数に値を代入する
  2. 作図用の関数を利用する

簡単だ!

ヒストグラム

age <- c(18, 23, 14, 19, 21, 29, 22, 21)
hist(age)

散布図

score <- c(60, 50, 72, 43)
words <- c(340, 190, 465, 170)
plot(score, words)

箱ひげ図

high <- c(350, 285, 315, 340)
coll <- c(365, 570, 645, 540)
boxplot(high, coll)

折れ線グラフ

plot(x, type="l")

坊グラフ

barplot(1:10)

グラフの保存方法

pdf()
plot(1:10)
dev.off()

まとめ

  1. 変数に値を代入
  2. 作図用の関数を使って処理
  3. 形式を指定して保存
  4. 人に伝承(twitter やら FB)

Rで検定

現象を数値データ + 検定で捉えてみたい

t検定

平均値の差の検定

like <- c(6, 10, 6, 10)
dislike <- c(3, 5, 6, 4)
t.test(like, dislike)

カイ二乗検定

chisq.test(...)

分散分析

anova(...)

「ANOVA君」というのがあって便利なので使おう

LT(みたいなの)

『Rで学ぶデータサイエンス』シリーズ のスクリプトを片っ端から実行してみました @sakaue

クラスタ分析してから視覚化する例

スクリプトは共立出版のwebページからダウンロードできる

Rを使った次元数の縮約化 @seisumi

SappoRoR のはじまり

ミシュランガイドに北海道版4軒も! -> いいなあ -> じゃあ SappoRoR やったら来る? -> やっかー

授業の品質管理

「授業は,それぞれのレベルに合った英語にしてください(キリッ」

R で言語研究を始めよう @sakaue

いいとこ

パッケージ

install.packages("languageR")
library(languageR)
data(alice)
alice.growth = ...

のように使う

R で統計モデルと作図 @KuboBook

グラフの重ね書きが大事

仕事で使う R @nakayoshix

R のパフォーマンスの話 @havanaclub_

大きすぎるデータの取り扱い,気をつけた方がいいかもしれないですよ. (100万ぐらい)

SASだと簡単なのにRでやると面倒だと思ってしまうところ @daihiko

データを非正規化して解決のとっかかりにする.みたいの,プログラマもたまにやる気がするなあ.

クラスター分析のWard法で指定すべき距離 たかみさん

「R 簡単/綺麗って言うけど,あんまり期待しすぎないで,それなりの覚悟が必要だよ」率直や!

R 言語と自動処理の可能性 こにしさん

エクセル -> R -> エクセル とか自動的にできるよ.