ヽ(´・肉・`)ノログ

How do we fighting without fighting?

SapporoTechBarに行った

Sapporo Tech Bar ~データベースとデータ分析の勉強会 に行きました.

データ分析界隈の今の概要がわかっておもしろかったです. Sapporo Tech Bar は次回以降も大体第二金曜日にやるそうです.

タイトル
PyData & Apache Spark
発表
玉川竜司 さん
  • セレッソ大阪が好き

目標

Python 界隈のデータ処理事情の「地図」がわかる

PyData

PyData

データ処理を目的とした Python を使ったコミュニティ

などのツールが属している.

pandas

おすすめ

ちょっと古いけど 「Pythonによるデータ分析入門」

jupyter

Project Jupyter

データ探索用のREPL(のようなもの)

をくみあわせて Jupyter らしい.

Apache Spark

Apache Spark

pandas に比べると……

Apache Parquet

Apache Parquet

Apache Parquet is a columnar storage format available to any project in the Hadoop ecosystem,

かなりいいよ.列指向のストレージフォーマット.

今日一番覚えて帰ってほしい.

Machine Learning

このエントリーをはてなブックマークに追加