感情タグBEST3
Posted by ブクログ 2017年11月27日
羽生章洋『楽々ERDレッスン』で、RDBMSは情報部門のデータ貴族主義を廃し、ユーザーの手にデータを取り戻し、効果的な(効率的な、ではない)開発を実現するために生まれたとある。
この書籍はそれを実感させる。
Posted by ブクログ 2015年10月03日
良書。データ分析に挑戦したい人(特に文系でプログラミングとかよく分からない人)は、Rに手を出す前にこの本を読んで、SQLから分析を始めるべし。内容もかなり実用的で使える。
Posted by ブクログ 2018年08月13日
3年ほど前のプロジェクトが終わったあとに、読んでみようと買った本。
半分くらい読み進めて、そのままになってました(使う機会がない。。。)が、ちょうどまたちょこっと基本的なデータ抽出と計算で使う機会ができたので、また読み返そうと思います。といっても、本格的にはできないんだけど、何ができそうで、どれくら...続きを読むい大変かくらいは理解しておきたいので。
でもまあ、いまはPythonなのかな。もっと複雑なことできそうだし。
※18年8月追記
Posted by ブクログ 2017年09月24日
この本を読むと、SQLを本当に使いこなせれば、確かにあと10年は戦える感じがします。
postgreSQLは10年前からありましたし、そういう意味では、10年前にSQLをモノにできた人は、20年戦えた、ということなのかもしれません。
SQLの話しだけでなく、データベースの話し、データ分析全般の話...続きを読むし、最新キーワードの説明、1冊でかなり広い範囲について基本的な理解をすることができました。
遅ればせながら、やっとSQLの基本的な処理についてかかれた本を読んで、言っていることがわかりかけてきたので、ここから実地練習する動機付けになりました。
Posted by ブクログ 2021年08月08日
以下の箇所に非常に共感。
「…何年もいろいろなエンジニアを見ていてつくづく思うのですが、だいたい初心者ほどマニュアルを見ていません。熟練したエンジニアはマニュアルをよく見ます。…
たぶん、「ちゃんと確認する」というのはエンジニアとしてのスキルの一種なのです。」
これは、エンジニアに限らない話だと思...続きを読むう。原理原則に遡ることは何事も重要である。たとえば、リーガル関連。法律文や運用基準などに何と書いてあるかを読み込まない人が良いアウトプットを出せるわけがない。
以下、引用。
PostgreSQLを選択した理由は次の3つがあります。
1.誰でも無料で入手できる
2.シェアの高いOracleやSQL ServerとSQLが比較的似ている
3.多機能で、データ活用のために必要な高度な機能が揃っている
select文のことをクエリ―と呼ぶこともあります。
処理対象テーブル(from節で選択)→Where節による絞り込み→group by節によるグループ化→select節による計算→集約関数による集約→having節による絞り込み→order by節によるソート→limit節による絞り込み
もともとSQLは「コンピューターを使う人が自分でプログラミングする」というコンセプトのもとに作られました。このコンセプトをエンドユーザーコンピューティング(EUC)と言います。
最近になって、RDBMSへのデータ取り込みの新しい課題が問題になりつつあります。それは、JSON形式やXML形式を使って、カラム数や個数が不定のデータが大々的に取り込まれるようになってきたことです。
DWHとは次の4つの特徴を持ったデータベースです。
1.サブジェクトごとに編成されていること
2.データが統合されていること
3.時系列データを持つこと
4.データが永続すること
データマートは1つのサブジェクトを分析するための専用データベースで、サブジェクトごとに別々のデータマートを作成します。
非常に乱暴に言ってしまうと、DWHがデータ品質を重視して「ちゃんと」作り込みましょうというアプローチであるのに対して、データマートは「とりあえず」いま使えるものをすぐに、安く作ろうというアプローチです。
Hadoopは、Googleのシステムの影響を受けて開発された、オープンソースの分散データ処理システムです。