アウトプット記録

いろんなことをアウトプットします

『Python実践データ分析100本ノック』やりました

2月半ばから末にかけて、やりました。

さくっと手を動かす感じならよさげです。

筆者スペック

  • 理系大卒
  • Pythonは半年程度業務でやった程度
  • データ分析・機械学習はnumpy、pandasの使い方をなんとなく知っている程度

本の内容

公式ページ

Python実践データ分析100本ノック - 秀和システム あなたの学びをサポート

データ分析の現場にあって入門書にないもの――それは、「汚いデータ」(ダーティデータ)です。本書は、データ分析の現場では、どんなデータに出会い、どのような問題が生じ、どう対応すればよいのかというノウハウを解説します。事前の加工(視覚化)から機械学習最適化問題まで、100本ノックをこなして、ビジネス現場で即戦力になれる「応用力」を身につけましょう! Pandas、Numpy、Matplotlibなど10個のライブラリを練習します。

データ分析を業務でどう使うか?どういうデータが有るのか?に重きをおいた入門書、という位置づけかと考えています。

概要

  • データ分析は可憐なものではなく泥臭い作業が殆ど

  • どうスコアを上げるか、ではなく、どんなデータをどう扱ってどこに着目するか、の大切さを学べる本です

  • 具体的な理論やアルゴリズムの技術はこの本の範囲外です

  • サクッと手を動かす入門書としてはとっかかりとしてよいのではないでしょうか。ここから好きな領域を学んで更に深堀していく、のがよいかと

章別の感想

1章

データ分析の基礎、という感じ。データ分析をかじった人なら一回くらいはやったことがあるんじゃないでしょうか。

キーワード:データの読み込み、結合、集計、matplotlibで可視化

2章

現場でありがちな「汚い」データを確認して加工する。欠損値の補完はデータを抜く、平均で埋める、とかはあるが、変わらないものだったら他のデータから補完する、という手も使える。(同じ商品単価を利用する)

2つのデータをJOINする際には違う列名でも結合できる、と。途中でデータを出力して、そこから再び分析を再開ができます。

ちなみに、こんなエラーが出るようになりました

D:\Program Files\Anaconda3\lib\site-packages\pandas\core\[indexing.py:189](http://indexing.py:189/): SettingWithCopyWarning:
A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: [http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy](http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy)
self._setitem_with_indexer(indexer, value)

pandasのSettingWithCopyWarningを理解する (1/3) - 子供の落書き帳 Renaissance

調べると結構出てくるようだ。iloc[]を使っているからかな?

キーワード:データの揺れ、クレンジング、ダンプ

3章

1,2章の復習+データ活用するための着眼点、といった感じ。

集計したデータに対して、どんな特徴があるのか、どんな傾向があるのか、を把握するためにどこに着目してどう集計すべきか、がまとまっていました。

キーワード:レフトジョイン、ジョインキー

4章

これまで加工してきたデータに基づいて、クラスタリングと線形回帰を実施しました。この章でようやく世間がイメージするデータ分析に近くなってきた印象です。

ここでのポイントとしては、

現場では、精度の高いブラックボックスのようなモデルより、精度が低くても説明可能なモデルのほうが使われることも多い

だと思いました。コンペでは多少理由がわからなくても良い結果が出ることを求めるのに対し(あくまでイメージですが)、現場ではただいい結果が出るよりは、この数値やデータに大きな影響がある、を伝えてあげることが重要なのではないでしょうか。

直感的にあの数値が影響しそう、を客観的なデータ分析で伝えてあげる、がデータサイエンティストの役目なのではないでしょうか。

キーワード:クラスタリング、K-means、主成分分析、線形回帰、LinearRegression、説明変数、目的変数、過学習、回帰予測モデル

5章

最終的には決定木を用いて、求める結果に対して予測するモデルを生成します。

ただ、決定木を使う部分は章の後半であり、やっていることも正直アルゴリズムを使って、パラメータをいじる程度です。

真骨頂としては前半部のデータの加工の流れかなと。本文中にも、

「データ分析は、データ加工が8割」とよく言われますが、実際にこのように手を動かしてみると実感できるかと思います。

とあるように、いかに使いやすいようにデータを加工できるか、がポイントであり、この本で重視している点かなと。

キーワード:カテゴリカル変数、ダミー変数化、決定木

6章

最適化問題とよくキーワードの具体的な流れや課題設定の流れを確認できました。ただ、ネットワーク可視化は小規模なのであまり有用性を感じなかったというか、それで?と思ってしまいました。

(これまでこういった手の内容を知っていなかった、というのもありますが。)

キーワード:ネットワーク可視化、NetworkX、最適化問題、目的関数、制約条件

7章

6章の輸送最適化問題を最適化計算アルゴリズムを使って解きました。

その上で、その妥当性を「あの手この手で」で確認する作業でした。

何を調査するか、確認すべきかは、現場によって異なります。最も重要なことは、結果を鵜呑みにせず、常に疑う姿勢を持って現場の業務改善に望むことです。

キーワード:pulp、ortoolpy、線形最適化

8章

この章は面白かったですね。人間関係のつながりをネットワーク的に可視化。その上で、口コミで広がっていく様子まで可視化しました。

そうしたシミュレーションを定義してやってみる、のはわかりますが、この章では実データからシミュレーションで使えるパラメータを取り出す、ことをやっていました。

「ノック78:シミュレーションのために実データからパラメータを推定しよう」は実際のデータから必要なパラメータを推測していました。この手法が他のデータではどうするか、他のパラメータではどうするか?は結構骨が折れました。しかし、ここが現場では一番の肝になりそうな部分かなと。

9章

ここからは発展編として打って変わって画像識別です。

環境構築で結構詰まって進みが悪かったです。バージョンが悪いのかなんなのか全然終わらず・・・

python-opencvでQt plugin "cocoa"が見つからないというエラー - Qiita

人型を取得するアルゴリズムを使って動画上の人の数を取得しました。結果としてはわかりやすかったですが、ノイズもあり、なかなか簡単にはいかないなと。

画像識別の流れは把握できますが、解説がサラッとしすぎているので、不完全燃焼感がありました。。。

キーワード:OpenCVHOG特徴量、Dlib

10章

アンケートデータをもとに、形態素解析によってデータ分析、最終的には類似するアンケート結果の集計まで行いました。

こちらもざっくりと概要を掴む、という感じでしたが、なかなか面白い感じでした。

キーワード:正規表現形態素解析MeCab、類似文書の検索

全体を通しての感想

「おわりに」の文章の中で以下の一文が印象に残りました。

それぞれの現場で働く担当者さんとの対話を行うなかで、より良い解を見つけていき、必要であればその都度技術を学びながら解決していく姿が、真のデータサイエンティストの姿であると言えます。

データサイエンス、は一見華麗なように見えますが、実際業務に活かす場合には泥臭い作業がほとんどだと思います。

現場の課題はなにか?理想はどこか?そのギャップはどこか?ギャップを表すためにはどうするか?ギャップを埋めるためには何が必要か?データ分析でできるか?必要なデータはあるか?などなど・・・。

そういったことを解決してようやく、さあ分析してみようか、となるはずです。(もっとも、この本の例題のように、データがあるからなんかわかることない?ということも往々にしてありそうですが。)

データサイエンティストがきれいな仕事ではなく泥臭いものだ、ということがよくわかる本でした。

伊沢拓司『勉強大全』感想

読みました。勉強記録のために始めたブログがただの読書記録になっている。。。

勉強大全 ひとりひとりにフィットする1からの勉強法

勉強大全 ひとりひとりにフィットする1からの勉強法

読むきっかけ

  • 伊沢拓司が割と好きだった
  • 受験以外でも役に立つらしく、うまく知識をみにつけるための力をつけたかった

気になったポイント

  • ホントのところ「本番で点数を取る」なんてのは、人生ベースで見ると大したことではありません。 むしろ大事なのはもうひとつの目的「目標となる大学に合格すること」、そしてその先にある「その大学で自分が何をするか」です。
  • 半ば強制的に壁が立ちはだかり、それをどう攻略するかを考えなければいけない「受験」という制度は、いつか必要になる自己分析の機会を無理矢理にでも創ってくれる、という点で価値がある。僕はそう考えています。
  • 「勉強法」とは「最短の努力で合格にたどり着くためのベクトル」のことです。
    1. 合格のためには勉強法も努力量も必要
    2. 勉強法の方向性が合っていないと、余分な努力が必要
    3. 勉強法の方向性が合っていても、努力が足りなければ合格できない
    4. 勉強法は目標との距離感を測りつつ常に見直し続けるもの
    5. 目指す目標によって、求められる勉強法は変わってくる
  • まずは、等身大の自分を確認し、すこしだけ背伸びしてみる。背伸びが板についてきたら、もう少し高く。それを繰り返し、できる範囲を少しずつ広げていった先に、成長した自分があるはずです。
  • 受験は、リスクです。人生におけるいくつもの選択肢を消し、大学に行って身を立てようというリスクを負う行為です。 決して、安全に人生を進めるための行為ではありません。消えていった選択肢のことを考え、あなたが他のことをせずに捻出した時間のことを考えた時、今進めようとしている人生の一大プロジェクトの重みを感じませんか?

感想

単なる勉強テクニックに流れるのではなく、そもそもなぜ受験するのか?からきちんと語られているのがすごく好印象で腑に落ちる説明でした。確かに今後の人生を大きく左右する出来事にはほかなりません。しかし、この時代、大学に入ったところで何も与えられませんし、なにか特別なことでもありません。(2010年代において大学の進学率は50%超で推移しています)

なのになぜ受験するのか?世間体?親からの期待?将来のため?その答えはもちろんなんだっていいはずです。しかしなにより大切なのは本人が納得して受験に取り組むこと。でないといくら勉強法を語ったところで身につかないし、役に立ちません。

「受験はリスク」とまで言う筆者ですが、同時に「受験も悪くないよ」とも言っています。これはそのとおりだと感じました。自分も振り返ってみても辛いことのほうが多かったような気がしますが、今となってはいい思い出です。(まぁ、自分の場合は受験そのものが役に立った、というよりはその先の大学生活が役に立った、というほうが正しいですが。。。)

勉強法を合格にたどり着くベクトル、と例えていましたが、これは勉強だけではなく他のことにも言えると感じました。

例えば仕事だって何らかの成果(アウトプットとも言いかえられるでしょう)を出すためには適切な方向に適切な努力が必要となります。方向がずれていれば無駄な時間や労力がかかり、いくら効率的にやっても単純にマンパワーが必要なときだってあります。一方で、間違っていたとしてもメンバーとうまく連携が取れていれば多少の修正は聞きますし、上司やクライアントによって求められるものは千差万別です。

単純に他人と比較するのではなく、あくまで自分の立ち位置、能力を見据えて、今日よりも明日、明日よりも明後日、と地に足のついた成長が大切だとも語られる本書は辛く感じてしまう受験生活を一緒になって支えてくれるバイブルになる、そう感じました。

後半はより具体的な勉強法になっていたので、ひとまずは割愛。さすがにもう国語の勉強法はそこまで重要じゃないので。。。

いやー面白かったですね。もう受験なんていらないような大人が読んでも学びがあるんじゃないかと思いました。

『インプット大全』感想

読みました。

学び効率が最大化するインプット大全

学び効率が最大化するインプット大全

まとめ

自分の興味・関心、インプットの目的や方向性を明確にすることで、膨大な情報から必要な分野を絞り込んだ上で、更にそこからエッセンス(=必要な情報)だけをインプットすることが可能となる。インプットに際してはアウトプットを前提にすることでより高い効果が期待できる。

ポイント

  • 前項で「インプットの質を高めよう」といいましたが、インプットの質を高めることを本書では「インプットの精度を高める」と表現します。ダーツの中心を狙うイメージをしてもらうと、わかりやすいと思います。(中略)そもそも「必要のない情報」は、「見ない」「接触しない」、つまり情報を「捨てる」努力が必須なのです。
  • インプットの目標があいまい。どこに向かっていいかわからない。これでは、インプットの精度が悪く、まったく自己成長が期待できないのです。勉強する場合、本を読む場合、講座を受講する場合。何か学んだり、インプットしたりするときは、必ず「方向性」と「ゴール」を設定してください。たった10秒のワークですが、インプットの精度が飛躍的に高まります。
  • 実は、何度もアウトプットしなくても、一発のインプットで記憶に残す、そんな超裏技のインプット術があります。それは、「アウトプット前提でインプットを行う」ということです。私は、アウトプット前提、略して「AZ」と呼んでいます。
  • アンテナを建てるための4つの方法
    • 興味・関心のあるキーワードを書き出す
    • 目的、テーマを明確にする
    • 自分で自分に質問する
    • アウトプット前提にする
  • 「3つ」に絞り込むことによって、「注意のアンテナ」が立ち、集中力も高まり学びの効率が最大化します。

個人的に気になったところ

  • 生のライブを観に行き、ポジティブで活気あるエネルギーを受け取る。人生を楽しく豊かにすることは、意外と簡単です。
  • 情報工学の世界では「DIKWモデル」というものがあり、「データ」「情報」「知識」「知恵」を、それぞれ下図のように定義しています。
  • 家と会社を往復する限り、会社や仕事関係以外の交友が広がることはまずありません。あなたの交友関係のコンフォートゾーン(快適領域)を出て、まだ会ったことのない人に会いに行かなくてはいけません。
  • 娯楽には2種類あります。フロー概念の提唱者であり集中力研究の世界的権威であるチクセントミハイ教授は、娯楽を「受動的娯楽」と「能動的娯楽」にわけました。

感想

  • インプットはあくまで手段であり、なんのためにインプットをするのか、したいのかを明確にする必要がある。「勉強大全 ひとりひとりにフィットする1からの勉強法 | 伊沢 拓司」でも同じような話があって、勉強法はベクトルである、という表現がすごく印象的だった。目標がある点だとすると、現時点から目標に向かって進むための最短距離がそのインプットなのか?どのようなインプットであれば正しい方向へ進むことができるか?を意識することが不可欠だと感じた。
    • 本を読む(≒なにかインプットする)前には何を身に着けたいか?なぜこれが適していると判断したか、を残しておくことにする
  • 方法論の部分ではテレビや遊びも完全に悪とはせず、使い方によっては良質なインプットになるものだと感じた。これも前項と関連するが、主体性が肝となるのではないか。ただ漫然とやるのではなく、目的のためにテレビを見たり、遊びをしたり、と目的を持ってやることで得られる成果も向上することができる
    • やることなすことに対して、一つ一つ意義を見いだせるか考えて、言語化する。
  • 学びは3つまで、は「アウトプット大全」でも語られていた。適切に3つを得るためには「いちばん大切なところはどこか?」を探す能力が必要だ。この本ではそれをやりやすくするために自分は何を学びたいか、をセミナーの前に考えておくことを推奨している。それによってスコープが定まることで、自分にとっての抽象化が容易となるではないか。
    • アウトプットに際してはもっと重要なポイントはどこか、この本の魅力はどこか、を考えてみる。

余談

  • ちょくちょく自分語りが入るのは好みが分かれそうだ。。
  • 前作でも各種資料のダウンロードが特典としてついてきて、それはそれでありがたいんだが、メールマガジンに登録されてちょっとうーんって感じだったので特典DLは迷う。
    • 今回は登録されないようだ。(解除したメールアドレスを使用したためか?)

『多動力』感想

読みました。

多動力 (NewsPicks Book) (幻冬舎文庫)

多動力 (NewsPicks Book) (幻冬舎文庫)

気になった内容

  • もはや、産業ごとの〝タテの壁〟は崩壊していくのだ。「この肩書きで一生食っていく」などと言っている人は、自分で自分のキャパシティを狭めてしまっているだけだと思う。
  • 「完璧主義者」は、何度もやり直し、一つの仕事にアリ地獄のようにハマってしまう。目指すべきは、完璧ではなく、完了だ。 目の前の仕事をサクサク終わらせ、次に行く。そして前の仕事には戻らない。「完了主義者」こそ、大量のプロジェクトを動かすことができる。
  • 10冊の流行のビジネス書を読むよりも、1冊の骨太の教養書を読もう。
  • メルマガに限らず物事を継続するためには、時間を短縮するよりも、やり方を一工夫しストレスがかからないようにすることが重要だ。
  • 大切なのは、働く時間の長さではなく、「一工夫」をすることで、リズム良く仕事を進めることだ。そして、「原液」となるものを生み出し、自分が動かなくとも、自分の分身にまで働いてもらう。結果、周りから見ると一人の人間がやっているとは思えない量の仕事を動かすことが可能になるのだ。

感想

単なる技術、知識だけではすぐ代用されてしまうため、単純に一つのことだけ詳しいだけでは勝ちはありません。プロ×プロの掛け算で価値を上げていく必要があります。(ここまではこれまで読んだような本でも散々語られていましたね。)

そのためには「多動力」を意識することが必要だ、とこの本では語っています。すなわち、やりたくないこと、自分でなくてもいいことにかける時間を減らして、自分にしかできないこと、自分がやりたいことへの時間をいかに増やすか?を追求する必要がある、と。

ここでいらない時間を減らすためには、やらない選択肢もあります。しかし、脳死的にただやらない・無心でこなす、のではなく、ひと工夫することが重要です。すぐにやめてしまうのではなくどうやったら効率的にできるか?このやり方が最善か?誰かに渡せないか?と考えるのです。そのいらない時間でも他の人には必要だったり、やめることで迷惑がかかってしまう可能性を考慮して、どうするのが自分にとって最善かを判断することが重要だと感じました。

自分を省みると、やりたくないこと、自分でも無駄だと思うものこそ、ついダラダラとやってしまいます。だからこと、代わりになるものはないか?手間を減らすにはどうするか?を常に考えることを意識します。ダラダラとやってしまう背景には「完璧主義」もあると感じました。自分がやらないと、と無意識的に思ってしまうのです。「完了主義」は意識的に実践したいスキルの1つです。

0-80と80-100は同じぐらい大変だと思うが、0-80のほうが間違いなく価値が高い 100をひとつこなすよりも80を複数のほうがいいと最近は思うようになりました。

いい意味でできるだけ楽ができるか?を考え、空いた時間で自分らしく、自分が楽しいと思えることをこなしていきたいです。

あと個人的に、

10冊の流行のビジネス書を読むよりも、1冊の骨太の教養書を読もう。

はすごい刺さりました。Kindle Unlimitedで最近読んでるNewsPicks系の本の内容は正直どれも似たりよったりだと思うんですよね。。いいものをじっくり読むことがもっと必要だなぁと感じています。。

『モチベーション革命』感想

読みました。

気になった内容

  • つまり、1年中会社勤めをするのではなく、まずは自分が生活者として生きることで、世の中の潜在的なニーズを拾ってきなさいという意図が込められているのです。時間をかけて課題を解決することよりも、課題自体を発見したり、新しく課題を定義したりすることに投資するべき時代なのです。
  • 仕事と遊びの境目がなくなる時代だからといって、好き放題やればいいというわけではありません。周囲からの信頼感を得ているからこそ、自分がより得意なことに専念する状況を作るスタートラインに立つ、ということは忘れないでいてくれると嬉しいです。いつの時代も、人は信頼がすべてです。少し話は逸れましたが、これだけはずっと変わらない社会のルールなのです。
  • そんな様子を見ながら、僕はあることを考えました。それは、人は自分にはできないこと、なし得ないことに対して、いくらでもお金を払うのだ、ということです。そして、自分にはできないことをしてくれる相手に対して、人は「ありがとう」という言葉をかけるのだと。
  • 先の見えない、この変化の時代において間違いなく言えること。それは、一見非効率に見える人間の「好き」を突き詰めて、その「好き」に共感する人が「ありがとう」とお金を払ってくれる〝偏愛・嗜好性の循環〟こそが、残っていくということです。
  • よって、自分が依存する先が一ヶ所しかないと、その一ヶ所がつぶれたときに路頭に迷うことになってしまう。変化する時代を自由に、自立して生きていくことは、何にも依存しないことではありません。むしろ依存先を一ヶ所にしぼらず、複数持つことが大事です。
  • 1、「ないものがない」時代から生きる「乾けない世代」は、上の世代に比べ、「達成」や「快楽」よりも「意味合い」「良好な人間関係」「没頭」に意味を置く世代であること。この世代だからこそ作れる「新しい価値」があるということ。 2、その「新しい価値」は、自分だけの「好き」や「歪み」から生まれやすいということ。 3、「自分だけの世界の見方」を発信すると、それが他の人にとって「新しい世界の見方」になったり、既存のモノに新しい意味を与えたりする

感想

「乾けない世代」は産まれたときから揃っているから頑張る必要がない=乾けない、達成や快楽にはあまり興味がない。それよりも自分の好きなことをやることに意味を見いだす。

世の中的にもそうで、単に課題を解決するだけでは仕事にならないし、ほとんどの課題はすでに解決されている、だからこれからは課題を解決するよりも、課題を見つけるほうが必要なスキルとなってくるでしょう。そのために「乾けない世代」の没頭する力は有効に働く、と述べています。没頭できるからこそ新しいことが見つかり、それが周りにも認められるとビジネスにつながる、と。

そして、ビジネスとは人にできないことをすることでお金を生み出すことであり、そのためには人よりもそのことを突き詰めないといけない。そしてその状況(突き詰めるための時間や立場を持つ)にもっていくために仕事での信頼感は大切です。仕事で信頼を得て、好きなことを突き詰めて、ビジネスに繋がりゆく課題や歪みを見つけてそれを仕事にする それが求められてくるのではないでしょうか?

更には一つの環境や立場に依存するのではなく、そうしたコミュニティを複数持つことの重要性も語られています。

以前、尾原さんの本(『どこでも誰とでも働ける』)を読みましたが、こちらでも仕事上の信頼感を語っていた記憶があります。仕事は信頼で成り立っているもので、信頼があるからこそ相手のことを受け入れられるし、その人の好きが確かなものとして受け入れられるのではないでしょうか。

つくづく感じていることですが、技術だけではお金は稼げません。課題を見つけること、そしてその課題に対して解決策を提案できて初めてビジネスとしてなりたっていくものだと思います。

課題を見つけるためにはトップクラスまで上り詰めるか、ミドルクラスだとしても複数の分野に詳しくなって掛け合わせるか、のどちらかが有効なのではと考えています。現状、私が突き詰められるほどの好みや強みがあるかというと即答はできません。そのため最近は複数分野に詳しくなれるよう色々手広くやってみようと画策中です。

余談

ただ、これタイトルもうちょっとどうにかならなかったのですかね。。。どうモチベーションを上げるか、みたいな本かと思ったら世代間のモチベーションの違い=モチベーション革命、ということらしく、わからなくはないけど、うーーんみたいな感じです。

機械学習・ディープラーニングの良書まとめてみた

はじめに

機械学習ディープラーニングには興味があったものの、プログラミングにコンプレックスがあったので、なかなか手が出せずにいました。しかし、去年下半期にPyQを一通りこなし、仕事でも多少プログラミングをするようになったこともあり、そろそろその分野の勉強を始めたいな、と。

勉強手段には色々ありますが、書籍は最低限のクオリティは保証されており、体系的に知識を得ることができるため、有用なものといえるでしょう。とはいえ本の中でもクオリティには差があると思います。そのクオリティを確かめるために、レビューを参考にする方は多いと思いますが、一体誰を信じればいいのでしょうか。この人とは価値観が合う、この人みたいになりたい、というものがあればその人のおすすめを参考にすればいいと思いますが、知識がない状況ではどの人を信用していいかもわからないと思います。

そこで考えました、多くの記事で紹介されているものならばある程度の質は担保されているのではないかと。多くの人に読まれている、はそれだけで意味があると思っています。多くの人が読んでいるからこそ共通言語として扱われているようなものもあると思いますし、疑問点も解決する可能性が高い。

ということで「おすすめ」「入門」「良書」とかで検索したいくつかの記事の中で、複数の記事に紹介されているものをまとめました。

余談

ここまで書いてまとめてから思ったのですが、こういう本を読むことはあくまで目的を達成するための「手段」です。なんとなく機械学習やってみたいなーと思ってなんの本読もうかなーぐらいの軽いモチベーションで始めてしまいましたが、本来はやりたいこと(=「目的」)に最短距離で到達できる可能性が高い手段、がその人にとっての「良い本」であるはずです。

そもそも、機械学習そのものも手段です。何らかのデータ(数値、自然言語、画像、、、etc)に対して分析や解析をするためのイチ手法でしかないと思います。

そのため自分がやっていることは、志望校も受ける教科も決まっていないのに、おすすめの参考書をまとめてみたようなものです。

ただ、お蔵入りしても仕方ないですし、その本自体の評価を検討する上ではある程度意味があることだとは思うので、まとめてみました。

注意事項

  • 機械学習の活用分野については考慮していません。 大まかな「機械学習」というくくりでやっているため、自然言語処理がやりたい!Kaggleで勝ちたい!と目的が明確な人はその目的に合わせて必要なところだけピックアップしてもらえればと思います
  • 実際の内容については考慮していません。 合う、合わないは個人によるものが大きいと思いますので、立ち読み等で確認することを勧めます。
  • カテゴリの判断基準はありません。 こちらの記事に従っていますが、含まれないものは私の独断と偏見でいれています。
  • 並び順に意味はありません。 カテゴリ内で言及記事数が多いものは先に書いてあります。
  • 参考記事の選定理由に深い意図はありません。 他におすすめなものがあれば教えていただけると幸いです。
  • 抜け漏れ・確認不足あるかもしれません。 あったらすみません。

参考記事一覧

投票(投票_1~3で表記)

  1. ディープラーニング関連オススメ書籍TOP20&テーマ別38冊を紹介! | AI専門ニュースメディア AINOW
  2. 『Qiitaユーザーが選ぶ、2019年に読んで良かった技術書』アンケート結果発表 - Qiita Zine
  3. ITエンジニア本大賞 2020年2019年2018年

個人(個人_1~6で表記)

  1. 自然言語処理を学ぶ推薦書籍 - 首都大学東京 自然言語処理研究室(小町研)
  2. 実務の専門家として機械学習や統計分析を手掛けたい人にオススメの書籍初級5冊&中級8冊+テーマ別11冊(2020年2月版) - 渋谷駅前で働くデータサイエンティストのブログ
  3. Pythonを学ぶときに読むべき本2020年版 - 初心者からプロになるために - Lean Baseball
  4. 一から始める機械学習(機械学習概要) - Qiita
  5. 【保存版・初心者向け】僕が本気でオススメするPythonと機械学習の良書12選 - Qiita
  6. 数学に強いエンジニアむけの機械学習勉強法 - 飯田勇人 - Medium

企業(企業_1~3で表記)

  1. 初心者向け!機械学習を学ぶのにおすすめの本10選 | TechAcademyマガジン
  2. 機械学習本おすすめ6選【入門者〜上級者までレベル別に紹介】 | 侍エンジニア塾ブログ(Samurai Blog) - プログラミング入門者向けサイト
  3. 【2020年版】AI(人工知能)プログラミングを初心者から学ぶためのおすすめ本12選|Kredo Blog

結果

3記事以上で言及されていたものをまとめました。書籍のあとの()内は言及した記事です。

【入門編】

機械学習入門 ボルツマン機械学習から深層学習まで

機械学習入門 ボルツマン機械学習から深層学習まで

  • 作者:大関真之
  • 出版社/メーカー: オーム社
  • 発売日: 2016/12/01
  • メディア: 単行本(ソフトカバー)
投票_1,投票_3,企業_1

見て試してわかる機械学習アルゴリズムの仕組み 機械学習図鑑

見て試してわかる機械学習アルゴリズムの仕組み 機械学習図鑑

投票_3,個人_2,個人_3,個人_6

投票_1,個人_5,企業_2

投票_1,個人_5,企業_2

【実装・実践編】

ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装

ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装

投票_1,投票_2,個人_4,個人_5,企業_3

投票_1,投票_2,個人_5,企業_1,企業_3

投票_1,個人_1,個人_5,企業_2,企業_3

PythonとKerasによるディープラーニング

PythonとKerasによるディープラーニング

投票_1,個人_5,企業_3

scikit-learnとTensorFlowによる実践機械学習

scikit-learnとTensorFlowによる実践機械学習

投票_1,個人_2,個人_5

Kaggleで勝つデータ分析の技術

Kaggleで勝つデータ分析の技術

投票_3,個人_2,個人_3

【プログラミング編】

独学プログラマー Python言語の基本から仕事のやり方まで

独学プログラマー Python言語の基本から仕事のやり方まで

投票_1,投票_2,投票_3,個人_3,企業_3

【数学・理論編】

投票_1,投票_3,企業_1,企業_3

パターン認識と機械学習 上

パターン認識と機械学習 上

パターン認識と機械学習 下 (ベイズ理論による統計的予測)

パターン認識と機械学習 下 (ベイズ理論による統計的予測)

投票_1,企業_1,企業_2

ITエンジニアのための機械学習理論入門

ITエンジニアのための機械学習理論入門

投票_1,企業_1,個人_1,)

【ビジネス利用編】

仕事ではじめる機械学習

仕事ではじめる機械学習

投票_1,個人_2,個人_3,企業_1

終わりに

だいたいこういう記事は読んで満足感でちゃうので、買ってやっていこうと思います。

そもそもKaggle本を買おうとして、他にどんなのがいいかなーと思って調べ始めたので、うまく網羅できるように買っていこうかなと。。

あたりかなぁ。。