初心者データサイエンティストの備忘録

調べたことは全部ここに書いて自分の辞書を作る

2022-03-01から1ヶ月間の記事一覧

【読書記録】インプット大全

コンサルの仕事においては、お客様のサービスに対するドメイン情報が重要である。私の場合は、このドメイン情報をなかなかキャッチアップできないことが、課題である。その課題に対する答えを求めて、インプット大全を読んだ。本記事は、インプット大全の書…

【釣行記】カマスは釣れた

「【釣行記】カサゴは釣れない」に引き続き今回は「カマスが釣れた」に関する釣行記を書く。 aisinkakura-datascientist.hatenablog.com 実は、前の記事でカサゴを釣りに行った日とカマスが釣れた日は同じである。この日は根魚狙いで釣行したため、カマス用…

【釣行記】カサゴが釣れない

先日、大学のときの友人と真鶴に釣りに行った。狙いは根魚である。しかし、本命のカサゴがあまり釣れなかったので、悔しい思いをした。そこで、今回の釣行で得られた仮説をここに記し、次回の釣行に活かそうと思う。 「カサゴが釣れる条件は何か?」というこ…

pandas.DataFrameの特定条件の行から値だけ取得する方法

pandas.DataFrameで特定条件の行から単独の値だけ取得する際にハマったことのメモ。 まずは問題設定。以下のようなスクリプトでDataFrameから一つだけ値を取り出して色々操作したい。 import pandas as pd df = pd.DataFrame( { 'key': ['K0', 'K1', 'K2', '…

E資格合格体験談

2022年第1回のE資格に合格しましたので、合格のポイントを書いておきます。この記事はE資格の認定講座に申し込む前に読んだほうが良いです。 本記事の要約 合格のポイントは下記2点です。 友達と受けるべし 認定用講座と黒本を併用すべし この2つのポイント…

Excelで縦持ちデータから横持ちデータに変換する方法

Excelで縦持ちデータを、横持ちデータに変換する方法についてのメモ。ピボットを使うと簡単だが、ピボットが使えない状態で関数を使って実現する方法を記載する。 まず、問題設定をする。図1の縦持ちデータを図2の横持ちデータに変換する。つまり、商品名と…

pandas.DataFrame.joinの右側DataFrameのキーは、indexしか指定できない

pandas.DataFrameのjoin関数で少しはまったのでメモ。 2個のpandas.DataFrameを結合しようとして下記のコードを書いた。このとき、dfとotherに共通のカラムkeyで結合しようとしたのだが、エラーを吐いてしまった。 gisted6a13740d3bf16c8608f60e28a2a316 原…

動的に条件を作ってpandas.DataFrameから値を取得する

動的に条件を作ってpandas.DataFrameから値を取得したいときがある。次の例を考えてみる。 import pandas as pd df = pd.DataFrame({ "A" : [1, 0, 1, 0], "B" : ["a", "a", "b", "b"], "C" : [1, 2, 3, 4] }) このとき、ある時は 「A == 0」、また別の時は …

【食レポ】筋肉食堂

今日は久しぶりに出社し、外食したので食レポを書こうと思う。 昼休憩中、渋谷の宮下公園をぶらぶら歩いていると、筋肉食堂の文字を発見。最近筋トレを始めたばかりなので、興味を惹かれ入ってみることにした。 kinnikushokudo.jp 入店するとマッチョな店員…

クラスタリング結果の評価指標【導入編】

いくつかの手法を用いてデータをクラスタリングをした際に、各手法を比較したいときがある。 データサイエンティストとして働いていると、事業のオペレーションや解釈のしやすさで手法を選ぶことも多い。それはそれで非常に有用で重要な観点ではあるのだが、…

numpy.ndarrayの一部の値を取得する

numpy.ndarrayの一部の値を取得したいときがある。 例えば、図1の赤枠で囲まれた範囲の値を取得することを考える。 図1:問題の例 このとき、pythonには便利な関数numpy.ix_が用意されている。 numpy.org これを使うと簡単に所望の値が取得できる。実際にや…