2022-03-01から1ヶ月間の記事一覧
コンサルの仕事においては、お客様のサービスに対するドメイン情報が重要である。私の場合は、このドメイン情報をなかなかキャッチアップできないことが、課題である。その課題に対する答えを求めて、インプット大全を読んだ。本記事は、インプット大全の書…
「【釣行記】カサゴは釣れない」に引き続き今回は「カマスが釣れた」に関する釣行記を書く。 aisinkakura-datascientist.hatenablog.com 実は、前の記事でカサゴを釣りに行った日とカマスが釣れた日は同じである。この日は根魚狙いで釣行したため、カマス用…
先日、大学のときの友人と真鶴に釣りに行った。狙いは根魚である。しかし、本命のカサゴがあまり釣れなかったので、悔しい思いをした。そこで、今回の釣行で得られた仮説をここに記し、次回の釣行に活かそうと思う。 「カサゴが釣れる条件は何か?」というこ…
pandas.DataFrameで特定条件の行から単独の値だけ取得する際にハマったことのメモ。 まずは問題設定。以下のようなスクリプトでDataFrameから一つだけ値を取り出して色々操作したい。 import pandas as pd df = pd.DataFrame( { 'key': ['K0', 'K1', 'K2', '…
2022年第1回のE資格に合格しましたので、合格のポイントを書いておきます。この記事はE資格の認定講座に申し込む前に読んだほうが良いです。 本記事の要約 合格のポイントは下記2点です。 友達と受けるべし 認定用講座と黒本を併用すべし この2つのポイント…
Excelで縦持ちデータを、横持ちデータに変換する方法についてのメモ。ピボットを使うと簡単だが、ピボットが使えない状態で関数を使って実現する方法を記載する。 まず、問題設定をする。図1の縦持ちデータを図2の横持ちデータに変換する。つまり、商品名と…
pandas.DataFrameのjoin関数で少しはまったのでメモ。 2個のpandas.DataFrameを結合しようとして下記のコードを書いた。このとき、dfとotherに共通のカラムkeyで結合しようとしたのだが、エラーを吐いてしまった。 gisted6a13740d3bf16c8608f60e28a2a316 原…
動的に条件を作ってpandas.DataFrameから値を取得したいときがある。次の例を考えてみる。 import pandas as pd df = pd.DataFrame({ "A" : [1, 0, 1, 0], "B" : ["a", "a", "b", "b"], "C" : [1, 2, 3, 4] }) このとき、ある時は 「A == 0」、また別の時は …
今日は久しぶりに出社し、外食したので食レポを書こうと思う。 昼休憩中、渋谷の宮下公園をぶらぶら歩いていると、筋肉食堂の文字を発見。最近筋トレを始めたばかりなので、興味を惹かれ入ってみることにした。 kinnikushokudo.jp 入店するとマッチョな店員…
いくつかの手法を用いてデータをクラスタリングをした際に、各手法を比較したいときがある。 データサイエンティストとして働いていると、事業のオペレーションや解釈のしやすさで手法を選ぶことも多い。それはそれで非常に有用で重要な観点ではあるのだが、…
numpy.ndarrayの一部の値を取得したいときがある。 例えば、図1の赤枠で囲まれた範囲の値を取得することを考える。 図1:問題の例 このとき、pythonには便利な関数numpy.ix_が用意されている。 numpy.org これを使うと簡単に所望の値が取得できる。実際にや…