初心者データサイエンティストの備忘録

調べたことは全部ここに書いて自分の辞書を作る

2022-01-01から1年間の記事一覧

【読書記録】アダルト・チャイルドが自分と向きあう本

アダルト・チャイルドが自分と向きあう本作者:アスク・ヒューマン・ケア研修相談室アスク・ヒューマン・ケアAmazon 本書を手に取った理由 アダルト・チャイルドからの回復法を調べているうちに、この本にたどり着きました。 以前記事にした本との比較 以前記…

【読書記録】生きづらさの正体はアダルトチルドレン。 - その根本原因を解消し、楽な生き方を手に入れる。

生きづらさの正体はアダルトチルドレン。その根本原因を解消し、楽な生き方を手に入れる。30分で読めるシリーズ作者:梅岡幸子,MBビジネス研究班まんがびとAmazon 本書を手に取った理由 私はうつ状態になり、日常生活に支障が出ることが多々あります。 そん…

継承できないメソッド・変数

車輪の再開発ですが、Pythonにおいて継承できないメソッド・変数をまとめます。 継承できないメソッド・変数 結論からいうと、__(アンダースコアが2個)が冒頭についているメソッド・変数は継承できません。 次のスクリプトを見てみましょう。 class Parent…

【読書記録】「速習 Python3 オブジェクト指向編」~プログラミングを書く際に意識すること~

速習 Python 3 中: オブジェクト指向編作者:伊藤 裕一Amazon 本記事は「速習 Python3 オブジェクト指向編」で学んだ内容のうち、プログラミングを書く際に意識することと本書から学べなかったことをまとめました。 この記事は完全に私の備忘録なので、書きた…

【読書記録】社長の哲学

社長の哲学作者:定雄, 青木,博道, 鳥羽,秀三郎, 鍵山,博丈, 矢野致知出版社Amazon 本書を手に取った理由 仕事に向き合う自分の態度を改善するためです。 ここ最近、自分の仕事に対する心構えや志をなんとかしたほうが良いのではと思うことが多々あります。そ…

【旅行記】那須塩原・喜連川温泉(観光地編)

2022年3月下旬に栃木に行きました。今回は行って良かった観光地について書きたいと思います。 ちなみに、宿について書いた記事はこちらです。 aisinkakura-datascientist.hatenablog.com 千本松牧場 まずは千本松牧場。ここは初日に行った那須塩原のかんぽの…

【旅行記】那須塩原・喜連川温泉(宿編)

2022年3月下旬に栃木に行きました。本記事はその旅行記です。 栃木旅行については、宿と観光地に分けて書こうと思います。 今回の栃木旅行では、宿の予約がギリギリになってしまい、同じ宿に連泊できませんでした。 そのため、かんぽの宿 塩原とかんぽの宿 …

【Python】クロージャを使ったメモイズ機能についてのメモ

Pythonのクロージャについて調べていたときに、下記の記事を発見した。 www.lifewithpython.com この記事の中の以下のコードの挙動がうまく理解できなかったので、色々調べてみた。 def fibonacci_func(): """フィボナッチ数列を返す関数を返す メモイズ機能…

【旅行記】新島・式根島(3日目)

新島・式根島の3日目の旅行記です。 3日目は、式根島観光と式根島→新島→帰宅の移動がメインになりました。 (1日目と2日目の記事はこちら) aisinkakura-datascientist.hatenablog.com aisinkakura-datascientist.hatenablog.com 式根島観光 この日は、時間…

【読書記録】俺がつくる!

俺が、つくる!作者:岡野 雅行中経出版Amazon 本書を手に取った理由 基本的には「論語と算盤」のときと同じです。 aisinkakura-datascientist.hatenablog.com ですが、今回はより身近(?)な人の本を選んでみました。私は子どものころ成長ホルモンが不足して…

分割型クラスタリングの実装

記事の内容 Macnaughton Smith et al. (1965)が提案した分割型クラスタリングをPythonで実装しました。本記事では、そのスクリプトを公開します。 分割型クラスタリングとは 分割型クラスタリングの定義を例によってカステラ本から引きます。 分割型クラス…

【読書記録】論語と算盤

現代語訳 論語と算盤 (ちくま新書)作者:渋沢栄一筑摩書房Amazon 本書を手に取った理由 自分を鼓舞するためです。 仕事やりたくねー!!と思うことありませんか?私は常です。 また、かねてより大きな業績を残した人はどのような心掛けで仕事に打ち込んでいた…

【旅行記】新島・式根島(2日目)

二泊三日で行った新島・式根島の2日目の旅行記です。 2日目は、新島→式根島の移動と式根島観光がメインとなりました。 新島→式根島 新島から式根島に移動するには、新島村営の連絡船「にしき」を使います。 旅行初日は、風の影響で「にしき」が出航できま…

クラスタリング結果の評価指標【実装編】

クラスタリング結果を評価する方法を、過去2回の記事に残してきた。 また、近接性を評価する指標については、過去文献から欲しいものを見つけることができなかったので、自分自身で考えてみた。 今回の記事では、考案した指標で実際のクラスタリング結果を…

【旅行記】新島・式根島(1日目)

3月に家族で新島・式根島に旅行に行きました! 学生の頃、式根島の民宿で泊まり込みのバイトをしていましたが、家族で行くのは初めてです。 バイトをしていた民宿「清水屋」の女将さんも、ぜひ子どもに会いたいと言ってくれていたので、家族で行くことにし…

2022年3月TODOの振り返り

4月に入ってしまったが、3月に設定したTODOを達成できているか振り返りたい。 3月に設定したTODOは下記の5点である。 マンダラチャートを書く Googleアラートを設定する 毎日何かを観察し、それを会社の分報に記載する(分報は社内ツイッターみたいなも…

クラスタリング結果の評価指標【近接性指標の考察編】

前回の記事に引き続き、クラスタリングを評価する指標について考察していきます。 ↓前回の記事 aisinkakura-datascientist.hatenablog.com 今回はクラスタリングにおける「近接性」の概念について深堀し、近接性を評価する指標を提案します。 近接性の概念 …

因果関係を表現した資料を作成するためのtips

データサイエンティストとして働いていると、何らかの因果関係を表現した表や図を作成し、お客様に提示することが多い。今回は、因果関係が正しく表や図で表現されているかセルフレビューする方法について書く。 なお、この方法は最近私が気が付いたものであ…

【読書記録】インプット大全

コンサルの仕事においては、お客様のサービスに対するドメイン情報が重要である。私の場合は、このドメイン情報をなかなかキャッチアップできないことが、課題である。その課題に対する答えを求めて、インプット大全を読んだ。本記事は、インプット大全の書…

【釣行記】カマスは釣れた

「【釣行記】カサゴは釣れない」に引き続き今回は「カマスが釣れた」に関する釣行記を書く。 aisinkakura-datascientist.hatenablog.com 実は、前の記事でカサゴを釣りに行った日とカマスが釣れた日は同じである。この日は根魚狙いで釣行したため、カマス用…

【釣行記】カサゴが釣れない

先日、大学のときの友人と真鶴に釣りに行った。狙いは根魚である。しかし、本命のカサゴがあまり釣れなかったので、悔しい思いをした。そこで、今回の釣行で得られた仮説をここに記し、次回の釣行に活かそうと思う。 「カサゴが釣れる条件は何か?」というこ…

pandas.DataFrameの特定条件の行から値だけ取得する方法

pandas.DataFrameで特定条件の行から単独の値だけ取得する際にハマったことのメモ。 まずは問題設定。以下のようなスクリプトでDataFrameから一つだけ値を取り出して色々操作したい。 import pandas as pd df = pd.DataFrame( { 'key': ['K0', 'K1', 'K2', '…

E資格合格体験談

2022年第1回のE資格に合格しましたので、合格のポイントを書いておきます。この記事はE資格の認定講座に申し込む前に読んだほうが良いです。 本記事の要約 合格のポイントは下記2点です。 友達と受けるべし 認定用講座と黒本を併用すべし この2つのポイント…

Excelで縦持ちデータから横持ちデータに変換する方法

Excelで縦持ちデータを、横持ちデータに変換する方法についてのメモ。ピボットを使うと簡単だが、ピボットが使えない状態で関数を使って実現する方法を記載する。 まず、問題設定をする。図1の縦持ちデータを図2の横持ちデータに変換する。つまり、商品名と…

pandas.DataFrame.joinの右側DataFrameのキーは、indexしか指定できない

pandas.DataFrameのjoin関数で少しはまったのでメモ。 2個のpandas.DataFrameを結合しようとして下記のコードを書いた。このとき、dfとotherに共通のカラムkeyで結合しようとしたのだが、エラーを吐いてしまった。 gisted6a13740d3bf16c8608f60e28a2a316 原…

動的に条件を作ってpandas.DataFrameから値を取得する

動的に条件を作ってpandas.DataFrameから値を取得したいときがある。次の例を考えてみる。 import pandas as pd df = pd.DataFrame({ "A" : [1, 0, 1, 0], "B" : ["a", "a", "b", "b"], "C" : [1, 2, 3, 4] }) このとき、ある時は 「A == 0」、また別の時は …

【食レポ】筋肉食堂

今日は久しぶりに出社し、外食したので食レポを書こうと思う。 昼休憩中、渋谷の宮下公園をぶらぶら歩いていると、筋肉食堂の文字を発見。最近筋トレを始めたばかりなので、興味を惹かれ入ってみることにした。 kinnikushokudo.jp 入店するとマッチョな店員…

クラスタリング結果の評価指標【導入編】

いくつかの手法を用いてデータをクラスタリングをした際に、各手法を比較したいときがある。 データサイエンティストとして働いていると、事業のオペレーションや解釈のしやすさで手法を選ぶことも多い。それはそれで非常に有用で重要な観点ではあるのだが、…

numpy.ndarrayの一部の値を取得する

numpy.ndarrayの一部の値を取得したいときがある。 例えば、図1の赤枠で囲まれた範囲の値を取得することを考える。 図1:問題の例 このとき、pythonには便利な関数numpy.ix_が用意されている。 numpy.org これを使うと簡単に所望の値が取得できる。実際にや…