初心者データサイエンティストの備忘録

調べたことは全部ここに書いて自分の辞書を作る

【深層学習】順序回帰の解説

はじめに 『深層学習』という下記の本を読んでいます。この本を読んで一発で理解できなかったことをまとめています。本記事では、順序回帰についてまとめていきます。 深層学習 改訂第2版 (機械学習プロフェッショナルシリーズ)作者:岡谷貴之講談社Amazon …

【PyTorch】畳み込み演算の次元数変化:チュートリアルの解説

はじめに PyTorchのチュートリアルPyTorch60分講座: ニューラルネットワーク入門を勉強しました。本記事では、チュートリアル記載のLeNetがどのように入力画像の次元数を変化させていくのかについてまとめようと思います。 なお、私もチュートリアルを読んで…

【Python】浅いコピー・深いコピーを図解する

はじめに Pythonの浅いコピーと深いコピーについて勉強したのでまとめようと思います。 浅いコピー・深いコピーの定義 Pythonの公式ドキュメントでは、浅いコピーと深いコピーを下記のように定義しています。 浅い (shallow) コピーと深い (deep) コピーの違…

【PyTorch】テンソルがraw majorであることの確認

はじめに ↓の過去記事で「PyTorchでは、テンソルが作成されたとき、その要素はメモリ上にraw majorと呼ばれる方式で並びます」と書きました。本記事では、テンソルの要素がraw majorで並んでいることを、各要素のメモリアドレスを見ることで確認します。 ais…

【PyTorch】viewとreshapeの違い

はじめに PyTorchには、テンソルを変形するメソッドとしてtorch.Tensor.viewとtorch.Tensor.reshapeが用意されています。本記事では、メソッドviewとreshapeの違いについてまとめます。 本記事のサマリ viewは要素が順に並んでいるときしか使えない。reshape…

【PyTorch】モデルの保存と読み込み

はじめに PyTorchのチュートリアルを勉強しています。本記事では「0. PyTorch入門」の「 7. モデルの保存・読み込み」を学んだ結果をまとめようと思います。 モデルの保存・読み込み方法 PyTorchで作成したモデルの保存・読み込み方法を図1にまとめました。…

【Python】f文字列の書式指定でハマった

はじめに Pythonのf文字列の書式指定でハマったので、記録しておきます。 ハマったこと 下記のコードでprintしたときに、想定と異なる挙動をしました。 print(f"{0.123456789: <010f}") # ->「0.123457」 と表示された 書式指定が<010fなので、左詰め・桁数…

【PyTorch】Negative Log Likelihood・Kullback Leibler距離・Cross Entropyの関係

はじめに PyTorchのチュートリアルの「0.PyTorch入門 6.最適化」に、Negative Log Likelihood(以下、NLL)という損失関数が紹介されていました。私はこの損失関数を知らなかったので、調査してみました。その結果、NLLはKullback Leibler距離(以下、KL距離…

【PyTorch】テンソルに対する勾配とヤコビ行列

はじめに PyTorchのチュートリアルを勉強しています。その中の「0. PyTorch入門 5.自動微分」で分からなかったことがあったので勉強し、まとめてみます。 わからなかったこと 「0. PyTorch入門 5.自動微分」の最後の方に「補注:テンソルに対する勾配とヤコ…

【PyTorch】nn.Moduleの形で使える理由

はじめに PyTorchのチュートリアルの「0. PyTorch入門 [4]モデル構築」を勉強しています。この中で、クラスnn.Moduleを継承する箇所があります。このnn.Moduleについて、ソースコードを読んだところ、奇妙なことに気付きました。ディレクトリの構成が図1の…

【PyTorch】one hot encodingのやり方

はじめに 統計学において、分類問題を解く際に目的変数をone hot encodingすることは多々あります。本記事では、PyTorchにおいてカテゴリカル変数をone hot encodingする方法を紹介しようと思います。 フラグが1つの場合 方法1:torch.nn.functional.one_ho…

【Python】反復可能オブジェクトと[]で値を取得できるオブジェクト

はじめに Pythonを使っていると、値を複数保持している配列を扱うことが多くあります。この配列について、for文を用いることで要素の値を取り出せるものや、[]にインデックスを与えるだけで要素の値を取り出せるものがあります。この違いを勉強したので、本…

PyTorchのcatとstackの違い

はじめに PyTorchにおいてテンソルを結合するメソッドは2種類あります。catとstackです。本記事ではこれら2種類のメソッドの違いを説明します。 catとstackの違い 結論から書くと、catは次元を増やさずにテンソルを結合します。一方で、stackは次元を増や…

畳み込みネットワークの誤差逆伝播

なっとく!ディープラーニング作者:Andrew W.Trask翔泳社Amazon はじめに 現在、画像認識は自動車の自動運転や医療機関での画像診断など幅広い分野で使われています。また、画像認識に深層学習を用いた結果、精度が飛躍的に向上しました。 画像認識で深層学…

【読書記録】「心の病」の脳科学

「心の病」の脳科学 なぜ生じるのか、どうすれば治るのか (ブルーバックス)作者:林(高木)朗子,加藤忠史講談社Amazon はじめに 私は現在、双極性障害と診断されメンタルクリニックに通っています。病気の治療を効果的に進めるには、患者自身が病気のことを…

【読書記録】<弱さ>のちから(鷲田清一)

〈弱さ〉のちから ホスピタブルな光景 (講談社学術文庫)作者:鷲田清一講談社Amazon はじめに 私はこれまで学校や会社、家庭になじめない人生を送ってきました。周りの人にとって簡単にできることが、自分にとっては難しく感じるのです。 そういった経験の積…

【読書記録】<弱さ>のちから(鷲田清一)

〈弱さ〉のちから ホスピタブルな光景 (講談社学術文庫)作者:鷲田清一講談社Amazon はじめに 私はこれまで学校や会社、家庭になじめない人生を送ってきました。周りの人にとって簡単にできることが、自分にとっては難しく感じるのです。 そういった経験の積…

色々な勾配降下法

なっとく!ディープラーニング作者:Andrew W.Trask翔泳社Amazon はじめに 近年、ニューラルネットワークは分類精度の高さや様々なタスクへの応用が可能であることから、幅広い領域で使われています。私の場合、セキュリティ領域でニューラルネットワークを用…

ニューラルネットワークのドロップアウト

目次 目次 はじめに ドロップアウトの概要 問題設定 過学習を起こすニューラルネットワーク ドロップアウトを入れたニューラルネットワーク まとめ はじめに 近年、ニューラルネットワークは分類精度の高さや、様々なタスクへの応用が可能であることから、幅…

「ハンチバック」と「普通になりたいという気持ち」

ハンチバック (文春e-book)作者:市川 沙央文藝春秋Amazon はじめに 芥川賞を受賞した「ハンチバック」を読みました。本作は、先天性ミオパチーという病気に罹患している作者、市川沙央さんによって書かれた本です。主人公も同じ病気に罹患しており、小説では…

git pushしたときに403エラーが出たときの対処法

はじめに 先日GitHubのリモートリポジトリにgit pushしようとしたら、ユーザー名とパスワードを求められました。その上、正しいと思われるユーザー名とパスワードを入力したにも関わらず、 The requested URL returned error: 403 というエラーが出ました。 …

【読書記録】なっとく!ディープラーニング_第6章

目次 目次 はじめに 勾配降下法のおさらい 複数層のニューラルネットワーク 誤差逆伝播 一つの成分に対する更新式 全ての成分に対する更新式 コードに落とし込む まとめ はじめに 現在ニューラルネットワークは多くの分野で使われています。私の場合、セキュ…

【読書記録】なっとく!ディープラーニング_第5章

なっとく!ディープラーニング作者:Andrew W.Trask翔泳社Amazon 目次 目次 はじめに 勾配降下法のおさらい 入力が複数、出力は1つのニューラルネットワーク 入力が1つ、出力が複数のニューラルネットワーク 入力が複数、出力も複数のニューラルネットワーク …

【読書記録】なっとく!ディープラーニング_第4章

なっとく!ディープラーニング作者:Andrew W.Trask翔泳社Amazon 目次 目次 はじめに 第4章の理解の仕方 勾配降下法の更新式を理解する データが一つの場合の勾配降下法の更新式を、実際に導出する 本書に書かれているコードと照らし合わせる まとめ はじめに…

pcapファイルの構造:実際にバイト列を確認してみた

目次 目次 はじめに pcapファイルの構造 pcapファイルの中身を見てみた pcapファイルの作成 バイト列を直接観測する バイト列の解釈 File Headerの中身 Packet Headerの中身 Packet Dataの中身 まとめ はじめに パケットデータを保存するファイルの一つに、p…

【読書記録】極楽征夷大将軍

極楽征夷大将軍 (文春e-book)作者:垣根 涼介文藝春秋Amazon 直木賞を取ったという完全にミーハーな理由で『極楽征夷大将軍』を読んだ。感想文を書こうと思う。 まず、長さに怯んだ。二段組で550ページ。この長さの本を読むのは久しぶりだった。しかも、読も…

【読書記録】新 企業の研究者をめざす皆さんへ

新 企業の研究者をめざす皆さんへ作者:丸山 宏近代科学社Amazon 目次 目次 はじめに 感想 本書を通じて私はどんな実践をするか まとめ 参考文献 おまけ はじめに 私事ですが、今年(2023年)の4月にコンサル部門から研究部門に異動になりました。その結果、…

【読書記録】世界のエリートがやっている最高の休息法

目次 目次 はじめに 感想 本書を通じて私はどんな実践をするか まとめ 参考文献 はじめに 突然ですが、みなさんは元気いっぱいに働いたり、遊んだりできていますか?私はできていないことが多いです。また、会社でも「やる気が出ない」「慢性的に疲れている…

【読書記録】数学文章作法

目次 目次 はじめに 感想 本書を通じて私はどんな実践をするか まとめ 参考文献 はじめに みなさん、文章を書くことは得意でしょうか?私は苦手です。数式やコードが混じった文章を書くことは、特に苦手です。しかし、データサイエンティストという仕事柄、…

Prophetインストール手順(2023年6月20日現在の情報)

サマリ 「Pythonで時系列解析用パッケージProphetを使いたいが、なぜかインストールできない」という方はいらっしゃいませんか?私がそうでした。本記事では、私がProphetをインストールしたときの手順を書きます。何かの一助になれば幸いです。 Windows上に…