色々な勾配降下法

エンジニアリングサイエンス

なっとく！ディープラーニング作者:Andrew W.Trask翔泳社Amazon はじめに近年、ニューラルネットワークは分類精度の高さや様々なタスクへの応用が可能であることから、幅広い領域で使われています。私の場合、セキュリティ領域でニューラルネットワークを用…

#勾配降下法 #ニューラルネットワーク #Julia

2024-01-26

ニューラルネットワークのドロップアウト

エンジニアリングサイエンス

目次目次はじめにドロップアウトの概要問題設定過学習を起こすニューラルネットワークドロップアウトを入れたニューラルネットワークまとめはじめに近年、ニューラルネットワークは分類精度の高さや、様々なタスクへの応用が可能であることから、幅…

#ニューラルネットワーク #ドロップアウト #Julia

2023-10-25

【読書記録】なっとく！ディープラーニング_第6章

サイエンスエンジニアリング

目次目次はじめに勾配降下法のおさらい複数層のニューラルネットワーク誤差逆伝播一つの成分に対する更新式全ての成分に対する更新式コードに落とし込むまとめはじめに現在ニューラルネットワークは多くの分野で使われています。私の場合、セキュ…

#なっとく！ディープラーニング #Julia #誤差逆伝播 #ニューラルネットワーク

2023-10-08

【読書記録】なっとく！ディープラーニング_第5章

エンジニアリングサイエンス

なっとく！ディープラーニング作者:Andrew W.Trask翔泳社Amazon 目次目次はじめに勾配降下法のおさらい入力が複数、出力は1つのニューラルネットワーク入力が1つ、出力が複数のニューラルネットワーク入力が複数、出力も複数のニューラルネットワーク …

#なっとく！ディープラーニング #ニューラルネットワーク #勾配降下法 #Julia

2023-10-03

【読書記録】なっとく！ディープラーニング_第4章

読書記録サイエンス

なっとく！ディープラーニング作者:Andrew W.Trask翔泳社Amazon 目次目次はじめに第4章の理解の仕方勾配降下法の更新式を理解するデータが一つの場合の勾配降下法の更新式を、実際に導出する本書に書かれているコードと照らし合わせるまとめはじめに…

#なっとく！ディープラーニング #勾配降下法

2023-05-30

勾配ブースティング木を深く理解する～理論編～

サイエンス

本記事のサマリ本記事では、勾配ブースティング木の考え方について説明します。まず、最初に前向き段階的加法的モデリングと呼ばれるアルゴリズムを紹介します。次に、最急降下法と勾配ブースティング木の漸化式の関係性について説明します。最後に、これら…

#統計的機械学習の基礎 #勾配ブースティング木

2023-05-24

統計的機械学習の基礎10.9節まとめ

サイエンス

勾配ブースティングについて勉強している過程で、「統計的機械学習の基礎」の10.9節を読みました。本節は、数式も多く理解に時間がかかりました。再度本節を読んだときに、すっと頭に入ってくるように記事にまとめておきたいと思います。本記事のサマリ本…

#勾配ブースティング #統計的機械学習の基礎

2023-05-04

AdaBoostを深く理解する～アルゴリズムの内容理解～

サイエンス

サマリ本記事は、分類問題を解くための機械学習手法の一つであるAdaBoostについて解説した記事です。AdaBoostとは、機械学習の手法の中でもブースティングに分類される手法です。ブースティングとは、次の2段階からなるアルゴリズムです。前に学習した分…

#統計的機械学習の基礎 #AdaBoost

2023-04-26

sklearn.tree.DecisionTreeClassifierのccp_alphaについて

サイエンス

サマリ sklearn.tree.DecisionTreeClassifierは最初に木を成長させてから、枝刈りをするという手順で決定木を作成する。木を成長させるときは、不純度が小さくなるような頂点を新たに生成することによって行う。枝刈りは、「最弱リンク枝刈り」という手法…

#決定木 #ccp_alpha #scikit-learn

2023-03-18

区分的多項式を使った統計モデル

サイエンス

区分的多項式を使ったモデルを勉強しています。そこでの発見を書いていきたいと思います。区分的多項式とはなんぞや？イメージ区分的多項式によるモデルとは、複数の一次関数を局所的に用いることで予測精度を上げたモデルです。図1のように、細かく区切…

#区分的多項式 #統計モデル

2022-12-12

位置情報データにおける推定量の信頼性の検証手順

サイエンス

仕事で位置情報データを扱っています。その際、位置情報の生データから作成された指標（以下、推定量と呼ぶ）が、本当に正しいものなのかを検証することがあります。本記事では、その検証方法の手順を過去の論文を基にまとめたいと思います。参考にした論…

#位置情報データ #検証方法

2022-04-19

分割型クラスタリングの実装

サイエンス

記事の内容 Macnaughton Smith et al. （1965）が提案した分割型クラスタリングをPythonで実装しました。本記事では、そのスクリプトを公開します。分割型クラスタリングとは分割型クラスタリングの定義を例によってカステラ本から引きます。分割型クラス…

#Python #クラスタリング #Macnaughton #実装

2022-04-10

クラスタリング結果の評価指標【実装編】

サイエンス

クラスタリング結果を評価する方法を、過去２回の記事に残してきた。また、近接性を評価する指標については、過去文献から欲しいものを見つけることができなかったので、自分自身で考えてみた。今回の記事では、考案した指標で実際のクラスタリング結果を…

#クラスタリング #近接性 #実装

2022-04-03

クラスタリング結果の評価指標【近接性指標の考察編】

サイエンス

前回の記事に引き続き、クラスタリングを評価する指標について考察していきます。 ↓前回の記事 aisinkakura-datascientist.hatenablog.com 今回はクラスタリングにおける「近接性」の概念について深堀し、近接性を評価する指標を提案します。近接性の概念 …

#クラスタリング #近接性 #評価指標

2022-03-09

クラスタリング結果の評価指標【導入編】

サイエンス

いくつかの手法を用いてデータをクラスタリングをした際に、各手法を比較したいときがある。データサイエンティストとして働いていると、事業のオペレーションや解釈のしやすさで手法を選ぶことも多い。それはそれで非常に有用で重要な観点ではあるのだが、…

#クラスタリング #評価指標

初心者データサイエンティストの備忘録

調べたことは全部ここに書いて自分の辞書を作る

サイエンス

色々な勾配降下法

ニューラルネットワークのドロップアウト

【読書記録】なっとく！ディープラーニング_第6章

【読書記録】なっとく！ディープラーニング_第5章

【読書記録】なっとく！ディープラーニング_第4章

勾配ブースティング木を深く理解する～理論編～

統計的機械学習の基礎10.9節まとめ

AdaBoostを深く理解する～アルゴリズムの内容理解～

sklearn.tree.DecisionTreeClassifierのccp_alphaについて

区分的多項式を使った統計モデル

位置情報データにおける推定量の信頼性の検証手順

分割型クラスタリングの実装

クラスタリング結果の評価指標【実装編】

クラスタリング結果の評価指標【近接性指標の考察編】

クラスタリング結果の評価指標【導入編】