ML2024 - date333cs

ML2024

機械学習（2024）

Overleaf for LaTeX, Google Colaboratory for Python

レポートについて On_Writing_Reports

https://images-na.ssl-images-amazon.com/images/I/51CPd2KLm4L._SX342_BO1,204,203,200_.jpg

#ML2023

年明け 2025-01-07, 2025-01-21, まとめ：2025-01-28

https://gyazo.com/601150eb0684645f862de73a81f2c168

2025-01-28 第15回

https://gyazo.com/58f2ec71e1cb7b2081a1ca99b35ba131

確率分布、確率密度関数、正規分布

python

行列、ベクトル、二次形式、内積、直交行列

2025-01-21 第14回

https://gyazo.com/ff894fb7efbd399141512c573c1db099

2025-01-07 第13回

第8章混合ガウスモデルの最尤推定

https://colab.research.google.com/drive/1B5EqV1QvFLZH8Kbjp5BxLVra-qJDVjE0?usp=sharing

https://gyazo.com/574e39492a644e390602945ce666940ehttps://gyazo.com/2bf6bf3a64fe1c9c1d9bd62cd5e4213b

https://gyazo.com/89a32a25b7c44cb854079b82325833da

https://gyazo.com/796856d25aa3e193c072acbf7e888658https://gyazo.com/260166f2a8cadcc0d5132aba774093a9

https://gyazo.com/1b66c1739591642ed2c9f34ac43b0e49https://gyazo.com/dfc9cfdb00fe2ab98d119cd14a84cb8c

https://gyazo.com/b3ba6d41e6b771f3f2cafecfa6d260afhttps://gyazo.com/6dd30d13cc7dab099d11b603063ee921

2024-12-24 第12回

レポート課題2（締切 1/27月）紹介

https://gyazo.com/326a967c7798fe82d80dc1fe87c560f9

2024-12-17 第11回

第6章線形判別分析による手書き文字認識

p.90.py https://colab.research.google.com/drive/1iuK50Y99AjIyWETtgr7ikY-KcUOt3yPm?usp=sharing

https://numpy.org/doc/2.1/reference/generated/numpy.cov.html

https://gyazo.com/2133c70bad3bddfa716d7faf0e2c9a9e

https://gyazo.com/6b2fd66d7131abb21cd58a7479fcc573

第4章線形判別分析

p.63.py https://colab.research.google.com/drive/1TpQbQWvUllOrZImP5S0uh2jvXIxl2MBL?usp=sharing

https://gyazo.com/924c04842d46af22c4b99614eea263b0

2024-12-10 第10回

第4章最尤推定法

4.2 ガウスモデル

4.3 カテゴリの事後確率

https://gyazo.com/05bf5ade6453f768f4bd2376b903e033https://gyazo.com/d64e2ec71a74d941d54174828de77096

2024-12-3 第9回

第4章最尤推定法

code:p57.py

import numpy as np

import matplotlib.pyplot as plt

# 期待値 0，分散 1 の標準正規分布にしたがう標本を n 個生成．

n = 20

mu = 0.0

sigma = 1.0

xx = sigma*np.random.randn(n) + mu

mu_MLE = np.mean(xx)

sigma_MLE = np.std(xx)

def normal_pdf(x,m,s):

c = 1.0/( np.sqrt(2*np.pi)*s )

retvar = c*np.exp(-0.5*(x-m)*(x-m)/(s*s) )

return retvar

x = np.arange(-4.0, 4.0, 0.1)

y = normal_pdf(x,mu,sigma)

y_MLE = normal_pdf(x,mu_MLE,sigma_MLE)

fig=plt.figure(0)

plt.plot(x, y, color = "red", label="true")

plt.plot(x, y_MLE, color = "blue", label="estimated")

plt.legend(bbox_to_anchor=(0.99, 0.99), loc='upper right', borderaxespad=0, fontsize=14)

plt.title("n={0}".format(n))

plt.xlabel('x')

y = 0*xx

plt.scatter(xx,y, s=30, marker="x", c="blue", alpha=0.5, linewidths=2)

plt.show()

fig.savefig('fig4.3_p57.pdf')

print(mu_MLE, sigma_MLE)

print(mu, sigma)

p57.py https://colab.research.google.com/drive/1R3tIaVFmqzBvlBxiwuINDsA0Vbqvq-_2?usp=sharing

p.63.py https://colab.research.google.com/drive/1TpQbQWvUllOrZImP5S0uh2jvXIxl2MBL?usp=sharing

2024-11-26 第8回

第3章 3.2 最大事後確率則、3.3 最小誤り識別確率則、3.4 ベイズ決定則、3.5 生成モデルに基づくパターン認識

予定より遅れている。

https://gyazo.com/2ac675bf5c5dd7968878fb428dd5b865https://gyazo.com/81d60d62ea496b04e4b34e44baa707c4

https://gyazo.com/199b0731e484d91220d4c4461e61fef2https://gyazo.com/a2eb6ea3f1484ba14a187e3b5dbca6c9

今後の予定

第9回 2024-12-03 第4章最尤推定法

https://gyazo.com/274206c7b0176f561072d79fc080f060https://gyazo.com/b8a80e832dc1a820cb2f786e3832a349

第10回 2024-12-10

第11回 2024-12-17

第12回 2024-12-24

第13回 2025-01-07

第14回 2025-01-21 （1-14 は金曜時間割）

2024-11-12 第7回

https://gyazo.com/53aa6655474728e549a8d0426c2ad70dhttps://gyazo.com/8ef3127d5ee637ab131847788ce97c2b

https://gyazo.com/99426a3c8178788c1472e503e6924861https://gyazo.com/247608848c9cdfdb3fd9a77d4e73c2d5

https://gyazo.com/b699928ef09219bb52e0f1b56dcf0f5f

https://gyazo.com/95ba798fe1bf84a58026fc3f15619c5c

これならわかる応用数学教室（p.218、金谷健一著）

https://gyazo.com/3708b3a147e6c57fd2134d9581d1fcd6

https://www.nature.com/articles/381607a0

https://www.nature.com/articles/44565

https://github.com/takyamamoto/SparseCoding-OlshausenField-Model

A Visual Intro to NumPy and Data Representation

https://jalammar.github.io/images/numpy/numpy-3d-array-creation.png

The Matrix Cookbook

統計的機械学習（2024、杉山先生） https://catalog.he.u-tokyo.ac.jp/detail?code=0510091&year=2024

2024-11-05 第6回

応用数学の講義資料：2023.1.21土 13:30〜16:30 工学部 A-116

第11, 12回主成分分析

演習用リンク（Google Colab）主成分分析

https://colab.research.google.com/drive/1SSQvjE9oSM6ypcWbdapEIxlgKg7PB5z9?usp=sharing

杉山先生の教科書では $ 16 \times 16 の画像データを扱っています（digit.mat）

MNIST（広く普及されている）は $ 28 \times 28 の画像データ

https://gyazo.com/62a8e7fa7fc1b42a1e03aa0a44e79423https://gyazo.com/3781ec64c0e7c9e7b523a140b24dc036https://gyazo.com/58a7f1fe98bfeea08e02e6ee64eb9d0bhttps://gyazo.com/b362d43c53e0843001df5161a3963d66

https://gyazo.com/601f5e7baa24170b2c6e55b39b8ae08ahttps://gyazo.com/ce0fee5537d0e752bbdb42e4c0894782

https://gyazo.com/8b8d5655b837a6ea5021f69f17092085https://gyazo.com/2e06d1bfef62dd60ca0bff11c19bada9https://gyazo.com/65be82af016c860d2fbcc088c80ec370

https://gyazo.com/0dfc9cf19418b4f2bde84591a17db4ff

https://gyazo.com/fb59d390af6b6dc407be3638f9c034fc

2024-10-29 第5回

課題説明

教科書図3.2 の再構成

用語

正規直交基底

正射影

分散共分散行列

対称行列

正値対称行列

固有値・固有ベクトル

対称行列の固有値・固有ベクトル

直交行列，直交変換 (一般の回転) • 無相関

次元削減

再構成

近似のよさ

教科書などの文献を読むときの一般的な注意（清水明先生の記事をもとに改変）

科学用語の場合、「名は体を表し」ません（例：主成分分析）

漢字や英語の意味などから、科学としての意味を読み取ろうとしてはいけません。

「科学用語は単なる呼び名で、呼び名自体には意味はない」と考えておく方がいい。「本当はホニャララと呼んでもいいんだけど、かっこいい名前にした」と思っていればいい。

https://gyazo.com/b27aab790a342f2dcbacdd3a47ca8286https://gyazo.com/f4bee2b4f22406b847d9c7674fe5ed10

https://gyazo.com/9ab680fb667abb33bc0e825d5eb99bc2https://gyazo.com/44f0750fe7d916b4aecba4a72b81703d

https://gyazo.com/341f79ab5437146f0d77fef87a952ee8https://gyazo.com/cbe56b896fa51b9e031ea1d3ec131eac

パターン認識とは

与えられたデータ → 表しているものを当てる

code:p42.py

# -*- coding: utf-8 -*-

import numpy as np

import matplotlib.pyplot as plt

import scipy.io

data = scipy.io.loadmat("digit.mat")

type(data) # dict

data.keys() # dict_keys('__header__', '__version__', '__globals__', 'X', 'T')

type(data"X") # numpy.ndarray

x = data"X"

type(x) # numpy.ndarray

x.shape # (256, 500, 10)

d, n, nc = x.shape

z = x.reshape(d, n*nc)

z.shape # (256, 5000)

# 分散・共分散行列 V の計算

V = np.cov(z)

V.shape # (256, 256)

# 正定値対称行列 V の固有ベクトル・固有値の計算

eigval, eigvec = np.linalg.eig(V)

eigvec.shape # (256, 256)

eigval.shape # (256,)

# ここで固有ベクトルを固有値の大きい順に並べ替える．

index = np.argsort(eigval)::-1

eigvec = eigvec:,index

eigvec.shape # (256, 256)

e=eigvec:,0:2

e.shape # (256, 2)

X1 = x:,:,0.T # 数字1の500例．X1は 500x256 行列

X1.shape # (500, 256)

C1 = X1.dot(e) # 第1,2主成分方向の座標，500例．C1は 500x2 行列

X2 = x:,:,1.T # 数字2の500例．X2は 500x256 行列

X2.shape # (500, 256)

C2 = X2.dot(e) # 第1,2主成分方向の座標，500例．C2は 500x2 行列

C2.shape # (500, 2)

fig = plt.figure()

# fig.patch.set_facecolor(’silver’) # 背景をシルバー

# plt.subplot(1, 5, 1)

# プロット

plt.scatter(C1:,0,C1:,1,s=10, c="red",label="digit 1")

plt.scatter(C2:,0,C2:,1,s=10, c="blue",label="digit 2")

# 凡例の表示

plt.legend()

# 描画した内容を画面表示

plt.show()

plt.subplot(1, 5, 2)

X3 = x:,:,2.T # 数字3の500例．X3は 500x256 行列

img = np.reshape(X30,:,(16,16))

plt.imshow(img, cmap=plt.cm.gray_r)

plt.subplot(1, 5, 3)

e1=eigvec:,0:1 # 第1主成分

e1.shape # (256,1)

img = np.reshape(e1,(16,16))

plt.imshow(img, cmap=plt.cm.gray_r)

plt.subplot(1, 5, 4)

X23 = x:,22,4.T # 数字5の23番の例．

img = np.reshape(X23,(16,16))

plt.imshow(img, cmap=plt.cm.gray_r)

plt.subplot(1, 5, 5)

s = np.zeros(256)

for i in range(10):

a = X23.dot(eigvec:,i) # 第i主成分の重みを内積で求める．

s = s + a*eigvec:,i

img = np.reshape(s,(16,16))

plt.imshow(img, cmap=plt.cm.gray_r)

# 描画した内容を画面表示

plt.show()

code:show_digits.py

# -*- coding: utf-8 -*-

# google colab を使う場合は，下の2行をコメントアウトし．ファイルをアップロード

# from google.colab import files

# f= files.upload()

import numpy as np

import matplotlib.pyplot as plt

import scipy.io

# 手書き数字のデータをロードし、変数digitsに格納

data = scipy.io.loadmat("digit.mat")

x = data"X"

# x.shape # (256, 500, 10)

d, n, nc = x.shape

X3 = x:,:,2.T # 手書き数字3の500例．X3は 500x256 行列

fig = plt.figure()

nx=25

ny=20

# 手書き数字3の画像を縦nx枚，横ny枚ずつ，計 nx*ny 枚描画

for i in range(ny):

for j in range(nx):

plt.subplot(ny, nx, i + ny*j + 1)

plt.axis('off') # 軸は描画しない

img = np.reshape(X3i+ny*j,:,(16,16))

plt.imshow(img, cmap=plt.cm.gray_r) # 白黒を反転し描画

#plt.savefig('lots_of_3.png')

plt.savefig('lots_of_3.pdf')

plt.show() # 描画した内容を画面表示

2024-10-22

https://gyazo.com/3ce48a8e3657d57865024b3e5327d17e

https://gyazo.com/10af5e3c644407d1f5d79ab647068e1f

code:g2_pdf.py

import numpy as np

import matplotlib.pyplot as plt

def g2_pdf(x,y,mu,Sigma):

a = 1.0/(2.0*np.pi*np.sqrt(np.linalg.det(Sigma)))

v = np.array(x],[y) - mu

retvar = a*np.exp(-1.0/2.0*(v.T).dot( (np.linalg.inv(Sigma)).dot(v) ))

return retvar

mu = np.array(0],[0)

Sigma = np.array(2,1],[1,2) # 分散・共分散行列

x = np.arange(-3,3,0.1)

y = np.arange(-3,3,0.1)

nx = len(x)

ny = len(y)

z = np.zeros((nx,ny))

for i0 in range(nx):

for i1 in range(ny):

zi1,i0 = g2_pdf(xi0,yi1, mu, Sigma)

plt.figure(figsize=(3.5,3))

#plt.gray()

plt.jet()

plt.pcolor(z)

#plt.contour(z)

plt.colorbar()

plt.show()

https://gyazo.com/1454b915ee4a10018d1b25c224d88fb9

code:g2_pdf_mesh.py

import numpy as np

import matplotlib.pyplot as plt

from mpl_toolkits.mplot3d import Axes3D

def g2_pdf(x,y,mu,Sigma):

a = 1.0/(2.0*np.pi*np.sqrt(np.linalg.det(Sigma)))

v = np.array(x],[y) - mu

retvar = a*np.exp(-1.0/2.0*(v.T).dot( (np.linalg.inv(Sigma)).dot(v) ))

return retvar

mu = np.array(0],[0)

Sigma = np.array(2,1],[1,2) # 分散・共分散行列

x = np.arange(-5,5,0.2)

y = np.arange(-5,5,0.2)

nx = len(x)

ny = len(y)

z = np.zeros((nx,ny))

for i0 in range(nx):

for i1 in range(ny):

zi1,i0 = g2_pdf(xi0,yi1, mu, Sigma)

xx,yy = np.meshgrid(x,y)

plt.figure(figsize=(5, 3.5))

ax = plt.subplot(1,1,1, projection='3d')

ax.plot_surface(xx,yy,z,rstride=1,cstride=1,alpha=0.1,color='blue',edgecolor='black')

# ax.set_zticks((0,0.08))

ax.view_init(30,-30)

plt.show()

https://gyazo.com/563349ff28cc9de90cdf4c204c187fc6

演習 2.2

分散共分散行列を変化させると確率密度関数の形がどのように変化するか調べよ。

$ V = \lambda_1 \bm{e}_1\bm{e}_1^\top + \lambda_2 \bm{e}_2\bm{e}_2^\top

行列

$ V \begin{pmatrix} \bm{e}_1 & \bm{e}_2 \end{pmatrix} = \begin{pmatrix} \lambda_1 \bm{e}_1 & \lambda_2 \bm{e}_2 \end{pmatrix}

$ VP = P \Lambda

$ V = P\Lambda P^{-1}

ここで $ P^{-1} は、$ P が直交行列の場合、$ P^{\top}とかける。

$ V = \begin{pmatrix} \lambda_1 \bm{e}_1 & \lambda_2 \bm{e}_2 \end{pmatrix} \begin{pmatrix} \bm{e}_1^\top\\ \bm{e}_2^\top \end{pmatrix}

$ V = \lambda_1 \bm{e}_1\bm{e}_1^\top + \lambda_2 \bm{e}_2\bm{e}_2^\top

45度方向に傾けたければ、固有ベクトルを、そのように設定すればいい

code:xxx

mu = np.array(0],[0)

e1 = np.array(5],[1) # 任意の方向を指定

e1 = e1/np.linalg.norm(e1, ord=2) # 長さを1にする

A = np.array(0, -1],[1,0)

e2 = A.dot(e1) # e1 を90度回転

lambda1=9

lambda2=1

# Sigma = np.array(2,1],[1,2) # 分散・共分散行列

Sigma = np.concatenate(lambda1*e1, lambda2*e2, 1)

x = np.arange(-3,3,0.1)

y = np.arange(-3,3,0.1)

nx = len(x)

ny = len(y)

z = np.zeros((nx,ny))

for i0 in range(nx):

for i1 in range(ny):

zi1,i0 = g2_pdf(xi0,yi1, mu, Sigma)

plt.figure(figsize=(3.5,3))

#plt.gray()

plt.jet()

plt.pcolor(z)

#plt.contour(z)

plt.colorbar()

plt.show()

https://colab.research.google.com/github/date333cs/courses/blob/master/introduction_to_python_ad.ipynb

https://colab.research.google.com/drive/1e9qLqc3iwKt1tsIvE-TIXaoXPnpyRAl4?usp=sharing

2024-10-15

行列

https://gyazo.com/8682f42bf6b404ccccc53a72c082bc69

https://gyazo.com/788ebdfd5d05fc8649bf697e8438bdb6

https://gyazo.com/fd81740d003665927f91e61fdc769167

https://gyazo.com/581eaf9d770aae004260e62165e5c12d

https://www.nobelprize.org/prizes/physics/2024/summary/

https://gyazo.com/6eb8adf4cfbb2a3024a149b1e9e3738e

2024-10-08

独立と無相関の意味と違いについて

https://www.cc.miyazaki-u.ac.jp/date333cs/lectures/bayes/

https://gyazo.com/db2298dded5a2c29052d02e053b530bc

2024-10-01

シラバスの説明

第1章パターン認識の基礎

用語

明確には定義できない用語：「機械学習」、「パターン認識」、

「データサイエンス（数理統計学、データに基づく科学的推論の学）」

数学的に記述（定義）できる用語：「平均」、「分散」、「主成分分析」、「最尤法」、「固有ベクトル」、「固有値」

その用語が意味するところは、数式とは別で、自分で考えて納得する

理解の深さ

https://gyazo.com/5f768226d711cca917a03c0387f55611

参考書

ゼロから作るDeep Learning ❺️ —生成モデル編（斎藤康毅著）

https://www.oreilly.co.jp/books/images/picture_large978-4-8144-0059-1.jpeg

https://github.com/oreilly-japan/deep-learning-from-scratch-5