%matplotlib notebook


import numpy as np
from numpy import sqrt, exp, linspace, meshgrid, polyfit, polyval
from numpy.random import randn, seed
from matplotlib.pyplot import *


style.use({
    'figure.dpi': 120,
    'lines.markersize': 5
})


# lähtestame juhuslike arvude generaatori kindlasse algseisu,
# et vajadusel saaks reprodutseerida sama andmeseeria
seed(42)
n_samples = 51
x_all = linspace(0, 5, n_samples)
y_all = 1.2 * exp(-0.7 * x_all) + 0.03 * randn(n_samples)

figure(figsize=(5, 3.5))
plot(x_all, y_all, 'bo')
xlim(-0.1, 5.1)
ylim(0, 1.28)
xlabel('x')
ylabel('y')
grid()
tight_layout()
show()


x_train, x_test = x_all[0::2], x_all[1::2]
y_train, y_test = y_all[0::2], y_all[1::2]

mse = lambda u: sqrt((u**2).mean())

print('%5s %11s %8s' % ('n', 'Treening', 'Test'))
for n in range(1, 15):
    p = polyfit(x_train, y_train, n)
    print('%5d %11.4f %8.4f' % (
        n,
        mse(y_train - polyval(p, x_train)),
        mse(y_test - polyval(p, x_test))))

    n    Treening     Test
    1      0.1441   0.1318
    2      0.0481   0.0488
    3      0.0256   0.0295
    4      0.0232   0.0289
    5      0.0228   0.0288
    6      0.0228   0.0288
    7      0.0225   0.0292
    8      0.0225   0.0294
    9      0.0206   0.0329
   10      0.0206   0.0328
   11      0.0202   0.0331
   12      0.0190   0.0354
   13      0.0186   0.0376
   14      0.0184   0.0343


figure(figsize=(5, 3.5))
plot(x_train, y_train, 'bo', label='treeningandmed')
plot(x_test, y_test, 'bo', mfc='w', label='testandmed')

ξ = linspace(0, 5, 200)
for n, c in zip((1, 5, 15), ('r', 'm', 'g')):
    p = polyfit(x_train, y_train, n)
    plot(ξ, polyval(p, ξ), ls='-', color=c, label='n=%d' % n)

xlim(-0.1, 5.1)
ylim(-0.1, 1.35)
xlabel('x')
ylabel('y')
grid()
legend()
tight_layout()
show()


from sklearn.utils import check_random_state

def make_regr(hidden_layers, n_samples, n_features, activation=np.tanh, random_state=None):
    rnd = check_random_state(random_state)
    features = rnd.randn(n_samples, n_features)
    n_inputs = n_features
    X = features
    for n_outputs in hidden_layers:
        W = rnd.randn(n_inputs, n_outputs)
        b = rnd.randn(n_outputs)
        X = activation(X.dot(W) + b)
        n_inputs = n_outputs
    w = rnd.randn(n_inputs)
    b = rnd.normal()
    target = X.dot(w)+b
    return features, target

n_samples = 2000
n_features = 2

X_all, y_all = make_regr((5,5,5), n_samples=n_samples, n_features=n_features, random_state=1)
X_all *= (3, 15)
X_all += (5, 25)


from mpl_toolkits.mplot3d import Axes3D
from matplotlib import cm

def create_surface(f, x_min, x_max, y_min, y_max, resol=20):
    x = linspace(x_min, x_max, resol)
    y = linspace(y_min, y_max, resol)
    xx, yy = meshgrid(x, y)
    pairs = np.c_[np.ravel(xx), np.ravel(yy)]
    zz = f(pairs).reshape(xx.shape)
    return xx, yy, zz

def plot_3d(X, y, surface=None, view=None):
    fig = figure(figsize=(5,4))
    ax = fig.add_subplot(111, projection='3d')
    
    ax.scatter(X[:,0], X[:,1], y, marker='.', color='r')
    if surface is not None:
        ax.plot_surface(*surface, cmap=cm.rainbow, alpha=0.5, linewidth=0.25, edgecolors='black')
    
    ax.set_xlabel('$x_1$')
    ax.set_ylabel('$x_2$')
    ax.set_zlabel('y')
    if view is not None:
        ax.view_init(*view)
    tight_layout()
    show()

plot_3d(X_all, y_all, view=(15, -42))


from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X_all, y_all, train_size=0.7, random_state=1)


from sklearn.linear_model import LinearRegression

model = LinearRegression(fit_intercept = True)
model.fit(X_train, y_train)

print('Treeningandmed: R^2 = %.3f' % model.score(X_train, y_train))
print('Testandmed: R^2 = %.3f' % model.score(X_test, y_test))

Treeningandmed: R^2 = 0.638
Testandmed: R^2 = 0.629


from sklearn.metrics import mean_absolute_error

y_pred = model.predict(X_test)
print('Keskmine absoluutne viga = %.3f' % mean_absolute_error(y_test, y_pred))

Keskmine absoluutne viga = 0.280


surface = create_surface(model.predict, -3, 15, -20, 80)
plot_3d(X_all, y_all, surface, view=(15, -42))


print('Koefitsiendid =', model.coef_, '\nVabaliige =', model.intercept_)

Koefitsiendid = [-0.01919682  0.04219291] 
Vabaliige = -0.4049705750735805


from sklearn.preprocessing import StandardScaler

scaler = StandardScaler()
X_train_norm = scaler.fit_transform(X_train)
X_test_norm = scaler.transform(X_test)
X_all_norm = scaler.transform(X_all)

plot_3d(X_all_norm, y_all, view=(15, -42))


from sklearn.preprocessing import PolynomialFeatures

pf = PolynomialFeatures(degree=3, include_bias=False)
X_poly_train = pf.fit_transform(X_train_norm)
X_poly_test = pf.transform(X_test_norm)

model = LinearRegression(fit_intercept = True)
model.fit(X_poly_train, y_train)

print('Treeningandmed: R^2 = %.3f' % model.score(X_poly_train, y_train))
print('Testandmed: R^2 = %.3f' % model.score(X_poly_test, y_test))

Treeningandmed: R^2 = 0.844
Testandmed: R^2 = 0.758


surface = create_surface(lambda ξ: model.predict(pf.transform(ξ)), -3, 3, -3, 3)
plot_3d(X_all_norm, y_all, surface, view=(17, -58))


from sklearn.neural_network import MLPRegressor

model = MLPRegressor(hidden_layer_sizes=(7,4),
                     activation='tanh', solver='adam', learning_rate_init=0.0005,
                     batch_size=32, alpha=0, max_iter = 500,
                     n_iter_no_change = 10000, warm_start=True,
                     verbose=False, random_state=12)


print('%6s %11s %8s' % ('Epohh', 'Treening', 'Test'))
for n in range(20):
    model.fit(X_train_norm, y_train)
    print('%6d %11.3f %8.3f' % (
        len(model.loss_curve_),
        model.score(X_train_norm, y_train),
        model.score(X_test_norm, y_test)))

 Epohh    Treening     Test

C:\Anaconda\lib\site-packages\sklearn\neural_network\_multilayer_perceptron.py:617: ConvergenceWarning: Stochastic Optimizer: Maximum iterations (500) reached and the optimization hasn't converged yet.
  % self.max_iter, ConvergenceWarning)

   500       0.972    0.956
  1000       0.987    0.976
  1500       0.993    0.987
  2000       0.996    0.989
  2500       0.998    0.984
  3000       0.998    0.983
  3500       0.999    0.988
  4000       0.999    0.994
  4500       0.999    0.997
  5000       0.999    0.998
  5500       1.000    0.998
  6000       1.000    0.998
  6500       1.000    0.998
  7000       1.000    0.998
  7500       1.000    0.998
  8000       1.000    0.997
  8500       1.000    0.997
  9000       1.000    0.996
  9500       1.000    0.996
 10000       1.000    0.996


def plot_loss(loss):
    figure(figsize=(5,3))
    plot(loss, 'r-')
    yscale('log')
    xlim(0, len(loss) - 1)
    xlabel('Epohh')
    ylabel('Kahju')
    grid()
    tight_layout()
    show()

plot_loss(model.loss_curve_)


surface = create_surface(model.predict, -3, 3, -3, 3)
plot_3d(X_all_norm, y_all, surface, view=(20, -54))


print('Koefitsiendid =')
for ξ in model.coefs_:
    print(ξ, end='\n\n')

print('Vabaliikmed =')
for ξ in model.intercepts_:
    print(ξ)

Koefitsiendid =
[[-4.48319404e-01 -1.40029907e-01 -6.61459478e-01 -7.24004898e-04
  -4.09170299e-01  8.17050304e-01  7.60055649e-01]
 [-1.41604456e+00  2.05746494e+00 -6.71151791e-01 -1.53461140e+00
   2.53810862e-01  9.01143791e-01 -2.76964741e-01]]

[[-1.08465318 -0.09473108 -0.02509523 -1.16561222]
 [-0.44534863 -0.68280863 -1.38990878 -1.15764657]
 [ 1.36035607  0.55288129 -0.21156739  0.49021846]
 [ 0.61589187  1.77453823 -0.07926726  0.68915042]
 [ 1.12465538 -1.52412805  0.41149684  0.29743614]
 [ 1.49986904  0.55248766  0.18866784 -0.2557678 ]
 [-1.0467273   0.60294954 -3.11021522  0.97370162]]

[[-2.42363651]
 [-0.45019511]
 [-1.81338614]
 [-2.8032874 ]]

Vabaliikmed =
[-0.43814515  0.78503556  1.59417626  0.27577979  1.62665425 -1.81984421
  1.9477352 ]
[-1.59806084 -0.7494511   0.66704778  0.16199764]
[-1.02812964]


import tensorflow as tf

graph = tf.Graph()
with graph.as_default():
    features = tf.constant(X_train_norm)
    labels = tf.constant(y_train)
    weights = tf.Variable(tf.zeros((n_features,1), dtype=tf.float64))
    bias = tf.Variable(0, dtype=tf.float64)
    predictions = tf.squeeze(tf.matmul(features, weights) + bias)
    loss = tf.losses.mean_squared_error(labels, predictions)
    optimizer = tf.train.GradientDescentOptimizer(learning_rate=0.05)
    train_step = optimizer.minimize(loss)
    score = tf.reduce_mean(tf.abs(labels - predictions))    
    initializer = tf.global_variables_initializer()


with tf.Session(graph=graph) as sess:
    sess.run(initializer)
    for t in range(100):
        if t % 10 == 0: # iga 10 iteratsiooni järel
            print("epohh = %4d, kahju = %.5g" % (t, loss.eval()))
        sess.run(train_step)

    weights_value, bias_value, score_value = sess.run((weights, bias, score))

epohh =    0, kahju = 0.97162
epohh =   10, kahju = 0.34932
epohh =   20, kahju = 0.27374
epohh =   30, kahju = 0.26456
epohh =   40, kahju = 0.26345
epohh =   50, kahju = 0.26331
epohh =   60, kahju = 0.26329
epohh =   70, kahju = 0.26329
epohh =   80, kahju = 0.26329
epohh =   90, kahju = 0.26329


print('keskmine viga = %.3f' % score_value)

keskmine viga = 0.291


print('Koefitsiendid =', weights_value.squeeze(), '\nVabaliige =', bias_value)

Koefitsiendid = [-0.04770366  0.62215358] 
Vabaliige = 0.5644506508607918


N1, N2 = 4, 3 # neuronite arv esimeses ja teises peidetud kihis

graph = tf.Graph()
with graph.as_default():
    features = tf.placeholder(tf.float64, shape=(None, n_features))
    labels = tf.placeholder(tf.float64, shape=(None,))
    
    W1 = tf.Variable(tf.random.truncated_normal((n_features, N1), dtype=tf.float64))
    B1 = tf.Variable(tf.random.truncated_normal((N1,), dtype=tf.float64))
    W2 = tf.Variable(tf.random.truncated_normal((N1, N2), dtype=tf.float64))
    B2 = tf.Variable(tf.random.truncated_normal((N2,), dtype=tf.float64))
    W3 = tf.Variable(tf.random.truncated_normal((N2, 1), dtype=tf.float64))
    B3 = tf.Variable(tf.random.truncated_normal((), dtype=tf.float64))
    
    layer_out = tf.tanh(tf.matmul(features, W1) + B1)
    layer_out = tf.tanh(tf.matmul(layer_out, W2) + B2)
    predictions = tf.squeeze(tf.matmul(layer_out, W3) + B3)
    
    loss = tf.losses.mean_squared_error(labels, predictions)
    learning_rate = tf.placeholder(tf.float64, shape=())
    optimizer = tf.train.AdamOptimizer(learning_rate=learning_rate)
    train_step = optimizer.minimize(loss)
    initializer = tf.global_variables_initializer()
    
    # järgnev on vajalik R^2 arvutamise jaoks
    total_error = tf.reduce_sum(tf.square(labels - tf.reduce_mean(labels)))
    unexplained_error = tf.reduce_sum(tf.square(labels - predictions))
    score = 1 - unexplained_error / total_error


def get_batches(x, y, batch_size):
    n_samples = len(x)
    indices = np.arange(n_samples)
    np.random.shuffle(indices)
    x = x[indices]
    y = y[indices]
    start = 0
    end = start + batch_size
    while end <= n_samples:
        yield x[start:end], y[start:end]
        start = end
        end += batch_size


loss_hist = []

with tf.Session(graph=graph) as sess:
    sess.run(initializer)
    for t in range(2000):
        if t % 10 == 0:
            current_loss = loss.eval(feed_dict={features: X_train, labels: y_train})
            loss_hist.append(current_loss)
            print("epohh = %4d, kahju = %.5g" % (t, current_loss))

        for batch_x, batch_y in get_batches(X_train_norm, y_train, 32):
            sess.run(train_step,
                     feed_dict={learning_rate: 0.001, features: batch_x, labels: batch_y})
            
    score_train = score.eval(feed_dict={features: X_train_norm, labels: y_train})
    score_test = score.eval(feed_dict={features: X_test_norm, labels: y_test})
    surface = create_surface(lambda ξ: predictions.eval(feed_dict={features: ξ}), -3, 3, -3, 3)

epohh =    0, kahju = 9.0756
epohh =   10, kahju = 1.9285
epohh =   20, kahju = 0.67002
epohh =   30, kahju = 0.53727
epohh =   40, kahju = 0.48976
epohh =   50, kahju = 0.43792
epohh =   60, kahju = 0.35251
epohh =   70, kahju = 0.24459
epohh =   80, kahju = 0.18071
epohh =   90, kahju = 0.15686
epohh =  100, kahju = 0.1427
epohh =  110, kahju = 0.12576
epohh =  120, kahju = 0.10638
epohh =  130, kahju = 0.09262
epohh =  140, kahju = 0.084689
epohh =  150, kahju = 0.078894
epohh =  160, kahju = 0.074109
...
epohh = 1830, kahju = 0.0016666
epohh = 1840, kahju = 0.0016275
epohh = 1850, kahju = 0.0017753
epohh = 1860, kahju = 0.0017167
epohh = 1870, kahju = 0.0015976
epohh = 1880, kahju = 0.0017682
epohh = 1890, kahju = 0.0015915
epohh = 1900, kahju = 0.0015862
epohh = 1910, kahju = 0.0015723
epohh = 1920, kahju = 0.0016069
epohh = 1930, kahju = 0.0016546
epohh = 1940, kahju = 0.0015813
epohh = 1950, kahju = 0.0017513
epohh = 1960, kahju = 0.0016001
epohh = 1970, kahju = 0.0015371
epohh = 1980, kahju = 0.0016854
epohh = 1990, kahju = 0.001652


print('Treeningandmed: R^2 = %.3f' % score_train)
print('Testandmed: R^2 = %.3f' % score_test)

Treeningandmed: R^2 = 0.998
Testandmed: R^2 = 0.997


plot_loss(loss_hist)


plot_3d(X_all, y_all, surface, view=(15, -54))


from sklearn.datasets import make_blobs

def plot_decision_surface(X, y, model=None, scaler=None, support=False, margin=0.2, alpha=1, resol=200, cmap=cm.autumn):
    x1, x2 = X[:, 0], X[:, 1]
    x1_min, x1_max = x1.min() - margin, x1.max() + margin
    x2_min, x2_max = x2.min() - margin, x2.max() + margin
    figure(figsize=(4.5,3.5))
    if model is not None:
        if scaler is None:
            f = model.predict
        else:
            f = lambda ξ: model.predict(scaler.transform(ξ))
        surface = create_surface(f, x1_min, x1_max, x2_min, x2_max, resol=resol)
        contourf(*surface, cmap=cmap, alpha=0.5)
    scatter(x1, x2, c=y, cmap=cmap, edgecolors='k', alpha=alpha)
    if support:
        sv = model.support_vectors_
        if scaler is not None:
            sv = scaler.inverse_transform(sv)
        scatter(sv[:,0], sv[:,1], edgecolors='k', s=200, lw=1, facecolors='none');
    xlim(x1_min, x1_max)
    ylim(x2_min, x2_max)
    xlabel('$x_1$')
    ylabel('$x_2$')
    tight_layout()
    show()

X_all, y_all = make_blobs(n_samples=500, n_features=2, centers=3, cluster_std=3.5, random_state=42)

X_train, X_test, y_train, y_test = train_test_split(X_all, y_all, train_size=0.5)

scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)
X_all = scaler.transform(X_all)

plot_decision_surface(X_train, y_train)


from sklearn.neighbors import KNeighborsClassifier

model = KNeighborsClassifier(n_neighbors=21)
model.fit(X_train, y_train)

print('Täpsus treeningandmete jaoks = %.3f' % model.score(X_train, y_train))
print('Täpsus testandmete jaoks = %.3f' % model.score(X_test, y_test))

Täpsus treeningandmete jaoks = 0.956
Täpsus testandmete jaoks = 0.932


from sklearn.metrics import confusion_matrix

con_mat = confusion_matrix(y_test, model.predict(X_test))
print(con_mat)

[[76  9  0]
 [ 5 71  1]
 [ 1  1 86]]


con_mat.trace() / con_mat.sum()

0.932


plot_decision_surface(X_train, y_train, model, alpha=0.4)


model = KNeighborsClassifier(n_neighbors=1)
model.fit(X_train, y_train)

print('Täpsus treeningandmete jaoks = %.3f' % model.score(X_train, y_train))
print('Täpsus testandmete jaoks = %.3f' % model.score(X_test, y_test))

plot_decision_surface(X_train, y_train, model, alpha=0.4)

Täpsus treeningandmete jaoks = 1.000
Täpsus testandmete jaoks = 0.908


from sklearn.svm import SVC

X_all, y_all = make_blobs(n_samples=200, n_features=2, centers=3, cluster_std=2.6, random_state=42)

X_train, X_test, y_train, y_test = train_test_split(X_all, y_all, train_size=0.5)

scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)
X_all = scaler.transform(X_all)

model = SVC(kernel='linear', C=1e6)
model.fit(X_train, y_train)

print('Täpsus treeningandmete jaoks = %.3f' % model.score(X_train, y_train))
print('Täpsus testandmete jaoks = %.3f' % model.score(X_test, y_test))
plot_decision_surface(X_train, y_train, model, support=True)

Täpsus treeningandmete jaoks = 1.000
Täpsus testandmete jaoks = 0.980


from sklearn.datasets import make_circles

X_all, y_all = make_circles(n_samples=200, factor=0.5, noise=0.1, random_state=2)

X_train, X_test, y_train, y_test = train_test_split(X_all, y_all, train_size=0.5)

scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)
X_all = scaler.transform(X_all)

plot_decision_surface(X_train, y_train)


model = SVC(kernel='rbf', gamma='scale', C=1e6)
model.fit(X_train, y_train)

print('Täpsus treeningandmete jaoks = %.3f' % model.score(X_train, y_train))
print('Täpsus testandmete jaoks = %.3f' % model.score(X_test, y_test))
plot_decision_surface(X_train, y_train, model, support=True)

Täpsus treeningandmete jaoks = 1.000
Täpsus testandmete jaoks = 0.990


from sklearn.neural_network import MLPClassifier

model = MLPClassifier(hidden_layer_sizes=(5,), batch_size=8, learning_rate_init=0.0005,
                      max_iter=200, activation='relu', solver='adam', alpha=0.01,
                      n_iter_no_change = 10000, warm_start=True, random_state=42)


print('%6s %11s %8s' % ('Epohh', 'Treening', 'Test'))
for n in range(10):
    model.fit(X_train, y_train)
    print('%6d %11.3f %8.3f' % (
        len(model.loss_curve_),
        model.score(X_train, y_train),
        model.score(X_test, y_test)))

 Epohh    Treening     Test

C:\Anaconda\lib\site-packages\sklearn\neural_network\_multilayer_perceptron.py:617: ConvergenceWarning: Stochastic Optimizer: Maximum iterations (200) reached and the optimization hasn't converged yet.
  % self.max_iter, ConvergenceWarning)

   200       0.900    0.840
   400       0.910    0.900
   600       0.960    0.920
   800       0.970    0.960
  1000       0.990    0.990
  1200       1.000    0.990
  1400       1.000    0.990
  1600       1.000    1.000
  1800       1.000    1.000
  2000       1.000    1.000


plot_decision_surface(X_train, y_train, model)


from sklearn.datasets import load_digits

def show_images(images, labels, rows, cols):
    fig, axes = subplots(rows, cols, figsize=(5, 4))
    for ax, image, label in zip(axes.ravel(), images, labels):
        ax.set_axis_off()
        ax.matshow(image, cmap=cm.gray_r)
        ax.set_title('klass: %s' % str(label))

    tight_layout()
    show()

digits = load_digits()
show_images(digits.images, digits.target, 4, 5)


n_samples = len(digits.images)
X_all = digits.images.reshape(n_samples, -1)
y_all = digits.target


X_train, X_test, y_train, y_test = train_test_split(X_all, y_all, train_size=0.7)

scaler = StandardScaler()
X_train_norm = scaler.fit_transform(X_train)
X_test_norm = scaler.transform(X_test)
X_all_norm = scaler.transform(X_all)

model = SVC(kernel='rbf', gamma='scale')
model.fit(X_train_norm, y_train)

SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0,
    decision_function_shape='ovr', degree=3, gamma='scale', kernel='rbf',
    max_iter=-1, probability=False, random_state=None, shrinking=True,
    tol=0.001, verbose=False)


show_images(X_test.reshape(-1, 8, 8), model.predict(X_test_norm), 4, 5)


confusion_matrix(y_test, model.predict(X_test_norm))

array([[45,  0,  0,  0,  0,  0,  0,  0,  0,  0],
       [ 0, 47,  0,  0,  0,  0,  0,  0,  0,  0],
       [ 0,  0, 57,  0,  0,  0,  0,  1,  0,  0],
       [ 0,  0,  0, 51,  1,  0,  0,  0,  0,  0],
       [ 0,  0,  0,  0, 59,  0,  0,  1,  0,  0],
       [ 0,  0,  0,  0,  0, 54,  0,  0,  1,  2],
       [ 0,  0,  0,  0,  0,  1, 58,  0,  0,  0],
       [ 0,  0,  0,  0,  1,  0,  0, 59,  0,  0],
       [ 0,  0,  0,  0,  0,  0,  0,  0, 47,  0],
       [ 0,  0,  0,  0,  0,  0,  0,  0,  0, 55]], dtype=int64)


model.score(X_test_norm, y_test)

0.9851851851851852

Masinõpe. Scikit-Learn ja TensorFlow.¶

Sisukord

Sissejuhatus¶

Regressioon (Scikit-Learn)¶

Lineaarne regressioon¶

Polünomiaalne regressioon¶

Neuronvõrk¶

Regressioon (TensorFlow)¶

Lineaarne regressioon¶

Neuronvõrk¶

Klassifitseerimine (Scikit-Learn)¶

k-lähima naabri algoritm¶

Tugivektormasin¶

Neuronvõrk¶

Pildituvastus¶