Uczenie_maszynowe_dla_programistow_umapro.pdf

(1888 KB) Pobierz
Tytuł oryginału: Machine Learning for Hackers
Tłumaczenie: Przemysław Szeremiota
ISBN: 978-83-246-9816-5
© 2015 Helion S.A.
Authorized Polish translation of the English edition of Machine Learning
for Hackers 9781449303716 © 2012 Drew Conway and John Myles White.
This translation is published and sold by permission of O’Reilly Media,
Inc., which owns or controls all rights to publish and sell the same.
All rights reserved. No part of this book may be reproduced or transmitted
in any form or by any means, electronic or mechanical, including photocopying,
recording or by any information storage retrieval system, without permission
from the Publisher.
Wszelkie prawa zastrzeżone. Nieautoryzowane rozpowszechnianie całości
lub fragmentu niniejszej publikacji w jakiejkolwiek postaci jest zabronione. Wykonywanie kopii metodą
kserograficzną, fotograficzną, a także kopiowanie książki na nośniku filmowym, magnetycznym lub
innym powoduje naruszenie praw autorskich niniejszej publikacji.
Wszystkie znaki występujące w tekście są zastrzeżonymi znakami firmowymi
bądź towarowymi ich właścicieli.
Autor oraz Wydawnictwo HELION dołożyli wszelkich starań, by zawarte w tej książce informacje były
kompletne i rzetelne. Nie bierze jednak żadnej odpowiedzialności aniza ich wykorzystanie, ani za związane
z tym ewentualne naruszenie praw patentowych lub autorskich. Wydawnictwo HELION nie ponosi również
żadnej odpowiedzialności za ewentualne szkody wynikłez wykorzystania informacji zawartych w książce.
Wydawnictwo HELION
ul. Kościuszki 1c, 44-100 GLIWICE
tel. 32 231 22 19, 32 230 98 63
e-mail:
helion@helion.pl
WWW:
http://helion.pl
(księgarnia internetowa, katalog książek)
Drogi Czytelniku!
Jeżeli chcesz ocenić tę książkę, zajrzyj pod adres
http://helion.pl/user/opinie/umapro
Możesz tam wpisać swoje uwagi, spostrzeżenia, recenzję.
Printed in Poland.
Kup książkę
Poleć książkę
Oceń książkę
Księgarnia internetowa
Lubię to! » Nasza społeczność
Spis tre ci
Wst p .............................................................................................................................7
1. J zyk R .......................................................................................................................... 13
J zyk R w uczeniu maszynowym
Pobieranie i instalowanie R
Edytory plików tekstowych i rodowiska programistyczne
adowanie i instalowanie pakietów R
Podstawy R w uczeniu maszynowym
Dodatkowe materia y o R
14
16
19
20
23
36
2. Eksplorowanie danych ................................................................................................39
Analiza eksploracyjna i analiza potwierdzaj ca
Czym s dane?
Wnioskowanie o typach danych w kolumnach
Wnioskowanie o znaczeniu warto ci
Podsumowania liczbowe
rednie, mediany i dominanty
Kwantyle
Odchylenia standardowe i wariancje
Eksploracyjne wizualizacje danych
Wizualizowanie powi za pomi dzy kolumnami
39
40
43
45
46
46
48
49
52
67
3. Klasyfikacja — odsiewanie spamu ............................................................................. 73
To czy nie to? Klasyfikacja binarna
P ynne przej cie do prawdopodobie stwa warunkowego
Nasz pierwszy bayesowski klasyfikator spamu
Definiowanie i testowanie klasyfikatora
na w tpliwych wiadomo ciach tre ciwych
Testowanie klasyfikatora na wiadomo ciach wszystkich typów
Polepszanie wyników klasyfikacji
73
77
78
84
88
91
3
Kup książkę
Poleć książkę
4. Uk adanie rankingu — priorytetowa skrzynka pocztowa ........................................93
Jak uporz dkowa , nie znaj c kryterium?
Uk adanie wiadomo ci e-mail wed ug wa no ci
Cechy istotno ci wiadomo ci e-mail
Implementacja skrzynki priorytetowej
Funkcje wy uskuj ce warto ci cech
Tworzenie mechanizmu nadawania wag
Nadawanie wag na podstawie aktywno ci w w tku
Uczenie i testowanie algorytmu uk adaj cego ranking
93
94
95
99
99
106
110
115
5. Regresja — przewidywanie ods on stron ................................................................ 123
Wprowadzenie do regresji
Model wyj ciowy
Regresja z u yciem zmiennych sztucznych
Podstawy regresji liniowej
Przewidywanie odwiedzin stron WWW
Definiowanie korelacji
123
123
126
128
135
145
6. Regularyzacja — regresja tekstu .............................................................................. 149
Nieliniowe zale no ci pomi dzy kolumnami — wiat krzywych
Wst p do regresji wielomianowej
Metody zapobiegania nadmiernemu dopasowaniu
Zapobieganie nadmiernemu dopasowaniu przez regularyzacj
Regresja tekstu
Pociecha w regresji logistycznej
149
152
158
162
166
170
7. Optymalizacja — amanie szyfrów ...........................................................................175
Wprowadzenie do optymalizacji
Regresja grzbietowa
amanie szyfrów jako problem optymalizacji
175
181
185
8. Analiza g ównych sk adowych — budowanie indeksu rynku ................................ 195
Uczenie nienadzorowane
195
9. Skalowanie wielowymiarowe — uwidocznianie podobie stwa polityków .........203
Grupowanie na podstawie podobie stwa
Wprowadzenie do miar odleg o ci i skalowania wielowymiarowego
Jak si grupuj ameryka scy senatorzy?
Analiza rejestrów g osowa w Senacie (kongresy 101. – 111.)
203
204
209
210
4
Spis tre ci
Kup książkę
Poleć książkę
10. kNN — systemy rekomendacyjne.............................................................................. 219
Algorytm kNN
Dane o instalacjach pakietów j zyka R
219
224
11. Analiza grafów spo ecznych .....................................................................................229
Analiza sieci spo ecznych
My lenie grafowe
Pozyskiwanie danych do grafu spo ecznego Twittera
Praca z API us ugi SocialGraph
Analiza sieci Twittera
Lokalna struktura spo eczna
Wizualizacja pogrupowanej sieci spo ecznej Twittera w programie Gephi
W asny mechanizm rekomendacji warto ciowych twitterowiczów
229
231
233
236
241
242
246
251
12. Porównanie modeli ...................................................................................................259
SVM — maszyna wektorów no nych
Porównanie algorytmów
259
269
Bibliografia ................................................................................................................ 274
Skorowidz .................................................................................................................. 276
Spis tre ci
5
Kup książkę
Poleć książkę
Zgłoś jeśli naruszono regulamin