Strona korzysta z plików cookies w celu realizacji usług i zgodnie z Polityką Plików Cookies.


26.08.2021

Firma Fortinet rozszerzyła...

Firma Fortinet rozszerzyła ofertę o usługę FortiTrust, która dołączyła do innych usług...
26.08.2021

Aplikacje biznesowe

Ready_™ AppStore
26.08.2021

Automatyzacja chmur...

Integracja z Red Hat Ansible
26.08.2021

Backup kodu źródłowego

GitProtect.io dostępny na Github
26.08.2021

Wsparcie pracy hybrydowej

Zdalny SD WAN
26.08.2021

Nowy monitor Philips 498P9Z

Nowy monitor Philips 498P9Z to model wyposażony w 49-calowy, zakrzywiony panel VA o...
26.08.2021

Wytrzymały punkt dostępowy

D-Link DIS-2650AP
26.08.2021

Ekonomiczne dyski

SSD bez DRAM
26.08.2021

Petabajty pojemności

Serwery QNAP

Usługi machine learning SQL Server

Data publikacji: 14-07-2021 Autor: Marcin Szeliga

Szybkość, z jaką przeszliśmy od mierzenia wielkości danych cyfrowych w kilobajtach (103) do megabajtów (106), gigabajtów (109), terabajtów (1012) i w końcu jottabajtów (1024), jest niewiarygodna. Teraz każdego roku generujemy więcej danych niż we wszystkich poprzednich latach, od początku historii naszego gatunku. W rezultacie dysponujemy szczegółowymi danymi dokładnie opisującymi nas samych, nasze zachowania, a także procesy biznesowe i otaczający nas świat.

 

Jednak dane jako takie są bezwartościowe. To ukryte w nich informacje są cenne. Algorytmy uczenia maszynowego automatycznie wykrywają ukryte w danych wzorce i zapisują je w postaci modeli. I chociaż historia tych algorytmów sięga lat 50. XX wieku, to na ich gwałtowny rozwój i upowszechnienie musieliśmy poczekać do przełomu wieków. Zawdzięczamy go zarówno opracowaniu nowych algorytmów uczenia maszynowego i technik ich optymalizacji, jak i zwiększeniu możliwości przechowywania i wydajnego przetwarzania danych przez komputery. W niniejszym artykule przedstawimy usługi uczenia maszynowego serwera SQL Server 2017 i 2019.

 

> JĘZYKI DANYCH

Historycznie pierwszym, i wciąż niesłychanie popularnym, językiem danych jest SQL, czyli strukturalny język zapytań. Opracowany w latach 70., w latach 90. XX wieku stał się de facto standardem i do dziś jest stosowany we wszystkich relacyjnych serwerach baz danych, a także, co ciekawe, części serwerów potocznie nazywanych NoSQL. Ten wzorowany na potocznym języku angielskim język pozwala bardzo efektow­nie przechowywać i przetwarzać duże zbiory danych – dane przechowywane są w tabelach, a do ich przetwarzania używa się zapytań.

Jednak język SQL ma też swoje ograniczenia. Jednym z nich jest brak wsparcia dla algorytmów uczenia maszynowego. O ile SQL pozwala przygotować dane, a nawet zapisać nauczone modele uczenia maszynowego i wysłać do nich zapytania predykcyjne, o tyle analiza statystyczna danych jest w nim dość trudna, a uczenie modeli – niemożliwe. Potrzebujemy do tego innych języków, takich jak Python lub R. Python jest językiem programowania ogólnego przeznaczenia, którego mocną stroną jest duża liczba dodatkowych bibliotek, w tym bibliotek wspierających przetwarzanie i analizowanie danych. Rosnące zainteresowanie programistów sztuczną inteligencją spowodowało, że dziś to Python, a nie R, jest najczęściej używanym językiem uczenia maszynowego i de facto standardowym językiem głębokiego uczenia maszynowego.

Stworzony przez Rossa Ihakę i Roberta Gentlemana, profesorów Uniwersytetu Auckland w Nowej Zelandii, język R jest otwartym i darmowym językiem analizy danych. Jego podstawową zaletą jest prawie 10-milionowa rzesza jego użytkowników. Wielu z nich udostępnia wyniki swoich prac w postaci pakietów publikowanych na stronie projektów The Comprehensive R Archive Network (cran.r-project.org), Bioconductor (bioconductor.org) oraz GitHub (github.com). Efektem jest zbiór ponad 25 tys. ogólnodostępnych bibliotek zawierających rozwiązania wszystkich typowych problemów, na jakie można natrafić, pracując z danymi.

Język R ma też swoje słabe strony – niską wydajność, brak skalowalności i, ponieważ nie jest językiem ogólnego przeznaczenia, ograniczoną integrację z narzędziami DevOps i programami klienckimi. Problemy te zostały rozwiązane przez firmy interesujące się zastosowaniem go do analizy dużych zbiorów danych, w tym Microsoft. W ramach projektu integracji języka R ze swoimi produktami Microsoft dołączył do fundacji rozwijającej go i przejął firmę Revolution Analytics – w 2015 roku wiodącego dostawcę oprogramowania i usług dla języka R. Produkty tej firmy, w tym biblioteka RevoScaleR i serwer Revolution R Enterprise, są nadal rozwijane w ramach projektów Microsoft R Open i Microsoft Machine Learning Server.

 

> SQL SERWER

 

Microsoft Machine Learning Server to wysokowydajny i skalowalny serwer języków R i Python. Jest on dostępny w kilku wersjach. Funkcjonalność wszystkich wersji serwera jest taka sama, ale każda z nich działa w innym środowisku: Windows, Linux albo Hadoop. Oraz, co jest tematem artykułu, w środowisku serwerów SQL Server 2017 i 2019.

Pod adresem bit.ly/35NOiB4 można znaleźć demonstracyjną edycję serwera SQL oraz, również darmowe, edycje Developer i Express. My będziemy potrzebować 180-dniowej edycji demonstracyjnej albo edycji Developer – edycja Express ma bardzo ograniczone wsparcie dla języków R i Python.

Po pobraniu należy uruchomić graficzny instalator serwera. Z listy możliwych operacji należy wybrać Installation, a następnie zadanie New SQL Server stand-alone installation or add features to an existing installation. Kolejne pytanie będzie dotyczyło wyboru edycji instalowanego serwera. Po jej wybraniu zostaniemy poproszeni o zaakceptowanie licencji końcowego użytkownika. W kolejnym kroku instalator sprawdzi gotowość systemu do instalacji serwera SQL Server.

Jeżeli instalator nie zawierał wszystkich potrzebnych plików, zostaną one pobrane. Kolejny test sprawdzi zgodność systemu z wymaganiami instalatora – ostrzeżenie dotyczące zapory systemowej może zostać zignorowane, jeżeli planujemy pracować z serwerem SQL lokalnie.

Następnie zostaniemy poproszeni o wybór instalowanych komponentów. Należy zaznaczyć opcję Machine Learning Services (In-Database) i dodać oba dostępne języki: Python i R. Chociaż możliwe jest zainstalowanie na tym samym komputerze również wersji Standalone serwera Microsoft Machine Learning Server, to nie jest to zalecane, gdyż każdy z tych serwerów zainstaluje swoje własne interpretatory języków R i Python oraz oddzielne zestawy bibliotek.

Jeżeli na komputerze nie ma zainstalowanych innych serwerów SQL Server, powinniśmy wybrać domyślną instancję (Default instance). Odpowiadając na kolejne pytanie instalatora, należy dodać swoje konto do grupy administratorów serwera SQL Server. Jeżeli komputer ma dostęp do internetu, pozostałych opcji instalacyjnych nie będziemy musieli zmieniać – wystarczy, że zgodzimy się na instalację języków R i Python. Sama instalacja przebiega całkowicie automatycznie.

Do pracy potrzebne nam będą jeszcze konsola SQL Server Management Studio oraz edytor pozwalający na pracę w R i Pythonie, na przykład Visual Studio Code z odpowiednimi dodatkami.

 

[...]

 

Pracownik naukowy Wyższej Szkoły Bankowej w Poznaniu Wydział Zamiejscowy w Chorzowie, jest autorem książek poświęconych analizie danych i posiada tytuł Microsoft Most Valuable Professional.

Artykuł pochodzi z miesięcznika: IT Professional

Pełna treść artykułu jest dostępna w papierowym wydaniu pisma.

.

Transmisje online zapewnia: StreamOnline

All rights reserved © 2019 Presscom / Miesięcznik "IT Professional"