Wykrywanie danych osobowych za pomocą T-sql – wersja dla ubogich
Nadchodzi nowa regulacja dotycząca ochrony danych osobowych (RODO) termin wdrożenia to maj 2018, nie ma więc wiele czasu. Regulacja wnosi wiele obostrzeń w stosunku do obecnie działających przepisów, ale i tak pracę organiczną należy zacząć od analizy danych przechowywanych na … Continued
Pyspark – podstawowe transformacje i akcje
Transformacje tworzą nowe obiekty RDD , również na podstawie innego obiektu RDD. Silnik Apache Spark potrafi przeanalizować sekwencję transformacji. Akcje wykonują na obiektach RDD działania, których wynikiem nie jest RDD i działania te wymuszają wykorzystanie definicji RDD wraz z sekwencją … Continued
Apache Spark – pierwsze początki
Poradnik: Jak uruchomić na komputerze z MS Windows lokalną instancję Apache Sparka pracującą na jednym nodzie z gotową obsługą skryptów w Pythonie (pyspark) i przykładowymi zbiorami danych. Na podstawie materiałów ze strony http://semantica.cs.lth.se/pyspark/#/pyspark-vm Dla tych, którzy na co dzień korzystają … Continued
Uczenie maszynowe według wujka Google
Część pierwsza poradnika Google w zakresie uczenia maszynowego (Machine Learning) Budowa pierwszego modelu predykcyjnego w kilku liniach kodu from sklearn import tree features = [[140,1],[130,1],[150,1],[170,0]] labels = [0,0,1,1] clf = tree.DecisionTreeClassifier() clf = clf.fit(features, labels) print(clf.predict([[160,0]])) Odpowiednik pierwszego programu “hello … Continued
Kiedy skończy się identity
To była długa bezsenna noc. Szczekające psy sąsiada, deszcz bijący o szyby pokoju. Czwarta nad ranem, gdy w końcu udało się zasnąć, komórka służbowa zaczęła dzwonić. Msg 8115, Level 16, State 1, Line 1 Arithmetic overflow error converting IDENTITY to … Continued
Jak sprawdzić czy grupa tabeli ma takie same partycje
Załóżmy, że w bazie wiele tabel partycjonowanych w ten sam sposób, ale do każdej z nich używamy schematu partycjonowania o dedykowanej nazwie. Chciali byśmy kontrolować, czy liczba partycji na tych tabelach jest taka sama i czy daty poszczególnych przedziałów funkcji … Continued
Scilab wczoraj i dziś – część 1
Historyczny wpis dotyczący pakietu Scilab opublikowany w czasopiśmie Linux Plus na przełomie 2000/2001 roku. Oprogramowanie dostępne jest na stronie http://www.scilab.org/ Co się wydarzyło do 2017 roku ? Jak pakiet odpowiedział na modę Machine Learning i Artificial Inteligence ? … Continued
Witaj, świecie!
Dawno dawno temu w odległej galaktyce…. Na ekranie komputera dowództwa. select * from sys.tables;
Uczenie maszynowe – pierwsza recenzja
Wydawałoby się ze rozwiązania chmurowe Azure i książki drukowane to dwa różne światy. Producenci usług udostępniają obszerną dokumentację w sieci, pojawiają się nowe usługi , poprawiane są istniejące, a świat drukarski biegnie swoim tempem. Z takim właśnie niepokojem zabrałem się … Continued