Résumé de section

    • Big Data: metody

      Prowadzący: Rafał Moczadło (rafal.moczadlo@gmail.com)

      Celem kursu jest zastosowanie współczesnych rozwiązań Cognitive Computing i BigData w kontekście uczenia maszynowego i sztucznej inteligencji.

      Po tym kursie będziesz potrafić:

      1. Przygotowywać środowiska informatyczne w celu realizacji projektów BigData i Machine Learning.
      2. Przygotowywać dane w celu wykorzystania ich w uczeniu maszynowym.
      3. Wykorzystywać narzędzia i stosować metody uczenia maszynowego

      Kurs przeznaczony jest dla studentów 3 roku kognitywistyki I stopnia.

    • Dodatkowe spotkanie zgodnie z głosowaniem wtorek 23.06.2020 o 13:00

    • W katalogu "instrukcje" umieściłem dwa pliki startowe FBProphet z kodem do wykorzystania na Google Colaboratory.

      W katalogu "materiały" umieściłem katalog "fb_prophet_app" z aplikacją, która tworzy rekomendacje dla danych z forecasts.db To nie jest pełna aplikacja, ale pozwala prześledzić proces od momentu pobrania danych z API Google, poprzez czyszczenie i przekształcanie danych, przeliczanie przewidywań i tworzenie rekomendacji, czyli jest to cały backend dla systemu rekomendującego decyzje na podstawie danych i szeregów czasowych.

    • W katalogu "Dane do analizy" można znaleźć plik źródłowy z danymi do analizy: Data.csv oraz data.db. Oba pliki zawierają te same dane, tylko w jednym wypadku mamy do czynienia z csv (comma separated values), w drugiem plikową bazę danych SQLight z jedną tabelą.

      Dodatkowo umieściłem bazę danych z wyliczonymi przewidywaniami dla kluczowych parametrów omawianego na zajęciach problemu. Przewidywania realizowane były przy pomocy biblioteki FBProphet. Struktura pliku powinna być znana, jeżeli ktoś zapoznał się i spróbował użyć przykładowy kod (snippet-em dla tej biblioteki).  

    • Pomocnicze

    • Żródła wiedzy

    • Świetny pod względem metodycznym kurs analizy danych. Polecam szczególnie zapoznanie się z Numpy i Pandas.

    • Polecam bardzo dobrą minispecjalizację (nanodegree):

      Data Scientist nanodegree

      Darmowa przez miesiąc, więc można sporo zrobić przy dużym samozaparciu. Zresztą kurs wart jest swojej ceny.

    • Najważniejszy podręcznik w poruszanym przez nas temacie. Naprawdę świetna książka (choć tytuł niezbyt obiecujący i nie jest najnowsza):

      Foster Provost, Tom Fawcett: Analiza danych w biznesie. Sztuka podejmowania skutecznych decyzji.

    • Webdevelopement - web framework Flask

      Framework flask pozwala na dosyć łatwe tworzenie stron internetowych za pomocą czystego Pythona z wykorzystaniem wszystkich zalet wynikających z możliwości korzystania z backendu w Pythonie.

    • Open AI gym - miejsce, gdzie można testować algorytmy w różnych środowiskach gier. Świetne miejsce, żeby poeksperymentować.