smart-city-predictions

System prognostyczny dedykowany dla danych inteligentnych miast

Praca inżynierska realizowana przez Michała Stawikowskiego and Witolda Merkela

Abstrakt

Celem pracy było zaprojektowanie i realizacja systemu informatycznego, który wykorzy-stuje środowiska składowania i przetwarzania danych wielkoskalowych (ang. Big Data) dopozyskiwania strumieni danych z inteligentnych miast (ang. Smart City) oraz metody uczeniamaszynowego do prognozowania na podstawie tych danych. System powinien mieć otwartąarchitekturę, która umożliwia dołączanie nowych źródeł danych oraz dołączanie nowychkomponentów, które tworzą zbiory uczące i testowe na potrzeby uczenia modeli klasyfikacyjnychi regresyjnych oraz wykonują prognozy z użyciem tych modeli. Postawione cele zostały zreali-zowane. W ramach systemu zostały zaimplementowane przykładowe komponenty pozyskiwaniadanych z różnych źródeł danych oraz ich składowanie, wykorzystujące uznane platformy BigData. Dodatkowo zostały stworzone przykładowe komponenty, które na podstawie zgroma-dzonych danych wykonują proces uczenia modeli klasyfikacyjnych i regresyjnych, a następniewyznaczają i udostępniają prognozowane wartości oraz statystyki uczenia modeli. W celuprezentacji informacji oraz wyników działania systemu zaimplementowano graficzny interfejsużytkownika. Na pracę składa się dogłębna analiza problemu, przedstawienie procesu projekto-wania systemu, opis działania stworzonych modułów, a także dokładna dokumentacja techniczna.

Przewodnik po repozytorium

data_for_ml - folder zawierający podstawowe operacje na danych. Funkcje zawarte w tym folderze służą przygotowaniu danych do uczenia maszynowego.
flask-with-auth - folder zawierający część aplikacji odpowiedzialną na graficzny interfejs użytkownika. Tutaj znajduje się baza danych użytkowników, kody .html, .css i .js odpowiedzialne za zarzadzanie poszczególnymi stronami oraz serwer w Flask.
flow_authomatization - folder zawierający funkcje odpowiedzialne za zarządzanie procesem trenowania modeli uczenia maszynowego oraz predykcji.
nifi - folder zawierający schematy wykorzystywanych przepływów w Apache NiFi.
spark_ml - zawiera funkcje tworzące modele regresyjne jak i klasyfikatory oraz dokunujące predykcji.
speed_layer - zawiera funkcje zarządzające przetwarzaniem strumieniowym oraz zapisem predykcji do Apache Cassandra.

A forecasting system dedicated to smart city data

Related tags

Overview

smart-city-predictions

Abstrakt

Przewodnik po repozytorium

Owner

Kevin Lai

Implementation in Python of the reliability measures such as Omega.

A powerful data analysis package based on mathematical step functions. Strongly aligned with pandas.

Weather Image Recognition - Python weather application using series of data

TE-dependent analysis (tedana) is a Python library for denoising multi-echo functional magnetic resonance imaging (fMRI) data

Python Project on Pro Data Analysis Track

Data collection, enhancement, and metrics calculation.

ETL flow framework based on Yaml configs in Python

Fit models to your data in Python with Sherpa.

First steps with Python in Life Sciences

The micro-framework to create dataframes from functions.

This module is used to create Convolutional AutoEncoders for Variational Data Assimilation

Employee Turnover Analysis

A Python 3 library making time series data mining tasks, utilizing matrix profile algorithms

Important dataframe statistics with a single command

Find exposed data in Azure with this public blob scanner

An Indexer that works out-of-the-box when you have less than 100K stored Documents

A multi-platform GUI for bit-based analysis, processing, and visualization

NumPy and Pandas interface to Big Data

Candlestick Pattern Recognition with Python and TA-Lib

Data Scientist in Simple Stock Analysis of PT Bukalapak.com Tbk for Long Term Investment