Problematyka seminarium dotyczy metod analizy danych i ich wykorzystania przede wszystkim do oceny ryzyka występującego w życiu ekonomiczno-społecznym, a także do identyfikacji czynników ryzyka, np. ryzyka bezrobocia, niewypłacalności, zakończenia działalności gospodarczej, wystąpienia zdarzenia ubezpieczeniowego.
W ramach seminarium mogą być realizowane tematy m. in. z następujących obszarów:
Problematyka seminarium obejmuje zarówno zagadnienia szeroko pojętej statystycznej analizy danych, jak i badań próbkowych oraz metod symulacyjnych. Przygotowując pracę magisterską studenci korzystać mogą zarówno z pierwotnych źródeł danych, które stanowić będą własne badania empiryczne, jak i ze źródeł wtórnych – m.in. biuletynów GUS, NBP i inne.
Potencjalnym seminarzystom proponuję następującą, przykładową problematykę prac magisterskich:
1) Zastosowanie metod statystycznych (w tym metod eksploracji danych) w analizie struktury, dynamiki wybranych zjawisk społeczno-ekonomicznych, np. w analizie rynku pracy, rynków ubezpieczeniowych.
2) Metody symulacyjne – rola, zastosowania i rozwój badań metodami Monte Carlo, generatory liczb losowych, testowanie losowości. Symulacyjne badania np. porównujące jakość metod eksploracyjnej analizy danych, badające własności estymatorów w dużych zbiorach danych.
3) Metody statystyczne a istniejące możliwości komputerowego przetwarzania danych – np. propozycja własnego modułu do analizy wyników badań.
4) Zastosowanie badania próbkowego w analizie wybranego zjawiska ekonomiczno-społecznego.
5) Problemy badań próbkowych – np. problemy niedostatecznej liczebności próby (statystyka małych obszarów), budowa operatu losowania; problemy konstrukcji kwestionariusza; rola błędów losowych i nielosowych w badaniu.
Seminarium poświęcone jest wydobywaniu wiedzy z danych (data science). Studenci mogą pisać pracę na dowolny, wybrany przez siebie temat z dziedziny nauk ekonomicznych, w którym problem badawczy jest rozwiązywany za pomocą odpowiednich metod analizy danych lub dotyczy różnych aspektów pracy z danymi. Szczególnie chętnie widziane są prace z zagadnień:
- algorytmy uczenia maszynowego i metody data mining (dla celów klasyfikacji, regresji, grupowania, redukcji wymiarowości),
- źródła i jakość danych,
- przygotowywanie danych do analizy (m.in. postępowanie w przypadku braków danych, wykrywanie i postępowanie z obserwacjami odstającymi),
- wizualizacja danych (szczególnie w środowisku R),
- symulacje komputerowe,
- fundamenty wnioskowania na podstawie danych (w tym klasyczna estymacja i weryfikacja hipotez, wnioskowanie bayesowskie, wnioskowanie na podstawie prób nieprostych).
Zakres seminarium magisterskiego obejmuje wszelkie zagadnienia teoretyczne i zastosowania empiryczne współczesnych metod analizy danych w rozwiązywaniu problemów ekonomicznych lub społecznych. Przygotowując pracę magisterską student powinien wykazać się umiejętnością analizy danych pochodzących z różnych źródeł administracyjnych i poza administracyjnych.
Praca magisterska może być także oparta na projekcie i realizacji własnego badania próbkowego, w szczególności badania reprezentacyjnego. Posługując się w szczególności metodami data mining, sztucznej inteligencji, statystycznej analizy wielowymiarowej analizowane mogą być problemy:
grupowania i klasyfikacji danych w tworzeniu profili konsumentów, segmentacji rynku, pojemności i chłonność rynku, zasięgu i pozycjonowania na rynku, analizy konkurencji, powiązań między współkupowanymi produktami
- analiza koszykowa, badania postaw i zwyczajów konsumentów oraz nastrojów i postaw społecznych, identyfikacji emocji w wypowiedziach internetowych.
Student może również połączyć własne zainteresowania, wskazać użyteczność zastosowanych technik przetwarzania danych w proponowanym zagadnieniu, w tym użyteczność zbiorów Big Data.
Zakres seminarium obejmuje wszelkie zagadnienia teoretyczne i zastosowania empiryczne współczesnych metod analizy danych w rozwiązywaniu problemów ekonomicznych lub społecznych. Przygotowując pracę magisterską student powinien wykazać się umiejętnością analizy danych pochodzących z różnych źródeł administracyjnych i poza administracyjnych, w tym ze zbiorów niestrukturyzowanych takich jak portale społecznościowe. Posługując się w szczególności metodami data mining, sztucznej inteligencji, statystycznej analizy wielowymiarowej, teorii grafów, web i tekst mining analizowane mogą być w szczególności problemy:
- grupowania i klasyfikacji danych w tworzeniu profili konsumentów, segmentacji rynku, analizy ryzyka inwestycyjnego,
- potrzeb i zwyczajów konsumentów oraz nastrojów i postaw społecznych,
- identyfikacji emocji w wypowiedziach internetowych (hejt, lajkowanie, identyfikacja fałszywych ocen, botów),
- identyfikacji spamu w korespondencji elektronicznej,
- budowy i testowania efektywności algorytmów w inwestycjach na rynku finansowym,
- budowy scoringów kredytowych.
Problematyka seminarium dotyczy wykorzystania metod statystycznych w analizie zjawisk ekonomicznych. Celem seminarium będzie nabycie umiejętności przygotowywania pracy naukowej, poszerzenie wiedzy z zakresu wybranych metod statystycznych poznanych w czasie studiów i zastosowania ich do analizowanego problemu ekonomicznego. Studenci mogą samodzielnie zaproponować temat badań lub skorzystać z podpowiedzi promotora. W zależności od wybranego problemu badawczego studenci mogą wykorzystywać w analizach empirycznych dane samodzielnie zgromadzone (badania własne) lub dane wtórne, np. bazę Diagnozy Społecznej, European Social Survey, open Worldbank data, dane instytucji pożyczkowych i wiele innych. Prace magisterskie mogą być poświęcone graficznej i analitycznej analizie struktury wybranych zjawisk społeczno-ekonomicznych, badaniu relacji między zmiennymi oraz dynamice zjawisk. W przypadku badania zależności o charakterze przyczynowym, wśród proponowanych metod statystycznych znajdują się: modele logitowe, metody analizy historii zdarzeń, modele zdarzeń konkurujących (competing risks analysis). Seminarzyści mogą się również włączyć do badań prowadzonych przez promotora, które dotyczą m.in.:
- modelowania ryzyka niewywiązania się kredytobiorcy z zobowiązań (ryzyko niewypłacalności),
- zastosowania metod analizy historii zdarzeń do zagadnień ekonomicznych, np. badanie determinant długości pozostawania klientem danej firmy,
- zastosowania modeli zdarzeń konkurujących do zagadnień ekonomicznych, np. badanie czasu do zakończenia kredytu z powodu jego spłaty lub niewypłacalności, badanie czasu trwania małżeństw ze względu na przyczynę zakończenia małżeństwa,
- determinanty ryzyka spowodowania wypadku komunikacyjnego ze względu na cechy sprawcy,
- implikacje następstwa pokoleń dla rynku ubezpieczeniowego,
- zastosowania regresji rozmytej.