Porównanie systemów rekomendacji

Promotor: dr inż. Krzysztof Manuszewski

Autor: Michał Niegrzybowski - 143303

Cel pracy

  • porównanie systemów rekomendacji
    • Azure Recommendation API
    • Mahout
    • NRecoRecommender
  • analiza rozwiązań komercyjnych
  • sposoby zbierania informacji
  • ewaluacje systemów
  • sposoby poprawy jakości rekomendacji

Przykłady zastosowań systemów rekomendacji

Spotify

Allegro

Helion

IHS Markit

Google

Booking

Zagadnienia dotyczące systemów rekomendacji

Ogólne problemy związane z budową systemów rekomendacji i ich rozwiązania

  • zbieranie danych
  • analiza przypadku braku danych
  • optymalizacja
  • ewaluacja
  • ustalanie podobieństwa
    • użytkowników
    • przedmiotów

Metody gromadzenia danych

  • usage - manualna interakcja użytkownika z aplikacją
  • dwellTime
    • podejście opisane przez inżynierów z firmy Yahoo
    • opiera się na gromadzeniu danych związanych z zaangażowaniem klienta
  • mapy cieplne, czyli zbieranie danych z sensorów urządzeń elektronicznych
  • dane lokalizacyjne
  • autoryzacja poprzez wspólnego poświadczyciela uprawnień
  • śledzenie ruchów gałki ocznej
  • śledzenie ruchów myszki

Użyte technologie

  • Azure Recommendation API
  • Apache Mahout
  • NRecoRecommender

Zebrane doświadczenie i osiągnięcia

  • prowadzenia własnej strony internetowej
  • kontrybucja w projektach open source
  • podniesienie umiejętności związanych z programowaniem funkcyjnym, głównie w języku F#
  • odnotowanie napisanych artykułów w licznych zestawieniach ciekawych artykułów i dokumentacji Microsoftu
  • zastosowanie w firmie IHS Markit propozycji odnośnie systemu rekomendacji
  • zastosowanie analizy ewaluacji bazującej na semantyce otrzymywanych komentarzy w firmie IHS Markit
  • liczne oferty pracy i współpracy

Podsumowanie

  • najmniej problemów związanych ze znalezieniem potencjalnych pracowników, powinny mieć firmy, które zdecydują się na bibliotekę Mahout
  • każdy ze sposobów zbierania danych jest związany z domeną
  • po ustaleniu pewnych początkowych założeń, każdą metodę można dopasować stricto do domeny, np. DwellTime użyty w przypadku firmy Yahoo i IHS Markit

Dziękuję za uwagę