Oferta dydaktyczna Instytutu Informatyki

Poniższa lista przedstawia przedmioty, które są uczone w Instytucie Informatyki, niektóre z nich co roku, niektóre z mniejszą częstotliwością Każdy student Instytutu Informatyki studiuje wg indywidualnego toku studiów, wybierając (zgodnie z pewnymi zasadami) z tej listy swoje przedmioty.

Jeżeli zastanawiasz się nad studiami u nas, jeżeli chcesz wiedzieć, czy na Uniwersytecie można zostać inżynierem, jeżeli interesuje Cię 1000 zł stypendium miesięcznie - zapraszamy na naszą stronę główną

Text mining

Nazwa angielska (title in English): Text mining
Prowadzący (lecturer): Paweł Rychlikowski
Liczba punktów (ECTS): 9
Liczba punktów 2007 (ECTS since 2007): 6
Rodzaj (type): zaawansowany
Rodzaj od 2007 (type since 2007): informatyczny.I2
Liczba godzin (hours in semester):
wykład:30
ćwiczenia+pracownia:30
Egzamin (exam): tak
Możliwe zajęcia w języku angielskim (can be taught in English): nie
Przedmiot zostal uaktualniony na biezacy rok (updated): nie
Semestr (semester): letni

Wymagania (prerequisites)

Opis (description)

Text mining jest dziedziną, w której zajmujemy się eksploracją tekstów napisanych w języku naturalnym (takim jak polski, czy angielski). Znajduje się ona na przecięciu wyszukiwania informacji, eksploracji danych oraz przetwarzania języka naturalnego. Z racji tego, że coraz więcej danych jest dostępnych w takiej postaci, text mining ma coraz większe znaczenie.

Na wykładzie szczególny nacisk będzie położony na praktyczne aspekty tej dziedziny, co między innymi oznacza, że będziemy zajmować się zadaniami związanymi z konkretnymi kolekcjami dokumentów (o rozmiarze rzędu miliona dokumentów). W szczególności będziemy tworzyć system odpowiadający na pytania w języku naturalnym (bazujący na polskiej wikipedii), system klasyfikacji krótkich wiadomości prasowych (bazujący na wikinews), system znajdujący dokumenty podobne do wskazanego (na przykładzie biuletynu zamówień publicznych), system streszczania dokumentów (zarówno pojedynczych, jak i grup dokumentów; na przykładzie wszystkich polskich aktów prawnych).

Pierwszą część wykładu poświęcimy na opracowanie pewnych narzędzi, które umożliwią realizację wymienionych wyżej zadań, w szczególności zajmiemy się metodami automatycznego odkrywania gramatyki danego języka oraz znaczenia słów (jak również relacji pomiędzy słowami).

Wykładowi będą towarzyszyły ćwiczenia połączone z pracownią.

Jeżeli jesteś zainteresowany studiowaniem w naszym instytucie, zapraszamy na stronę poświęconą tegorocznej rekrutacji.

Nazwa użytkownika (user name):
Hasło (password):