Uniwersytet im. Adama Mickiewicza w Poznaniu - Centralny System Uwierzytelniania
Strona główna

Laboratorium V: Automatyzacja przetwarzania tekstu [08-KODM-LABPT4] Semestr letni 2017/2018
Zajęcia laboratoryjne, grupa nr 1
Moodle ID: 269242_1

Przejdź do planu zaznaczono terminy wyświetlanej grupy
To jest strona grupy zajęciowej. Jeśli szukasz opisu przedmiotu, zobacz stronę przedmiotu
Przedmiot: Laboratorium V: Automatyzacja przetwarzania tekstu [08-KODM-LABPT4]
Zajęcia: Semestr letni 2017/2018 [2018/SL] (zakończony)
Zajęcia laboratoryjne [LAB], grupa nr 1 [pozostałe grupy]
Termin i miejsce: Podana informacja o terminie jest orientacyjna. W celu uzyskania pewnej informacji obejrzyj kalendarz roku akademickiego lub skontaktuj się z wykładowcą (nieregularności zdarzają się przede wszystkim w przypadku zajęć odbywających się rzadziej niż co tydzień).
każdy piątek, 11:30 - 13:45
sala 67
Szamarzewskiego 89 bl. AB jaki jest adres?
Terminy najbliższych spotkań: Daty odbywania się zajęć grupy. Prezentują informacje na podstawie zdefiniowanych w USOS terminów oraz spotkań.
Kliknij w datę by zobaczyć tygodniowy plan z zaznaczonym spotkaniem.
Wszystkie zajęcia tej grupy już się odbyły - pokaż terminy wszystkich spotkań.
Data i miejsceProwadzący
Liczba osób w grupie: 14
Limit miejsc: 14
Zaliczenie: Zaliczenie z notą
Prowadzący: Barbara Konat
Strona domowa grupy: https://goo.gl/MtUvKq
Literatura:

Ingersoll, Grant S., Thomas S. Morton, and Andrew L. Farris. Taming text: how to find, organize, and manipulate it. Manning Publications Co., 2013.

Apache OpenNLP Developer Documentation https://opennlp.apache.org/documentation/1.7.0/manual/opennlp.html (Dostęp 16.01.2017)

Natural Language Processing with Python – NLTK http://www.nltk.org/book/ (Dostęp 16.01.2017)

Stede, Manfred. "Discourse processing." Synthesis Lectures on Human Language Technologies 4.3 (2011).

Zakres tematów:

Laboratorium przygotowuje studentów do podejmowania roli analityka danych językowych (ang. data analyst) w zespołach badawczych oraz w projektach komercyjnych. Obejmuje dziedzinę informatyki, jaką jest inżynieria lingwistyczna (language engeneering) oraz przetwarzanie języka naturalnego (natural language processing, NLP), szczególnie zaś automatyczną analizę danych językowych oraz komunikację człowiek-komupter.

LISTA TEMATÓW:

- Elementy procesu przetwarzania języka naturalnego

- Podstawowe narzędzia przetwarzania języka naturalnego (NLTK Python, ONLP Java lub inne narzędzia/pakiety)

- Przygotowanie prostego korpusu z dwuwartościową anotacją (np. korpus tweetów zaanotowanych wydźwiękiem pozytywnym i negatywnym)

- Trening prostego (dwuwartościowego) modelu automatycznego klasyfikatora tekstu z uczeniem maszynowym z gotowym zestawem cech (np. bag of words lub n-gram)

- Ewaluacja prostego modelu automatycznego klasyfikatora tekstu (metoda F1-score)

- Etapy tworzenia złożonych algorytmów analizy dyskursu (np. Rhetorical Structure Theory, teoria argumentacji)

- Narzędzia anotacji dla analizy dyskursu

- Tworzenie korpusu dla analizy dyskursu

- Trening złożonego modelu automatycznej analizy dyskursu

- Ewaluacja złożonego modelu automatycznej analizy dyskursu (metoda F1-score lub inna metoda)

Uwagi:

Wymagana znajomość języka angielskiego umożliwiająca korzystanie z anglojęzycznej literatury przedmiotu oraz baz tekstów.

O mnie: http://bkonat.home.amu.edu.pl/

Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet im. Adama Mickiewicza w Poznaniu.
ul. Wieniawskiego 1
61-712 Poznań
tel: +48 61 829 4000
kontakt deklaracja dostępności USOSweb 7.0.3.0 (2024-03-22)