Laboratorium V: Automatyzacja przetwarzania tekstu [08-KODM-LABPT4]
Semestr letni 2017/2018
Zajęcia laboratoryjne,
grupa nr 1
Moodle ID: 269242_1
Przedmiot: | Laboratorium V: Automatyzacja przetwarzania tekstu [08-KODM-LABPT4] | ||||||||||||||||||||||||||||||||||
Zajęcia: |
Semestr letni 2017/2018 [2018/SL]
(zakończony)
Zajęcia laboratoryjne [LAB], grupa nr 1 [pozostałe grupy] |
||||||||||||||||||||||||||||||||||
Termin i miejsce:
|
|||||||||||||||||||||||||||||||||||
Terminy najbliższych spotkań:
Kliknij w datę by zobaczyć tygodniowy plan z zaznaczonym spotkaniem. |
Wszystkie zajęcia tej grupy już się odbyły - pokaż terminy wszystkich spotkań.
|
||||||||||||||||||||||||||||||||||
Liczba osób w grupie: | 14 | ||||||||||||||||||||||||||||||||||
Limit miejsc: | 14 | ||||||||||||||||||||||||||||||||||
Zaliczenie: | Zaliczenie z notą | ||||||||||||||||||||||||||||||||||
Prowadzący: | Barbara Konat | ||||||||||||||||||||||||||||||||||
Strona domowa grupy: | https://goo.gl/MtUvKq | ||||||||||||||||||||||||||||||||||
Literatura: |
Ingersoll, Grant S., Thomas S. Morton, and Andrew L. Farris. Taming text: how to find, organize, and manipulate it. Manning Publications Co., 2013. Apache OpenNLP Developer Documentation https://opennlp.apache.org/documentation/1.7.0/manual/opennlp.html (Dostęp 16.01.2017) Natural Language Processing with Python – NLTK http://www.nltk.org/book/ (Dostęp 16.01.2017) Stede, Manfred. "Discourse processing." Synthesis Lectures on Human Language Technologies 4.3 (2011). |
||||||||||||||||||||||||||||||||||
Zakres tematów: |
Laboratorium przygotowuje studentów do podejmowania roli analityka danych językowych (ang. data analyst) w zespołach badawczych oraz w projektach komercyjnych. Obejmuje dziedzinę informatyki, jaką jest inżynieria lingwistyczna (language engeneering) oraz przetwarzanie języka naturalnego (natural language processing, NLP), szczególnie zaś automatyczną analizę danych językowych oraz komunikację człowiek-komupter. LISTA TEMATÓW: - Elementy procesu przetwarzania języka naturalnego - Podstawowe narzędzia przetwarzania języka naturalnego (NLTK Python, ONLP Java lub inne narzędzia/pakiety) - Przygotowanie prostego korpusu z dwuwartościową anotacją (np. korpus tweetów zaanotowanych wydźwiękiem pozytywnym i negatywnym) - Trening prostego (dwuwartościowego) modelu automatycznego klasyfikatora tekstu z uczeniem maszynowym z gotowym zestawem cech (np. bag of words lub n-gram) - Ewaluacja prostego modelu automatycznego klasyfikatora tekstu (metoda F1-score) - Etapy tworzenia złożonych algorytmów analizy dyskursu (np. Rhetorical Structure Theory, teoria argumentacji) - Narzędzia anotacji dla analizy dyskursu - Tworzenie korpusu dla analizy dyskursu - Trening złożonego modelu automatycznej analizy dyskursu - Ewaluacja złożonego modelu automatycznej analizy dyskursu (metoda F1-score lub inna metoda) |
||||||||||||||||||||||||||||||||||
Uwagi: |
Wymagana znajomość języka angielskiego umożliwiająca korzystanie z anglojęzycznej literatury przedmiotu oraz baz tekstów. O mnie: http://bkonat.home.amu.edu.pl/ |
Właścicielem praw autorskich jest Uniwersytet im. Adama Mickiewicza w Poznaniu.