2014
2015
2016
2017

Třinácté setkání Pražského informatického semináře

Jan Hajič

Strojový překlad přirozených jazyků

Strojový překlad přirozených jazyků je problém stejně starý jako počítačová lingvistika samotná, a v jejím rámci je to problém, který byl mnohokrát podceněn jak z hlediska metodologického, tak z hlediska doby potřebné k jeho vyřešení – a ani dnes vyřešen není.

23. dubna 2015

16:00

Posluchárna E-107, FEL ČVUT
Karlovo nám. 13, Praha 2
Zobrazit na mapě

Anotace přednášky

Strojový překlad přirozených jazyků je problém stejně starý jako počítačová lingvistika samotná, a v jejím rámci je to problém, který byl mnohokrát podceněn jak z hlediska metodologického, tak z hlediska doby potřebné k jeho vyřešení – a ani dnes vyřešen není. Pohled na překlad prošel vývojovou spirálou od primitivních pokusů o jednoduché statistické řešení přes nesmírně komplikované algoritmy popisující všechny detaily a výjimky v přirozeném jazyce až k dnešním přístupům, které kombinují statistický a lingvistický přístup.

V přednášce bude představen matematický základ moderních překladových systémů, který má základ v teorii informace, a poté budou ukázány principy frázových překladových systémů a rovněž nové přístupy využívající tzv. hluboké analýzy vstupního textu.

Přednášející

Prof. RNDr. Jan Hajič, Dr.

Prof. RNDr. Jan Hajič, Dr. je profesor počítačové lingvistiky v Ústavu formální a aplikované lingvistiky na MFF UK v Praze a v současné době koordinuje výzkumnou infrastrukturu pro jazyková data LINDAT/CLARIN. Věnuje se rovněž přípravě jazykových dat jak pro účely jazykové analýzy, tak i pro účely překladu (anotované korpusy, treebanky). Publikoval přes 170 publikací, řadu z nich se zahraničními spoluautory. V devadesátých letech se podílel v IBM Research na vzniku prvních moderních statistických systémů strojového překladu. V letech 1999-2000 vyučoval na Computer Science Department na John Hopkins University v Baltimore. Byl a je spoluřešitelem několika výzkumných projektů EU v této oblasti (z poslední doby zejména Euromatrix, META-NET, Companions, Khresmoi, Faust, QTLeap, HimL a QT21).

O PRAŽSKÉM INFORMATICKÉM SEMINÁŘI

Seminář se schází vždy 4. čtvrtek v měsíci v 16 hod. (s výjimkou letních měsíců a prosince), a to buď v budově FEL ČVUT na Karlově náměstí, nebo v budově MFF UK na Malostranském náměstí.

Jeho program je tvořen hodinovou přednáškou, po níž následuje časově neomezená diskuse. Základem přednášky je něco (v mezinárodním měřítku) mimořádného nebo aspoň pozoruhodného, na co přednášející přišel a co vysvětlí způsobem srozumitelným a zajímavým i pro širší informatickou obec. Přednášky jsou standardně v angličtině.

Seminář připravuje organizační výbor ve složení Roman Barták (MFF UK), Michal Chytil (ÚI AVČR), Pavel Kordík (FIT ČVUT), Jan Kybic (FEL ČVUT), Michal Pěchouček (FEL ČVUT), Jiří Sgall (MFF UK), Vojtěch Svátek (FIS VŠE), Michal Šorel (ÚTIA AV ČR), Tomáš Werner (FEL ČVUT), Filip Železný (FEL ČVUT)

Idea Pražského informatického semináře vznikla z rozhovorů představitelů několika vědeckých institucí na téma, jak odstranit zbytečnou fragmentaci informatické komunity v ČR.

Podporovatelé

Kontakt