2014

2015

2016

2017

2018

2019

2020

2022

2023

2024

2025

Dvacátédruhé setkání Pražského informatického semináře

Steffen Staab

Programování se sémantickými „širokými“ daty

Náročnost zpracování tzv. Big Data se zpravidla odvozuje z jejich vlastností, v angličtině shrnutých pod "4V" neboli "Volume, Velocity, Variety and Veracity".

Anotace Přednášející Poster

2025
2024
2023
2022
2020
2019
2018
2017
2016
2015
2014

Spolupořádáno s konferencí KESW 2016

Přehrát záznam

22. září 2016

16:00

Posluchárna E-107, FEL ČVUT
Karlovo nám. 13, Praha 2
Zobrazit na mapě

Náročnost zpracování tzv. Big Data se zpravidla odvozuje z jejich vlastností, v angličtině shrnutých pod "4V" neboli "Volume, Velocity, Variety and Veracity". Různorodost ("variety") dat v organizacích je důsledkem jejich produkování různými informačními systémy využívajícími heterogenní schémata nebo ontologie. V přednášce budou představeny výzkumné aktivity zaměřené na zpracování takových "širokých" dat (Broad Data).

To zahrnuje: (i) integrované vývojové prostředí pro programování se "širokými" daty, (ii) dotazovací jazyk zajišťující sémantické typování výsledků dotazů, (iii) typovaný lambda kalkul založený na deskripční logice, a (iv) využití schématových indexů pro efektivní přístup k datovým úložištím.

Steffen Staab

Steffen vystudoval informatiku a komputační lingvistiku v Erlangenu (Německo), Filadelfii (USA) a Freiburgu (Německo). Jeho vědecká kariéra pokračovala na univerzitě ve Stuttgartu, institutu Fraunhofer a na univerzitě v Karlsruhe (vše Německo). Profesorskou pozici získal v Koblenzi (Německo). Od r. 2015 je zároveň vedoucím skupiny Web and Computer Science na univerzitě v Southamptonu, UK. Na své vědecké dráze se úspěšně vyhnul téměř všem dobrým radám, které nyní dává svým mladším kolegům. Mezi takové rady patří: soustředit se na vědu (a nerozptylovat se firemní praxí); věnovat se jen jedné nebo dvěma oblastem (a ne např. zároveň ontologiím, sémantickému webu, sociálním sítím, datovému inženýrství, dolování z textů, technologii peer-to-peer, multimédiím, uživatelským rozhraním, webovým službám, softwarovému modelování a programování, atd.) Na druhé straně, většina Steffenových odborných aktivit má jako společného jmenovatele snahu o lepší pochopení a využívání strukturovaných i textových dat.

Jeho program je tvořen hodinovou přednáškou, po níž následuje časově neomezená diskuse. Základem přednášky je něco (v mezinárodním měřítku) mimořádného nebo aspoň pozoruhodného, na co přednášející přišel a co vysvětlí způsobem srozumitelným a zajímavým i pro širší informatickou obec. Přednášky jsou standardně v angličtině.

Idea Pražského informatického semináře vznikla z rozhovorů představitelů několika vědeckých institucí na téma, jak odstranit zbytečnou fragmentaci informatické komunity v ČR.

Seminář připravuje organizační výbor ve složení Roman Barták (MFF UK), Jaroslav Hlinka (ÚI AV ČR), Michal Chytil, Pavel Kordík (FIT ČVUT), Michal Koucký (MFF UK), Jan Kybic (FEL ČVUT), Michal Pěchouček (FEL ČVUT), Jiří Sgall (MFF UK), Vojtěch Svátek (FIS VŠE), Michal Šorel (ÚTIA AV ČR), Tomáš Werner (FEL ČVUT), Filip Železný (FEL ČVUT)