4IZ440 - Propojená data na webu (PDW)

(Starší název: Reprezentace a zpracování znalostí na WWW, tj. RZZW)

Přednášející a cvičící: prof. Ing. Vojtěch Svátek, Dr.




Pro studijní skupinu v ZS 2018 je k dispozici




Základní (povinná) literatura:

Doplňující literatura:

Slidy (a další odkazy) z přednášek a cvičení:

Bude průběžně vystavováno
Oranžově podbarvené odkazy vedou na kontextové mapy k tématům v aplikace ContextMinds (připr. M. Dudáš, podle starší verze slidů, v detailech není zcela zaručena aktuálnost).

Archivní materiály ze starších běhů předmětu




Informace o testech (celkem 40 bodů):





Zadání minireferátu (celkem 12 bodů, nutno minimálně 5)

Rámcově se seznamte s obsahem zvoleného odborného článku z oblasti sémantického webu. Pokud nebude s vyučujícím explicitně dohodnuto jinak, bude se jednat

Zvolený článek zadejte do Google dokumentu (odkaz na něj přijde mailem od vyučujícího) PLUS o tom pošlete vyučujícímu e-mail (pro případ, že by se informace v dokumentu při nějakém pozdějším editu ztratila). Předtím si v dokumentu zkontrolujte, jestli si už článek nevybral někdo jiný. Zadání volby článku proveďte nejpozději 31.10. Na základě tohoto seznámení si připravte:


Zadání semestrálního projektu (celkem 40 bodů, nutno minimálně 20)

Harmonogram odevzdání: Pracovní verze projektů budou prezentovány na cvičení 10.12. (předpokládaná délka vystoupení od velmi krátkého až po cca 8 minut, lze využít slidy). Prezentace může být hodnocena až 2 body; požadavkem bodového zisku je vedle samotné kvality prezentace také odevzdání jednostránkového konceptu v PDF přes odevzdávárnu InSIS, a to nejpozději 6.12. Zadání semestrální práce je třeba vložit do Google dokumentu (odkaz na něj přijde mailem od vyučujícího - pozor, jiný než pro minireferát!) nejpozději 19.12. Kompletní finální verzi je pak nutné dodat přes odevzdávárnu InSIS do 13.1.2019, následně budu řešit jen případná drobná vylepšení kvůli známce apod.

Všechny varianty zadání, které nejsou rovnou "textové" podstaty, předpokládají navíc vypracování alespoň stručného textového dokumentu (3-5 stran v PDF, podle potřeby i více) popisujícího jak řešený problém, tak i (v dostatečné úrovni podrobnosti) způsob jeho řešení. Popisujte především originální část vlastního řešení, zkušenosti, charakter experimentů apod. Nejedná se o referát o existujících, hotových technologiích, které využíváte!
Pozor: první kapitola textu musí na konci obsahovat podsekci nadepsanou "Souvislost s jinými semestrálními, případně kvalifikačními, pracemi zpracovávanými v minulosti nebo souběžně". Pokud má semestrální práce přímou nebo nepřímou souvislost (z hlediska použitých metod, dat, apod.) s jinými semestrálními nebo kvalifikačními pracemi zpracovávanými v minulosti nebo v současnosti, ať už na VŠE nebo na jiné škole, uveďte to zde, a vysvětlete, jaká je přidaná hodnota předkládané semestrální práce. V opačném případě zde uveďte: „Tato semestrální práce nemá textový ani věcný překryv, ani jinou věcnou souvislost, s jinými semestrálními nebo kvalifikačními pracemi, které jsem zpracovával/a.“

Varianty projektu:

  1. Aktuálně zařazená témata navazující na směry výzkumu katedry (ideální pro zájemce o DP - semestrálka odpovídá rané/dílčí verzi popsaného projektu pro DP)
  2. Práce na rozvoji některé linked-datové aplikace katedry, např.
  3. Testování použitelnosti některého nástroje z oblasti linked data pomocí některé jednoduché testovací metodiky, kterou si dohledáte v literatuře z oblasti testování software. Testování musí zahrnovat i ty aspekty daného nástroje, které se vztahují k práci s daty RDF (ev. jinými daty specificky odpovídající zaměření předmětu), tj. nejen běžné vlastnosti společné i jiným třídám software.
  4. Extrakce/transformace/linkování provedené nad reálnými daty, s využitelným datovým výstupem. Výstup musí být určitým způsobem evaluován, např. s využitím nástroje RDFunit, případně specificky pro zdroje ve SKOS qSKOS. Zvláště vítané jsou aktivity nad českými veřejnosprávními daty, ať už v současnosti vystavenými na http://linked.opendata.cz, nebo perspektivně vedoucí k obohacení těchto zdrojů linked data. Výchozím bodem mohou být i fiskální datasety katalogizované v rámci projektů OpenBudgets a OpenSpending: můžete buďto hlouběji rozpracovat využití datasetu z Vaší týmové práce na cvičeních (až k formulaci "analytických" SPARQL dotazů vedoucí k zajímavým zjištěním v datech - viz Příručka datové žurnalistiky), nebo zpracovat některý další dosud nezpracovaný dataset. Obdobně jsou vítány aktivity ve směru k české DBpedii, viz též téma DP. Konkrétní technologické prvky (lze nakombinovat):
  5. Zajímavá vlastní aplikace konzumující linked data, např.
  6. Návrh vlastního, netriviálního, datového slovníku, např.
  7. Zcela vlastní téma po konzultaci s vyučujícím (může opět jít např. i o specifikaci aplikace, která by byla následně realizována v rámci diplmovové práce).



Přehledové zdroje, nástroje, aplikace a akce

(Řada z nich už může být zastaralých nebo nefunkčních.)

Přehledové zdroje:

Vybrané nástroje pro sémantický web:

Další zdroje a uživatelské aplikace:

Hlavní akce z oblasti sémantického webu:






Vojtěch Svátek - výuka
Vojtěch Svátek - hlavní stránka



Vojtěch Svátek , aktualizováno 11.11.2018