4IZ440 - Propojená data na webu (PDW)

(Starší název: Reprezentace a zpracování znalostí na WWW, tj. RZZW)

Přednášející a cvičící: Doc. Ing. Vojtěch Svátek, Dr.
Pro studijní skupinu v ZS 2014 je k dispozici
Základní literatura:

Doplňující literatura:

Slidy z přednášek a cvičení:

Bude průběžně vystavováno, níže uvedené je převážně stará verze z minulého semestru, ev. starší!


Informace o testech (celkem 40 bodů):
Zadání minireferátu (celkem 15 bodů, nutno minimálně 5)

Varianta A

Rámcově se seznamte s obsahem zvoleného odborného článku z oblasti sémantického webu. Pokud nebude s vyučujícím explicitně dohodnuto jinak, bude se jednat o standardní příspěvek ze sborníku konference ISWC 2014, části I nebo části II. Zvolený článek zadejte do Google dokumentu (viz mail od vyučujícího) PLUS o tom pošlete vyučujícímu e-mail (pro případ, že by se informace v dokumentu při nějakém pozdějším editu ztratila). Zadání volby článku proveďte nejpozději 12.11. Na základě tohoto seznámení si připravte:

Varianta B

Zvolte si některou z otázek (nezodpovězených, nebo i zodpovězených, pokud možno s nenulovým počtem hlasů) na http://answers.semanticweb.com/, prostudujte potřebné zdroje a nejpozději 30.11. vložte Vaši odpověď. Informujte o tom vyučujícího. K danému tématu si dále připravte:

Odpověď bude hodnocena podle Vaší schopnosti odpověď v diskusi obhájit, pomocnou roli mohou sehrát i případné reakce čtenářů přímo na webu http://answers.semanticweb.com/.


Zadání semestrálního projektu (celkem 40 bodů, nutno minimálně 20)

Harmonogram odevzdání: Pracovní verze projektů budou prezentovány na cvičení 15.12.; kompletní finální verzi nutno povinně dodat přes odevzdávárnu ISIS do 12.1.2014, následně budu řešit jen případná drobná vylepšení kvůli známce apod.

Všechny varianty zadání, které nejsou rovnou "textové" podstaty, předpokládají navíc vypracování alespoň stručného textového dokumentu (3-5 stran, podle potřeby i více) popisujícího řešený problém a způsob jeho řešení. (Popisujte především originální část vlastního řešení, zkušenosti, charakter experimentů apod. Nejedná se o referát o existujících, hotových technologiích, které využíváte!)

Varianty projektu:

  1. Extrakce/transformace/linkování provedené nad reálnými daty, s využitelným datovým výstupem. Výstup musí být určitým způsobem evaluován, např. s využitím nástroje RDFunit. Zvláště vítané jsou aktivity nad českými veřejnosprávními daty, ať už v současnosti vystavenými na http://linked.opendata.cz, nebo perspektivně vedoucí k obohacení těchto zdrojů linked data. Pro extrakční část lze využít datasety zkatalogizovaná na českém katalogu CKAN. Obdobně jsou vítány aktivity ve směru k české DBpedii. Konkrétní technologické varianty:
  2. Testování použitelnosti některého nástroje z oblasti linked data, např.některé komponenty LOD Stack, pomocí některé (alespoň zjednodušené) testovací metodiky, kterou si dohledáte v literatuře z oblasti testování software. Testování musí zahrnovat i ty aspekty daného nástroje, které se vztahují k práci s daty RDF (ev. jinými daty specificky odpovídající zaměření předmětu), tj. nejen běžné vlastnosti společné i jiným třídám software.
  3. Produktová ontologie kompatibilní s GoodRelations a odpovídající konvencím kolekce OPDM - vhodné pro studenty, kteří se už seznámili s tvorbou ontologií např. v prostředí Protégé (zpravidla v předmětu 5FI430)
  4. Reálné využití RDFa (zejména s entitami slovníků Schema.org a/nebo GoodRelations), se zhodnocením efektu pro vyhledávače nebo jiné aplikace - využití vhodných metrik.
  5. Vizualizační aplikace (mashup), včetně zdrojového kódu, primárně postavená nad datasety z linked.opendata.cz. Doprovodný dokument bude kromě popisu aplikace z technologického i uživatelského hlediska obsahovat také návrh okruhu osob, pro které by aplikace mohla být užitečná, a scénář jejího využití k uspokojení realistické informační potřeby.
  6. Jiný mashup, včetně zdrojového kódu, nápaditě kombinující alespoň 3 různé zdroje, z toho alespoň jedno rozhraní dat RDF (nejlépe SPARQL endpoint), zahrnující vizualizaci dat na mapovém podkladě, i zobrazení na nějaké kvantitativní (časové, finanční apod.) ose. Doprovodný dokument bude kromě popisu aplikace z technologického i uživatelského hlediska obsahovat také návrh okruhu osob, pro které by aplikace mohla být užitečná, a scénář jejího využití k uspokojení realistické informační potřeby.
  7. Vlastní téma po konzultaci s vyučujícím.Přehledové zdroje, nástroje, aplikace a akce

(Řada z nich už může být zastaralých nebo nefunkčních.)

Přehledové zdroje:

Vybrané nástroje pro sémantický web:

Další zdroje a uživatelské aplikace:

Hlavní akce z oblasti sémantického webu:


Vojtěch Svátek - výuka
Vojtěch Svátek - hlavní stránkaVojtěch Svátek , aktualizováno 15.12.2014