4IZ440 - Reprezentace a zpracování znalostí na WWW

Doc. Ing. Vojtěch Svátek, Dr.




Pro studijní skupinu v LS 2010 je k dispozici




Základní literatura:

Doplňující literatura:




Informace o testech:




Zadání minireferátu

Rámcově se seznamte s obsahem zvoleného odborného článku z oblasti sémantického webu, nejlépe ze sborníku některého ročníku konference ISWC přístupného z digitální knihovny Springer LNCS (licencovaný zdroj přístupný přes IP VŠE). Doporučuje se vybrat článek zaměřený na konkrétní výpočtovou metodu, než článek srovnávací či "ideový". Na základě tohoto seznámení si připravte:

Relační anotace v jazyku OWL bude rozšířením pokusné základní ontologie SCOReD pro oblast informatiky, která byla rozebrána na cvičení 30.3. Rozšíření bude realizováno tak, že se ontologie SCOReD naimportuje do nové ontologie, která bude zachycovat anotaci. Budou přitom dodržovány tyto zásady:

Jako vzor může sloužit ontologie článku o AKTiveRank (viz text článku v digitální knihovně Springer) - verze od p. Kašpara, s drobnou úpravou.

Pozn.: SCOReD = "Scholarly Content modelling through Ontological Relational Descriptions".




Zadání semestrálního projektu

Harmonogram odevzdání: Pracovní verze projektů budou prezentovány na cvičení 11.5.; kompletní finální verzi nutno povinně dodat do 25.5., následně budu řešit jen případná drobná vylepšení kvůli známce apod.

Všechny varianty zadání, které nejsou rovnou "textové" podstaty, předpokládají navíc vypracování alespoň stručného textového dokumentu (3-5 stran, podle potřeby i více) popisujícího řešený problém a způsob jeho řešení.

Varianta A - Ontologické inženýrství, sémantický web (témata navržená V. Svátkem)

Podvarianta A1: Rozšiřte existující aplikaci o produkování výsledků ve formátu RDF, navrhněte pro tento účel vhodné RDF schéma.

Podvarianta A1bis: Vytvořte funkční šablonu XSLT pro generování dat RDF (odpovídajících relevantní ontologii) z určitého typu dat XML anotovaných podle specifikace GRDDL (jednou z možností pro taková zdrojová data XML je formát Predictive Model Mark-up Language - PMML).

Podvarianta A2: Zprovozněte a otestujte některý nástroj pro ukládání a vyhledávání dat RDF. Vygenerujte umělá data v rozsahu řádově tisíců trojic a naplňte jimi Vaši instalaci nástroje.

Podvarianta A3: Navrhněte a popište nový logický návrhový vzor v podobném stylu jako W3C skupina SWBPD.

Podvarianta A4: Vytvořte podrobnou specifikaci aplikace usnadňující využívání některého logického návrhového vzoru.

Podvarianta A5: Vytvořte aplikaci pro extrakci informací z textu ve spefické doméně. Můžete využít GATE nebo jiný obecný nástroj.

Podvarianta A6: Podrobně se seznamte s některým nástrojem pro podporu pořádání konferencí, a na jeho základě vytvořte rozsáhlou ontologii pro kolekci OntoFarm. Soustřeďte se na věcnou tématiku pořádání konferencí, a nikoliv na pojmy týkající se softwarového řešení (např. uživatelské rozhraní a přístupová práva k systému).

Podvarianta A7: Vytvořte rozsáhlou doménovou ontologii (okolo 100 konceptů a 50 relací) založenou na obecné ontologii resp. využívající obsahový návrhový vzor.

Podvarianta A8: Jiný typ samostatného projektu s adekvátní tématikou, po dohodě s vyučujícím.

Varianta B - LinkedData, RDFa (témata navržená J. Zemánkem)

Podvarianta: Mashup nad LinkedData.

Vytvořte jednoduchý mashup, který bude využívat data minimálně ze dvou "linked datasetů" (viz. Linked Open Data cloud). Doporučené nástroje: PHP RDF API ARC2, Exhibit

Podvarianta: RDFa.

Vyberte si jednu nebo více ontologií (FOAF , MusicOntology, Bibliontology specification nebo jinou/é), vytvořte webovou stránku, a s pomoci RDFa ji s využitím dané ontologie oanotujte. Pomocí některého z extrakčních nástrojů (http://www.w3.org/2007/08/pyRdfa/, http://rdf-in-html.appspot.com/) získejte ze stránky "čisté" RDF, a zobrazte jej v některém z RDF prohlížečů - např. ve FOAF Exploreru nebo v některém z generických prohlížečů - Tabulator nebo Disco. Postup důkladně zdokumentujte, anotovanou stránku i vyextrahované RDF umístěte na WWW, a výsledné zobrazení v prohlížeči zařaďte jako screenshot do dokumentace.

Varianta C - Topic Maps (témata navržená J. Koskem)

Podvarianta: Vytvořte kompletní mapu témat pro vámi zvolenou problematiku.

Podvarianta: Vytvoření webové aplikace pro prohlížení mapy témat

Podvarianta: Využití TM jako úložiště dat pro aplikaci

Podvarianta: Otestování možnosti exportu z OWL do TM

Podvarianta: Převod formátu XML/PMML do Topic Maps

Odkazy pro variantu A6

Nástroje pro pořádání konferencí (znáte-li jiný, je možno zařadit). Přednostně je vhodné se orientovat na nástroje, které dosud zpracovány nebyly; v případě nedostatku je možné domluvit se i na některém již zpracovaném.




-->

Přehledové zdroje, nástroje, aplikace a akce:

Přehledové zdroje:

Vybrané nástroje pro sémantický web (RDF/OWL):

Další "sémantické", zdroje a uživatelské aplikace:

Hlavní akce z oblasti sémantického webu:






Vojtěch Svátek - výuka
Vojtěch Svátek - hlavní stránka



Vojtěch Svátek , aktualizováno 4.5.2010