Folksonómie v kontexte organizácie a vyhľadávania informácií

Zo Slovenska


Softvér pre ľudí

Aktuálny prístup k tvorbe aplikácií uprednostňuje prepájanie ľudí, umožňuje spoločné využívanie obsahu, podporuje spoluprácu a komunikáciu. Na základe existujúcej štruktúry sociálnych sietí a skúmania správania ľudí sú vytvárané praktické nástroje na publikovanie, organizáciu, využívanie a vyhľadávanie informácií. Najprogresívnejšie sa vyvíjajúcu oblasť predstavujú systémy na odporúčanie a vyhľadávanie informácií. Používateľom je dostupné obrovské množstvo aplikácií fungujúcich na báze internetu, ktoré môžu využívať vo väčšine prípadov zadarmo. Patria sem napr. systémy na spoločné vytváranie záložiek, ukladanie, triedenie a spoločné využívanie obsahu, nástroje na klasifikáciu a vizualizáciu kognitívnych máp, personalizované rozhrania vyhľadávacích nástrojov, wiki, dávky (rss, atom, opml) a weblogy. Všetky tieto, a mnohé ďalšie, patria do sféry služieb ďalšej generácie Web 2.0.


Východiská

Spolu s evolúciou ľudstva vzrastá a kumuluje sa množstvo zaznamenaných dát, znalostí, informácií a poznatkov. Tento fenomén komplikuje ich efektívne vyhľadávanie a v konečnom dôsledku aj využívanie. Jav má aj afektívny a kognitívny rozmer. Človek má pocit, že neúprosná lavína ho stiahne, zavalí pod masu a sám nebude vedieť bez pomoci nájsť cestu na povrch. Riešením problému stvárneného metaforou je organizácia a reprezentácia poznania. Jedine pomocou nich znížime účinky a mohutnosť lavíny. Na druhej strane sa vynára nový problém – otázka možnosti a schopnosti zachytiť silnejúci prúd poznania vytvárajúceho sa každou sekundou.

Snaha usporiadať chaos sa ukazuje nielen ako opodstatnená, ale i nutná. V záujme organizovania vedeckého poznania boli vytvorené systémy na jeho klasifikáciu a indexovanie. V organizácii poznania sa rozlišujú dva základné prístupy k spracovaniu informácií:

  1. hierarchicko-enumeratívny
    spracovanie realizuje zhora-dole a využívajú sa pri ňom hierarchické klasifikačné schémy, riadené slovníky, tezaury a pod.,
  2. analyticko-syntetický (Hammond et al., 2005)
    analyticko-syntetický prístup (zdola-hore) je prezentovaný fazetovými klasifikáciami a možno k nemu priradiť aj folksonómie.

Vo vývoji predchádzali folksonómiám štruktúry (indexy) vytvárané prieskumovými strojmi, metaprieskumovými strojmi a kategorizácie v rámci predmetových adresárov, ako aj ďalšie popisné a metadátové schémy. V súvislosti s automatizovanými mechanizmami organizácie internetových zdrojov sa objavili (okrem iných) problémy súvisiace so sémantikou internetových zdrojov. Odvodenie významu z textu funguje na princípe formálnych výpočtov a je založené skôr na presnosti ako na intuitívnosti či zohľadňovaní kontextu. Ako odozva vznikla iniciatíva sémantického webu, novšie značkovacie jazyky, špeciálne ontológie a metadátové schémy, ktoré majú kódovať dokumenty tak, aby boli jednoduchšie spracovateľné strojmi. A čo je dôležité pre nás, majú umožniť efektívnejšie vyhľadávanie čo najrelevantnejších informácií používateľmi.

Okrem nadšencov sémantického webu sa vytvorila aj skupina kritikov, ktorí sú k tomuto prístupu skeptickí, pretože podľa nich sa stroje v priestore internetu nikdy nenaučia pracovať s informáciami tak, ako to dokážu ľudia. Iný prístup predstavuje kategorizácia zdrojov internetu ľuďmi. Príkladom je ODP (Dmoz : Open Directory Project, 2006), ktorý je výstupom kolaboratívnej tvorby kategórií a ďalších úrovní predmetového adresára. Nové milénium odštartovalo vznik aplikácií s otvoreným kódom a v súvislosti s nimi sú vytvárané aj štruktúry folksonómií.


Folksonómie

Anglický pojem „folksonomies“ odvodil v roku 2004 informačný architekt Thomas Vander Wal od slov „folk“ (ľudia) a „taxonómie“1[z gr. taxis „usporiadanie“ a nomia „metóda“ (Harper, 2001)]. Folksonómie2 predstavujú metódu organizácie informácií do tagov, ktoré im kolaboratívne a decentralizovane priraďujú členovia sociálnych sietí. Tag je pojem označujúci kategóriu, ktorú používatelia priraďujú ku konkrétnym zdrojom. Prepájaním členov internetových komunít profilovaných najmä podľa oblastí záujmu sú vytvárané sociálne siete (Social Networks, 2006). Vznikajú tak vzťahy medzi členmi nielen jednej, ale aj viacerých komunít. Folksonómie umožňujú kategorizovať rozmanité typy zdrojov – webové stránky, blogy, video, obrázky, rss dávky a pod. Používatelia môžu nielen organizovať, vyhľadávať, ale aj spoločne využívať vytvorené tagy. Folksonómie tvoria poprepájané štruktúry konceptuálnych máp, ktoré reprezentujú pojmy v mysliach ľudí.

Na vyššej úrovni vznikajú „mraky tagov“ (tag clouds), ktoré prepájajú folksonómie viacerých používateľov v rámci komunít. Ide o výstup súčtu frekvencií výskytu rovnakých tagov. Výsledkom je reprezentácia tagov, kde sú zvýraznené tie, ktoré sú využívané najfrekventovanejšie (napr. obr. 1).

gresko1.gif (74429 bytes)
Obr. 1 Mrak najobľúbenejších tagov z del.icio.us (2006a)

T. V. Wal (2005) rozlišuje široké a úzke folksonómie. Príkladom širokej folksonómie je systém del.icio.us (2006b), v ktorom viacerí používatelia označujú ten istý objekt vlastnými tagmi. Podľa zastúpenia toho istého tagu pre konkrétny objekt sa určuje „sila tagu“ a výsledkom je krivka sily, ktorá sumarizuje frekvenciu výskytu tagov pre objekt. Napr. stránku apple.com zaradí do tagu „apple“ 15 ľudí, „mac“ 10 ľudí a „macOS“ určí 5 ľudí. V tomto prípade bude „apple“ najsilnejším tagom, ktorý je v „mraku tagov“ reprezentovaný ako najväčší. V úzkej folksonómii [vzniká napr. vo flickr-i (2006)] konkrétny používateľ tagu je objekt, ktorý uložil do databázy. Výsledkom je to, že v porovnaní so širokou folksonómiou, omnoho menej ľudí priradí ten istý tag k objektu. Určiť silné tagy je v úzkej folksonómii problematické.


Problémy

Folksonómie sú vytvárané ľuďmi, heterogénnou masou, o ktorej v podstate nevieme povedať takmer nič. Používateľom systému môže byť laik aj expert. To znižuje dôveryhodnosť a relevanciu zdrojov zaradených do tagov. Tieto charakteristiky sú aktuálne v kontexte nesprávneho zaradenia do tagu, alebo ak je príliš široké určenie tagu pre zdroj. V prípade, že máte záujem o kvalitné zdroje, riešenie vidím v odporúčaní „knižnice“ tagov odborníkom alebo známym. Ďalšou schodnou cestou by bola lepšia špecifikácia profilu používateľa potrebná na jeho identifikáciu, či kategorizácia používateľov podľa úrovní poznania a skúseností v danej doméne či disciplíne. Automatizovaný mechanizmus overovania správnosti kategorizácie zdrojov do tagov zatiaľ neexistuje, ale niektorí autori mu dávajú šancu (Guy, Tonkin, 2006). Súvisí to práve s problematikou „interpretácie“ obsahu internetu strojmi. Používatelia by mohli využiť predurčené schémy na klasifikáciu, ale to by už bolo asi v rozpore s „filozofiou“ internetu ako demokratizačného média.

„Knižnice“ tagov sú vytvárané používateľmi pre vlastné potreby (alebo potreby komunity) preto, aby k nim mali prístup, aj keď práve nemajú k dispozícii svoj počítač. Nie sú teda vytvárané v záujme všeobecnejšej využiteľnosti.

Závažný problém predstavuje to, že vzťahy medzi jednotlivými tagmi nie sú špecifikované a štruktúrovanie je iba jednoúrovňové (na rozdiel od tradičných systémov organizácie poznania, ktoré by mohli byť zdrojom pre inšpiráciu). Niektoré tagy sa môžu vyznačovať synonymiou alebo polysémiou, čo tiež neprispieva k organizácii informácií, ale skôr k zvýšeniu chaosu.

Tonkinová (2006) poukazuje na možnosti zneužitia folksonómií (napr. na komerčné účely), nedostatok štandardizácie a ťažkosti pri opakovanom využívaní informácií.

Zo spomínaných problémov vyplýva aj otázka vhodnosti využitia systémov založených na folksonómiách pri vyhľadávaní informácií. Výsledky sú usporiadané neprehľadne a ich prehľadávanie je časovo náročné. Na problematické vyhľadávanie upozornil aj Sterling (2005), ktorý vidí riešenie vo vytváraní neštruktúrovaných taxonómií strojmi. Podľa môjho názoru schodnejšia cesta po línii kontroly expertmi a čiastočného automatizovania procesu (napr. pri odstraňovaní duplicity).


Trendy

V súčasnosti dochádza k syntéze folksonómií s tradičnými nástrojmi na vyhľadávanie informácií v internete (už spomínané prieskumové stroje, metaprieskumové stroje, predmetové adresáre). V prípade, že tagy budú hlbšie štruktúrované, mohli by byť v budúcnosti využité ako substrát na tvorbu organizovaných adresárov.

Perspektívne by mohli folksonómie slúžiť aj pre inteligentých agentov, ktorí by sa mohli učiť od používateľov, ako vytvárať tagy. Vznikali by tak nové nástroje, ktoré by využívali mechanizmus organizácie zdrojov, ktorý by nebol založený na rangovaní frekvencií a zhlukovaní. Stroje by potom mohli simulovať niektoré aspekty kategorizácie informácií.

Systémy podporujúce tvorbu folksonómií väčšinou fungujú na báze testovacích beta verzií. To, ako sa zdokonalia, ukáže budúcnosť. Niektoré známejšie aj menej známe systémy charakterizuje ďalšia časť.


PRÍKLADY3

  • Systémy na spoločné vytváranie záložiek

del.icio.us – aké stránky máte radi?

Systém del.icio.us (2006b) je spomedzi aplikácií na spoločné vytváranie záložiek najznámejší a najviac využívaný. Slúži na ukladanie, organizovanie a spoločné využívanie obľúbených položiek exportovaných z klienta alebo ukladaných používateľom priamo z prehliadača. Výhodou je nielen neobmedzený prístup k vlastným záložkám, ale aj ich vyhľadávanie a prezeranie. Používatelia del.icio.us spoločne indexujú relevantné zdroje a priraďujú im kategórie (tagy). Prácu zjednodušujú nástroje, ktoré možno integrovať do prehliadača. Pomocou del.icio.us je možné nielen importovať kategórie a odkazy do svojho blogu, ale aj organizovať jednotlivé príspevky do tagov. Vzniká tak prepojenie blogu s deli.cio.us a tým sa rozširuje potencionálne publikum recipientov. Za zmienku stoja aj funkcie “post” a “inbox”. Pomocou “for” dodávate najaktuálnejšie záložky do kategórie zvoleného (-ých) používateľa. “Inbox” je naopak nástroj na získavanie záložiek z rôznych kategórií alebo od rozličných používateľov. Práve tieto funkcie vytvárajú spojenia medzi ľuďmi s podobnými záujmami.

CiteULike – siete vedcov

CiteULike (2006) je určený pre vedeckú komunitu (existuje v siedmich jazykových mutáciách). Pomocou CiteULike možno spoločne vytvárať, organizovať a využívať kategórie obľúbených vedeckých článkov. CiteULike spracuje identifikačné údaje a odkaz na plnú verziu alebo abstrakt článku. Vyhľadávanie článkov je sprostredkované zoznamom najaktívnejších tagov alebo prieskumovým strojom. Vo výsledkoch vyhľadávania sú odkazy na súvisiace kategórie, ale aj používateľov (a ich „knižnice“), ktorí článok do danej kategórie zaradili. Používatelia majú prístup k novinkám, najaktuálnejším obsahom časopisov, diskusným skupinám a elektronickým konferenciám. CiteULike podporuje technológie RSS, BibTeX a EndNote.

  • Systémy na organizáciu a vyhľadávanie internetových zdrojov

fLAppr – pastva pre oči

fLAppr (2006) je nástroj na vyhľadávanie obrázkov z databázy (2006), ktorý sprístupňuje albumy amatérskych aj profesionálnych fotografov. flAppr zohľadňuje pri zoraďovaní výsledkov popularitu. Postup vyhľadávania sa líši v závislosti od vopred zadaných kritérií vyhľadávania (tagy, používatelia, aktuálnosť, záujem atď.) Po zadaní kľúčových slov sa zobrazia ikony obrázkov, ktoré sa dajú po odkliknutí zväčšiť. Pod vybraným obrázkom sa zobrazia informácie o používateľovi, ktorý obrázok vložil do databázy.

K profilu používateľa je pripojený zoznam tagov, do ktorých sa triedia ďalšie obrázky.

YouTube – internetový videoprehrávač

Na rozdiel od flAppr-u YouTube (2006) sprístupňuje videá. Používatelia ich môžu nielen sledovať a spoločne využívať, ale aj ukladať. Videá sú zoradené do dvanástich kategórií. Ak chcete vyhľadávať pomocou kľúčových slov, vyberte si z možností videá, členovia, skupiny alebo playlisty videí. Tiež si ich možno prezerať v rebríčkoch najsledovanejších, najkomentovanejších, najobľúbenejších, najaktuálnejších atď. Každé video je označené tagmi, ktoré vyjadrujú jeho obsah, a ďalšími popisnými údajmi. YouTube umožňuje používateľom komentovať a hodnotiť jednotlivé videá. Systém podporuje aj diskusné fóra a tvorbu videokanálov.

Technorati – čo sa práve deje?

Technorati (2006) slúži na tagovanie, popis, spoločné využívanie a vyhľadávanie blogov. Po vytvorení konta je možné svoj blog zaregistrovať. Súčasťou procesu je vytváranie tagov a popisu, ktoré zodpovedajú obsahu blogu. Technorati následne využije tagy, kľúčové slová a URL blogu ako kritériá na vyhľadávanie. Najaktívnejšie kategórie sú zobrazené ako najväčšie. Zaujímavou funkciou je možnosť vytvorenia zoznamu priebežne monitorovaných a aktualizovaných dotazov (watchlist). Technorati uchováva databázu profilov používateľov spolu s odkazmi na ich blogy a tagy.

atiki – “social feed mixer”

atiki (2006) sumarizuje 25 dávok do jednej, umožňuje pokročilé vyhľadávanie, klasifikáciu a spoločné využívanie dávok. Tvorcovia atiki ho označujú ako social feed mixer. Vyhľadávanie dávok funguje na princípe zadania kľúčových slov a prehľadávania kategórií. Na úvodnej stránke sú zverejnené najaktuálnejšie a najobľúbenejšie dávky.

  • Vyhľadávacie nástroje syntetizujúce folksonómie

Browsr – adresár folksonómií

Browsr (2006) je adresár vytváraný ľuďmi na princípe folksonómie. Používatelia organizujú internetové zdroje do kategórií a tie sú zaradené do domén. Browsr podporuje vyhľadávanie prezeraním alebo pomocou zadania kľúčového slova. Výsledky sú zobrazené podľa užitočnosti alebo aktuálnosti. Nájdený výsledok môžno hodnotiť ako užitočný, neužitočný, nesprávnu linku, spam, duplicitnú linku. Ďalšími nástrojmi na hodnotenie sú komentáre a recenzie. Každý záznam okrem toho (samozrejme) obsahuje názov, stručnú anotáciu, odkaz na zdroj a (menej samozrejme) nick človeka, ktorý pridal zdroj k tagu. K dispozícii je vždy zoznam najaktuálnejších tagov a prehľad tagov v adresári (obr. 2).

gresko2.gif (166807 bytes)
Obr. 2 Adresár Browsr (2006) – kategória Web 2.0 Services

Gravee – humánna kategorizácia a hodnotenie

Aplikácia prepája prieskumový stroj so spoločným vytváraním záložiek. Gravee vyhľadáva nielen webové stránky, ale aj blogy a tagy. Relevancia je hodnotená na základe skóre tagu, ktoré mu priradí používateľ a stroj. Používateľ vytvára záložky, ktoré organizuje do kategórií. V priebehu vyhľadávania označuje zdroje ako relevantné alebo irelevantné. Tieto aspekty sa zohľadňujú pri triedení výsledkov a ich približovaní potrebám používateľov. Nastavenie preferencií podmieňuje spôsob zobrazovania vyhľadaných výsledkov, záložiek a náhľadu nájdenej stránky.

Wink – jasná odpoveď

Integruje funkcionalitu prieskumového stroja s folksonómiou. Používatelia priraďujú zdrojom tagy a ukladajú vyhľadané zdroje do zbierok (predmetových kategórií). Pri vyhľadávaní je vo výsledkoch možné pridať konkrétny záznam medzi obľúbené položky alebo ho blokovať. Hneď pod výsledkami z Winku sú zoradené záznamy z Googlu. Prepnutím módu vyhľadávania na „Wink answers“ sa zobrazí definícia zadaného kľúčového slova, ale aj zoznam súvisiacich pojmov spolu s ich definíciami. Najaktuálnejšie pridané zdroje, obľúbené tagy a vybrané zbierky sú dostupné z úvodnej obrazovky (obr. 3).

gresko3.gif (108152 bytes)
Obr. 3 Wink (2006) – úvodná obrazovka

  • Sumarizácia príkladov

Všetky uvedené systémy podporujú folksonómie. Umožňujú prácu s viacerými typmi zdrojov, sú určené pre rôzne komunity a sprostredkúvajú rozličnú funkcionalitu. Aktuálne informácie týkajúce sa aplikácií Web 2.0 podporujúcich vyhľadávanie zverejňujem na svojom blogu s názvom Vyhľadávanie v internete (Grešková, 2006).

Dá sa len predpovedať, že čoskoro bude vznikať viac integrovanejších a homogénnejších nástrojov. Príkladom je aj TagFetch (2006), ktorý vyhľadáva tagy simultánne vo viacerých databázach systémov podporujúcich folksonómie. V slovenskom prostredí sa objavujú nástroje podporujúce folksonómie skôr ojedinele. Príkladom je asdf.sk (2006), ktorý je určený na spoločné využívanie záložiek (bohužiaľ, je obmedzený na slovenské a české teritórium). V najbližšej budúcnosti možno očákavať boom Web 2.0 aplikácií aj u nás.

 

Záver

Článok chakterizuje východiská vzniku folksonómií, špecifikuje ich základné vlastnosti. Venuje sa problémom a trendom v tejto oblasti. Približuje niektoré systémy podporujúce folksonómie, ktoré sú typologicky odlíšené podľa ich funkcií. Ich prehľad môže byť prínosom pre informačných profesionálov a výzvou pre výskumníkov. Folksonómie sú fascinujúcim objektom skúmania vo viacerých rovinách. Zaujímavé môžu byť novovznikajúce systémy, ktoré folksonómie podporujú, odhaľovanie princípov ich fungovania, hodnotenie dizajnu rozhraní, ich testovanie a vzájomné porovnávanie. V širšom kontexte je zaujímavá interakcia človeka s takýmito systémami, správanie pri interakcii, najmä kategorizácii a napokon aj využívaní zdrojov. Na všeobecnejšej úrovni je zaujímavý sociálny kontext folksonómií, skúmanie prepojení a vzťahov medzi členmi komunít prostredníctvom prekrývania konceptuálnych máp.


Zdroje:

asdf.sk [online]. 2006. [cit. 2006-06-23]. Dostupné na internete: <http://asdf.sk/>.

atiki [online]. 2006. 2006 [cit. 2006-06-12]. Dostupné na internete: <http://www.atiki.com/>.

Browsr [online].2006. c2005-2006 [cit. 2006-06-12]. Dostupné na internete: <http://www.browsr.com/index.php>.

CiteULike [online]. 2006. [cit. 2006-06-12]. Dostupné na internete: <http://www.citeulike.org/>.

CK. 2006. flappr. In flickr [online]. 2006 [cit. 2006-06-26]. Dostupné na internete: <http://www.flickr.com/photo_zoom.gne?id=85925679&size=o>.

del.icio.us [online]. 2006a. c2005-2006 [cit. 2006-06-12]. Dostupné na internete: <http://del.icio.us/tag/>.

del.icio.us [online]. 2006b. c2005-2006 [cit. 2006-06-12]. Dostupné na internete: <http://del.icio.us>.

Dmoz : open directory project [online]. 2006. c1998-2006 [cit. 2006-06-12]. Dostupné na internete: <http://www.dmoz.org/>.

flAppr [online]. 2006. c2005-2006 [cit. 2006-06-12]. Dostupné na internete: <http://www.bcdef.org/flappr/>.

flickr [online]. 2006. c2006 [cit. 2006-06-12]. Dostupné na internete: <http://www.flickr.com/>.

Gravee [online]. c2006 [cit. 2006-06-12]. Dostupné na internete:    <http://www.gravee.com/>.

GREŠKOVÁ, M. 2006. Vyhľadávanie v internete [online]. cc2005- [cit. 2006-06-27]. Dostupné na internete: <http://vyhladavanie. blogspot.com/>

GUY, M., TONKIN, E. 2006. Folksonomies : Tiding up Tags? In D-Lib Magazine [online]. vol. 12, no. 1, 2006 [cit. 2006-06-27]. Dostupné na internete: <http://www.dlib.org/dlib/january06/guy/01guy.html>.

HAMMOND, T. et al.. 2005. Social Bookmarking Tools (I). In D-Lib Magazine [online]. vol. 11, no. 4, 2005 [cit. 2006-06-07]. Dostupné na internete: <http://www.dlib.org/dlib/april05/hammond/04hammond.html>.

HARPER, D. 2001. Taxonomy. In Online etymology dictionary [online]. 2001 [cit. 2006-06-23]. Dostupné na internete: <http://www.etymonline.com/index.php>.

Social networks. 2006. In Visual Complexity [online]. 2006 [cit. 2006-06-12]. Dostupné na internete: <http://www.visualcomplexity.com/vc/index.cfm?domain=SocialNetworks>.

STERLING, B. 2005. Order Out of Chaos. In Wired Magazine [online]. Issue 13.04, April 2005 [cit. 2006-06-07]. Dostupné na internete: <http://www.wired.com/wired/archive/13.04/view.html?pg=4>.

Tagfetch [online]. 2006. [cit. 2006-06-22]. Dostupné na internete:<http://www.tagfetch.com>.

Technorati [online]. 2006. [cit. 2006-06-23]. Dostupné na internete: <http://www.technorati.com>.

TONKIN, E. 2006. Folksonomies : the Fall and Rise of Plain-text Tagging. In Ariadne [online]. Issue 47. April 2006 [cit. 2006-06-27]. Dostupné na internete:<http://www.ariadne.ac.uk/issue47/tonkin/#1>

WAL, V. D. 2005. Explaining and Showing Broad and Narrow Folksonomies. In Personal InfoCloud [online]. 2005. [cit. 2006-06-23]. Dostupné na internete: <http://www.personalinfocloud.com/2005/02/explaining_and_.html>.

Wink [online]. 2006. c2006 [cit. 2006-06-12]. Dostupné na internete: <http://www.wink.com/>.

YouTube [online]. 2006. c2006 [cit. 2006-06-12]. Dostupné na internete: <http://www.youtube.com/>.

 


1 Taxonómia označuje systém tried v rámci druhu, ktorý má hierarchickú štruktúru. V tomto bode je pojem „folksonómie“ problematický, pretože v skutočnosti predstavuje systém kategorizácie, v rámci ktorého nie sú určené vzťahy.

2 Niekedy sa zvyknú označovať aj ako ľudové klasifikácie, etnoklasifikácie, distribuované klasifikácie alebo spoločné klasifikácie (Hammond et al., 2005). Tieto názvy sú sporné, pretože folksonómie vznikajú na základe kategorizácie, nie klasifikácie.

3 Poznámka redakcie: V elektronickej verzii čísla obsahuje každý príklad ukážku.

Zdieľať:
Obsah čísla