Crawling the web

Deze periode wederom een nieuwe opdracht. Omgaan met visuele data uit databases en deze beschikbaar maken. Welke data en op welke manier hiermee omgaan is aan ons. Na bezig te zijn geweest met het idee een ‘interactie ontwerpen’ tijdlijn te creeren, kwam ik erachter dat de verbanden van de items binnen zo’n tijdlijn eigenlijk het interessantst zijn.
Verbanden dus, vanuit eigen interesse wilde ik graag kijken hoe bijvoorbeeld schrijvers op elkaar reageren met hun boeken. Deze schrijvers reageren op een onderwerp en wat daar al over is geschreven, dat onderwerp kan behoorlijk interessant zijn. Na overleg met docenten lijkt het interessanter om te kijken of webpagina’s ook zulke verbanden hebben. In webpagina’s kun je namelijk goed geautomatiseerd zoeken.
Na wat aanwijzingen en zoeken kwam ik uit bij issuecrawler van Govcom.org Het concept wat ik tot op dat moment had ontwikkeld was het volgende. Als er op een pagina gelinkt wordt naar de bronnen die gebruikt zijn om bijvoorbeeld een stuk programmatuur te maken of waar inspiratie op is gedaan om een bepaald werk te maken. Dan kun je er ( niet in alle gevallen ) vanuit gaan dat die pagina relevant is aan het werk dat gepresenteerd wordt op de website die jezelf bekeek. Op die tweede website zou je ook weer alle links af kunnen lopen om te zien waar die naar toe linken. Dan kom je dus op een heleboel “3e website’s” terecht over allerlei verschillende websites. Maar er wordt in die stappen natuurlijk ook een aantal keren naar dezelfde sites gelinkt. Die blijken dan dus relevanter te zijn.
Als je nu ook nog eens niet 1 maar 2 of meer websites als startpunt geeft kun je ook zoeken waar de twee zoek bomen die ontstaan elkaar raken. Dit zou dan de overlap in onderwerp zijn van je twee startsites(zie afbeelding).
Issuecrawler van Govcom.org doet dit, van elke website die je opgeeft alle links afgaan enzovoorts. Hoe gelinkt wordt, wordt opgeslagen in een XML bestand. En vanaf daar wil ik mijn concept weer oppakken. Ik wil graag de meest relevante website’s visueel aanbieden.
