Data
CLARIAH ontwikkelt, bewerkt en ontsluit datasets voor onderzoekers uit de brede Humanities en een deel van de Social Sciences.
Hiermee kun je als onderzoeker:
- Bronnenmateriaal verkennen
- Snel starten met exploratief onderzoek
- Datasets koppelen en verrijken
- Nieuwe datasets genereren, transformeren en delen
Ineo: al onze digitale resources op één plek
Met Ineo kunt u digitale bronnen zoeken, doorzoeken, vinden en selecteren voor uw onderzoek in de geestes- en sociale wetenschappen. Geleidelijk aan zal het toegang bieden tot duizenden tools, datasets, workflows, standaarden en educatief materiaal.
Welke data kun je gebruiken?
Natuurlijke taal- en spraakdata
Natuurlijke taal- en spraakdata voor linguïstisch en tekstueel onderzoek, uit de collecties van Meertens Instituut, Huygens Instituut, Instituut voor de Nederlandse Taal en DANS.
Sociaaleconomische data
Sociaaleconomische data uit de historische archieven van overheden, maatschappelijke organisaties, commerciële bedrijven, vakbonden, bevolkingsregisters, volkstellingen, doop- en huwelijksregisters, toegankelijk gemaakt in Linked Open Data-format.
Audiovisuele data
Audiovisuele data, zoals films, tv-programma's, radio-uitzendingen, afbeeldingen, vlogs en opgenomen interviews van het Nederlands Instituut voor Beeld en Geluid, EYE Filmmuseumcollecties, DANS oral history interviewcollecties en collecties uit het Open Images Project.
Tekstuele data
Tekstuele data uit literatuurwetenschappen, geschiedenis, filosofie, theologie en religiestudies, daterend van de Dode Zeerollen tot tweets over de recente gebeurtenissen.
Voor wie is onze data bedoeld?
CLARIAH maakt datasets toegankelijk voor onderzoekers uit een groot aantal disciplines binnen de Geesteswetenschappen en Sociale Wetenschappen. Een goed voorbeeld zijn de gedigitaliseerde kranten van de KB in Delpher die binnen de Media Suite gecombineerd kunnen worden met de historische tv-nieuwsjournaals van Beeld & Geluid. Deze combinatie maakt niet alleen interdisciplinair historisch en taalkundig onderzoek mogelijk, maar kan ook moderne journalistiek en beleidsontwikkeling faciliteren.
Daarnaast worden datasets ontwikkeld voor specifieke disciplines of soorten onderzoek, zoals linguïstiek, sociaal-economische geschiedenis, mediastudies en onderzoek in tekstuele bronnen.
Als derde ontwikkelt CLARIAH datasets die makkelijk te converteren zijn naar de standaarden en tools van disciplines met zeer verschillende werkwijzen, zodat er meer interdisciplinaire onderzoeksvragen gesteld kunnen worden.
Aan de slag met onze data
- De datasets zijn opgeslagen in overeenstemming met generieke en/of onderzoeksdomein-specifieke standaarden.
- Veel van de data zijn toegankelijk via specifieke applicaties.
- De meeste datasets kunnen door elke bezoeker online en/of offline worden gebruikt.
- Bij sommige datasets moeten gebruikers inloggen en is de inhoud alleen te bekijken binnen een afgeschermde omgeving, bijvoorbeeld als er sprake is van vertrouwelijke persoonsgegevens of als er copyright rust op het materiaal.
- Onderzoekers en studenten van Nederlandse universiteiten en kennisinstellingen kunnen meestal gesproken inloggen met de account van hun eigen organisatie.
- Andere professionele gebruikers kunnen toegang aanvragen bij de eigenaar van de dataset.