piek vu

Functietitel Wetenschappelijk Programmeur
Fte 0.6-0.8
VU eenheid FGW
Vacaturenummer 17341
Publicatiedatum 30 november 2017
Sluitingsdatum 15 februari 2018

De Vrije Universiteit Amsterdam (VU) is een vooraanstaande, innovatieve en groeiende universiteit die midden in de samenleving staat en actief bijdraagt aan de ontwikkelingen in onderwijs en onderzoek. Onze breed georiënteerde universiteit telt tien faculteiten, verschillende instituten, stichtingen en onderzoekscentra, en ondersteunende diensten. Op de campus aan de snelst groeiende economische regio van Nederland (de Zuidas), werken ruim 4.500 medewerkers en volgen ruim 23.000 studenten wetenschappelijk onderwijs.

Piek VossenHet Computational Lexicology and Terminology Lab (CLTL) onder leiding van Spinozaprijswinnaar Prof. Dr. Piek Vossen zoekt per direct een wetenschappelijke programmeur met interesse voor taaltechnologie. CLTL heeft in het NewsReader project  een pipeline architectuur ontwikkeld met software modules waarmee Nederlandse teksten semantisch geïnterpreteerd kunnen worden. De software bepaalt welke gebeurtenissen worden genoemd, wie er bij betrokken zijn, waar en wanneer die hebben plaatsgevonden, wat het sentiment is van de genoemde bronnen over die gebeurtenissen, etc.  Deze interpretaties worden opgeslagen in een XML formaat, het zogenaamde Natural Language Annotation Format  (NAF). Verder genereert de software een representatie in RDF die het mogelijk maakt om over de data te redeneren. De RDF representaties worden opgeslagen in een zogenaamde Triple store waar ze door middel van SPARQL bevraagd kunnen worden. De kandidaat zal zorgdragen voor het beheer van deze unieke Nederlandse Natural Language Processing (NLP) pipeline.

CLARIAH logoTDe werkzaamheden worden uitgevoerd in het NWO-roadmap project CLARIAH waarin samengewerkt wordt met onderzoekers uit heel Nederland om een onderzoeksinfrastructuur te ontwikkelen voor de geesteswetenschappen. Verder wordt er samengewerkt met het departement van computer science bij de VU, het eScience instituut voor demonstrators en met buitenlandse onderzoekers.

Functie-inhoud

De kandidaat wordt verwacht ondersteuning te leveren aan het onderhoud, gebruik en verdere ontwikkeling van deze pipeline:

  • Standaardisatie en metadatabeheer;
  • Software release en versioning van modules;
  • Testing;
  • Logging;
  • Distributieve parallelle installaties en processing;
  • Compilatie, installatie en packaging (bijv. VMs, Docker);
  • Procesmanagement;
  • Integratie in Virtual Research Environment voor studenten en onderzoekers in de geesteswetenschappen;
  • Installatie en onderhoud van demonstrators.

Functie-eisen

  • MA in computer science of een vergelijkbare titel en/of ervaring;
  • Ruime ervaring met diverse programmeertalen, waaronder Java en Python;
  • Ruime ervaring met Unix-achtige systemen (Linux en Mac);
  • Ervaring in het werken binnen een team van onderzoekers;
  • Servicegericht zijn.
  • Ervaring met grootschalige en complexe Big Data processing flows;
  • Kennis van standaardisatie van data in zowel NLP als Semantic Web;
  • Ervaring met het werken met NLP software;
  • (bij voorkeur) ervaring met Sparql en triple stores;
  • (bij voorkeur) ervaring met web-based clients voor visualisatie en demonstratie;

Bijzonderheden

De arbeidsovereenkomst wordt in eerste instantie aangegaan voor een periode van          

1 jaar.  Verlenging van de arbeidsovereenkomst behoort tot de mogelijkheden.
Voor de CLARIAH werkzaamheden is een invulling van minimaal 0.6 fte en maximaal 0.8 fte nodig.

De Vrije Universiteit heeft aantrekkelijke secundaire arbeidsvoorwaarden en regelingen zoals:

  • 8,3% eindejaarsuitkering en 8% vakantietoeslag;
  • Goede pensioenregeling (ABP);
  • Minimaal 29 vakantiedagen bij volledige arbeidsduur;

Salaris

Het salaris bedraagt afhankelijk van opleiding en ervaring minimaal € 2.588,- en maximaal € 4.084,- bruto per maand (salarisschaal 10) bij een voltijds dienstverband.

Informatie

Voor meer informatie kunt u contact opnemen met:

Prof dr. Piek Vossen

tel.: 020 59 86457

e-mail:

website: www.cltl.nl

Sollicitatie

Kandidaten kunnen solliciteren naar deze functie door een motivatiebrief, curriculum vitae en lijst van uitgevoerde softwareprojecten en publicaties onder vermelding van het vacaturenummer in de e-mail header uiterlijk 15 februari 2018 te sturen aan:

Vrije Universiteit Amsterdam

T.a.v. Faculteit der Geesteswetenschappen

Prof dr. Piek Vossen

Het vacaturenummer graag vermelden in de e-mail header of linksboven op uw brief en envelop.

Acquisitie naar aanleiding van deze advertentie wordt niet op prijs gesteld.

Krantencollecties kunnen een belangrijke historische bron zijn voor onderzoek naar planten en dieren. Ze geven met name informatie over mens-natuur interacties. Het doorzoeken van grote krantencollecties brengt echter ook problemen met zich mee. Een simpele zoekopdracht op soortnaam levert vaak een enorme hoeveelheid niet-relevante resultaten op. Het gaat hierbij vaak om persoonsnamen, bijvoorbeeld ‘meneer Wolf’, of spreekwoorden, zoals ‘een addertje onder het gras’. Het CLARIAH Serpens-project zoekt naar computationele oplossingen voor deze problemen. Als casus kijken we naar vermeldingen van “ongedierte” en “hinderijke” soorten in de krantencollectie (1800 – 1940) van de Koninklijke Bibliotheek. Het doel is deze collectie contextueel doorzoekbaar te maken, zodat niet-relevante resultaten weggefilterd kunnen worden. Het combineren van technieken uit de computationele taalkunde met historisch-ecologische vragen maakt dit project uniek. 

Met de workshop willen we de mogelijkheden in kaart brengen die ontstaan wanneer historische krantencollecties gebruikt worden voor onderzoek naar exoten. Ook hopen we zicht te krijgen op de knelpunten bij deze vorm van onderzoek.

Welke vragen kunnen er beantwoord worden met behulp van historische kranten? Hoe willen gebruikers krantencollecties doorzoeken? Welke informatie kan er uit de kranten gehaald worden? Om deze en meer vragen te beantwoorden, brengen we experts uit de beleids- en onderzoekswereld op het gebied van exoten, historisch ecologen, collectiebeheerders van de KB en wetenschappers uit de computationele taalkunde bijeen.

U bent van harte uitgenodigd om de workshop bij te wonen, opgeven kan door een email te sturen naar . Aan deelname zijn geen kosten verbonden. De workshop zal plaatsvinden op donderdag 25 januari in Nijmegen. 

Programma:

12.30-13.00 Welkom met koffie en thee
13.00-13.10 Openingswoord door Rob Lenders
13.10-13.30 ‘Computationele oplossingen voor het doorzoeken van grote collecties historische kranten’ door Marieke van Erp
13.30-13.50 ‘Op jacht naar de bunzing en de lynx: twee voorbeelden uit de KB-krantencollectie’ door Thomas van Goethem
13.50-14.00 Koffiepauze
14.00-14.45 Workshop: In tweetallen aan de slag met geannoteerde datasets van bijvoorbeeld de muskusrat, zonnebaars en Japanse duizendknoop  (deelnemers kunnen ook zelf soorten inbrengen om mee aan de slag te gaan)
14.45-15.30 Plenaire discussie
15.30 Borrel

Digitalisering Surinaams slavenregister van start

 
Het digitaliseren is een samenwerking tussen de Radboud Universiteit Nijmegen en de Anton de Kom Universiteit NOS

In Nederland is het heel gemakkelijk: de archieven induiken om uit te zoeken wie je voorouders zijn. Maar dat geldt niet voor mensen van Surinaamse afkomst. Hun register ligt in Suriname en is niet digitaal toegankelijk. Voor Surinaamse Nederlanders is het de enige bron om inzicht te krijgen in het slavernijverleden van hun familie. Een groep vrijwilligers begint woensdag met het digitaliseren van het register.

Volledige NOS-artikel staat hier.

Dit is onderdeel van het Research Pilot Project CoDoSis.

logo KB

Sinds de lancering van het KB Lab in 2013 is de website dé plek voor alle digitale experimentele tools en datasets van de KB.

Het KB Lab is steeds aangevuld met nieuwe tools en datasets die zijn gemaakt in samenwerking met KB-researchers-in-residence en de KB-fellows, tot we het punt bereikten dat we een nieuwe website nodig hadden om (nieuwe) inhoud makkelijker te kunnen vinden, te gebruiken en te integreren in onderzoek.

Met veel plezier kunnen we nu de vernieuwde KB Lab-website presenteren. We nodigen u hiervoor van harte uit op dinsdag 11 april 2017 van 14.00 – 18.00 uur in de KB in Den Haag.

Meer informatie over het programma en de workshops, staat hier op de website van de KB.

Deadline aanvraag maandag 19 juni 2017 logo uuT
Datum workshop 7-8 november, 2017
Locatie Utrecht
Taal NL De workshop in principe in het Nederlands (want gebaseerd op Nederlandstalige bronnen). Als een deelnemer alleen Nederlands leest en niet spreekt, is dat geen enkel probleem: een goede leesvaardigheid in het Nederlands is echter een must!

Achtergrond

De afgelopen jaren is via de applicatie Delpher van de Koninklijke Bibliotheek (KB) in Den Haag een grote hoeveelheid gedigitaliseerde Nederlandstalige kranten beschikbaar gekomen. Een van de manieren om deze grote hoeveelheid data toepasbaar te maken voor onderzoek is textmining. Met deze digitale onderzoekstechniek isoleer je met behulp van algoritmes patronen, trends of specifieke categorieën tekst uit de data. Zo kunnen allerlei onderzoeksvragen worden beantwoord.

Om onderzoekers te helpen de gedigitaliseerde kranten van de KB zinvol te doorzoeken en om hen handreikingen te doen om de zoekresultaten te analyseren, werd binnen het onderzoeksproject Translantis de textmining-tool Texcavator ontwikkeld. Met deze tool kunnen gebruikers bijvoorbeeld grote hoeveelheden bronnenmateriaal met onder meer word clouds, timelines en concept mining contextualiseren, artikelen bijeen brengen voor close reading en verder analyseren met behulp van andere tools uit de digitale geesteswetenschappen. In deze workshop leer je hoe je textmining en Texcavator kunt gebruiken in je eigen onderzoek.

Opzet

Tijdens deze workshop wordt een korte introductie gegeven van digital humanities in het algemeen en textmining in het bijzonder. Daarna krijg je uitgebreid uitleg over Texcavator en andere instrumenten voor textmining. Vervolgens kun je met behulp van deze tool aan de slag met je eigen onderzoeksvraag.

De workshop staat open voor allerlei type onderzoeksvragen die betrekking hebben op (een deel van) de periode 1850-1990 en die de gedigitaliseerde kranten van de KB als bron gebruiken. De onderzoeksvraag moet zich richten op een specifieke casus, waarbij het gebruik van textmining bijdraagt aan de analyse. Geschikte onderzoeksvragen hebben bijvoorbeeld betrekking op:

  • de veranderende inhoud van een bepaald genre krantenartikel
  • de receptie van films
  • de handel in bepaalde goederen
  • het veranderen van een intellectueel concept door de tijd heen

 Geselecteerde deelnemers(groepjes) worden na afloop van de workshop uitgenodigd om hun onderzoek uit te werken tot een artikel.

Deelname

Onderzoekers kunnen individueel of in groepjes van maximaal drie personen deelnemen. Eerdere ervaring met digitale onderzoekstechnieken is niet nodig; er zal tijdens de gehele workshop begeleiding zijn vanuit het Translantis-team. We moedigen specifiek RMA-studenten aan om te deel te nemen. Aan deelname zijn geen kosten verbonden.

Deelnemers worden geselecteerd op basis van een ingestuurd abstract (max. 500 woorden), waarin wordt toegelicht hoe het gebruik van textmining kan helpen een antwoord te vinden op hun concrete onderzoeksvraag. Tevens wordt deelnemers gevraagd een korte biografie mee te sturen (ca. 100 woorden). De deadline is maandag 19 juni 2017.

Stuur inzendingen naar Peter van den Hooff ().