View on GitHub

Data Scopes workshop materials

Data Scopes Workshop, 16-20 April 2018

Home | Algemeen | Dag 1 | Dag 2 | Dag 3 | Dag 4 | Dag 5 | Data Scopes Home

Opdracht voor ontdubbelen (disambiguatie) van namen

Introductie

Met deze opdracht krijg je inzicht in de mogelijkheden en moeilijkheden van een bestaande ‘back-of-book‘-index bij digitaal toegankelijk maken van een corpus. Daarvoor moet je data opschonen, ontdubbelen en verrijken.

Vraag: Op welke manier kunnen de Generale Missiven van de VOC inhoudelijk toegankelijk gemaakt worden.

We hebben de beschikking over de registers van de gedrukte delen missiven. Voor de opdracht hebben we er een paar geselecteerd. Zie de toelichting bij de data.

Dataset: Geselecteerde delen Generale missiven. Zie ook de toelichting

De Generale Missiven indices data zijn als gezipt bestand te downloaden. Er is ook een tekstbestand van Generale Missiven deel 13. Blijkbaar zijn de indexen met label 13 stiekem de indexen van deel 10. Hierbij een zip met tekstbestanden per pagina van deel 10.

Opdracht:

Bepaal aan de hand van de beschikbare registers of een samenhangende toegang tot het corpus van generale missiven mogelijk is en hoe dit dan globaal geconstrueerd zou kunnen worden

Uitwerking

Stappen:

Resultaten