What's New

 corpus 
corpus
Creator(s):
Description:
The ensiwiki dataset contains Wikipedia pages sampled from Simple-English and regular English Wikipedia. For each Simple-English page, a paired page was sampled from the regular English Wikipedia if available. The result ...
 This item contains 2 files (917.12 MB).
 
Publicly Available Attribution Required Share Alike
 corpus 
corpus
Description:
CopCo is an eye-tracking corpus tailored to both psycholinguistics and natural language processing. The goal is to investigate reading behavior of Danish texts in various populations. To this end, we record eye movements ...
 This item contains 58 files (99.12 MB).
 
Publicly Available Attribution Required
 corpus 
corpus
Description:
Danmarks Nyere Tid fra Nationalmuseets billedarkiv består af 6834 kulturhistoriske sort-hvide fotografier af håndværk, industri og næringsliv med tilhørende beskrivelser. Fotografierne forestiller alt fra redskaber til ...
 This item contains 26 files (5.14 GB).
 
Publicly Available Attribution Required

Most Viewed Items

Top Last Week
 corpus 
corpus
Creator(s):
Description:
The ensiwiki dataset contains Wikipedia pages sampled from Simple-English and regular English Wikipedia. For each Simple-English page, a paired page was sampled from the regular English Wikipedia if available. The result ...
 This item contains 2 files (917.12 MB).
 
Publicly Available Attribution Required Share Alike
 corpus 
corpus
Description:
Digitalisering og opmærkning af trusselsbreve til projektet 'Truslers sprog og genre', der bygger på en innovativ kombination af sprogvidenskab og genrestudier med det formål at opnå både detaljerede og gennemgribende ...
 This item contains 1 file (347.43 KB).
 
Academic Use Attribution Required Noncommercial
 corpus 
corpus
Description:
Danmarks Nyere Tid fra Nationalmuseets billedarkiv består af 6834 kulturhistoriske sort-hvide fotografier af håndværk, industri og næringsliv med tilhørende beskrivelser. Fotografierne forestiller alt fra redskaber til ...
 This item contains 26 files (5.14 GB).
 
Publicly Available Attribution Required