RWSE Wikipedia Revision Dataset
Datum
2012Personen
Typen
DatasetMetadaten
Zur LanganzeigeBeschreibung
Real-word spelling error datasets mined from the Wikipedia revision history.
Each instance consists of the original sentence with an error and the sentence where the error has been corrected.
An instance also contains the id of the Wikipedia article as well as of the revision, so the instance can be traced back to the original Wikipedia article.
DFG-Fächer
4.43-04 Künstliche Intelligenz und Maschinelle Lernverfahren4.43-05 Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Zugehörige Drittmittelprojekte
Volkswagen | I/82806 | e-NLP - StiftungsmitVerknüpfte Ressourcen
- Ist Anhang zu: https://www.aclweb.org/anthology/E12-1054/
Sammlungen
Die folgenden Lizenzbestimmungen sind mit dieser Ressource verbunden: