diff --git a/test/data/ras-dtd-1.0.readalong b/test/data/ras-dtd-1.0.readalong new file mode 100644 index 00000000..5c78c992 --- /dev/null +++ b/test/data/ras-dtd-1.0.readalong @@ -0,0 +1,24 @@ + + + + +
+

+ Bonjour. + Je m'appelle Éric Joanis. + Je suis programmeur au sein de l'équipe des technologies pour les langues autochtones au CNRC. +

+
+
+

+ J'ai fait une bonne partie de ma carrière en traduction automatique statistique, mais maintenant cette approche est déclassée par l'apprentissage profond. + En ce moment je travaille à l'alignement du hansard du Nunavut pour produire un corpus bilingue anglais-inuktitut. + Ce corpus permettra d'entraîner la TA, neuronale ou statistique, ainsi que d'autres applications de traitement du langage naturel. +

+

+ En parallèle, j'aide à écrire des tests pour rendre le ReadAlong-Studio plus robuste. +

+
+ +
+
diff --git a/test/test_dtd.py b/test/test_dtd.py index 3e36e749..414cf543 100644 --- a/test/test_dtd.py +++ b/test/test_dtd.py @@ -58,6 +58,18 @@ def test_invalid_inputs(self): self.dtd.validate(parsed), f"{name} validates but shouldn't" ) + def test_backwards_comparability(self): + # the DTD needs to be backwards as long as the major version does not change + previous_versions = """ + ras-dtd-1.0.readalong + """.strip().split() + for name in previous_versions: + path = os.path.join(dirname(__file__), "data", name.strip()) + # DTD is text, XML is binary... okay + with open(path, "rb") as infh: + parsed = etree.parse(infh) + self.assertTrue(self.dtd.validate(parsed), f"{name} does not validate") + if __name__ == "__main__": main()