Translation of null subjects of a literary text by DeepL into pro-drop and non-pro-drop Romance languages

Abstract

Since Chomsky published his Principles and Parameters Theory (1981), where he proposes several linguistic parameters, one of the most studied has been the so-called pro-drop Parameter or Null Subject Parameter, which describes the languages that admit sentences with the presence or elision of the personal pronoun or subject versus languages which oblige the inclusion of the express subject (non-pro-drop languages). However, the non-obligatory nature of the lexical subject will only be given in the case where the information it must provide is given by another sentence element, which is usually the verbal inflection (Chomsky, 1981; Rizzi, 1982). According to the Morphological Uniformity Hypothesis (MUH) (Jaeggli and Safir, 1989), the reason why a language is pro-drop or non-pro-drop is based on the fact that the language is uniform in its verbal inflection. Pro-drop languages include most Romance languages, with French being an exception (Dryer, 2013). The gender of these elliptical subjects (he-she, etc.), however, is left in suspense and is deduced only from the context, not from the sentence itself. This represents an obstacle for neural machine translation (NMT), which often analyzes the sentence as a unit. In the present work we are going to analyze the treatment that DeepL, a free program for NMT, gives to the null subjects from Spanish into two Romance languages: French and Italian, being the first a non-pro-drop language and the second a pro-drop language. For this purpose, we have analyzed the first chapter of the book «The City and the Dogs» by the Nobel Prize winner Mario Vargas Llosa. This analysis, divided into cases of null subjects/pronouns in nominal syntagm (NS) and in verbal syntagm (VS), will allow users of this program to be aware of the errors it makes in cases of null subject ambiguity and, therefore, to better understand how the program works.
  • Referencias
  • Cómo citar
  • Del mismo autor
  • Métricas
Aguilar Canal, E. (2019). Evaluación de la calidad del traductor automático DeepL del inglés al español en textos especializados. Obtenido de Repositorio de la Universidad César Vallejo: https://repositorio.ucv.edu.pe/handle/20.500.12692/39871 [05/08/2021]

Alonso-Ovalle, L. et al. (2002). Null Versus Overt Pronouns and the Topic-Focus. Articulation in Spanish. Rivista di Linguistica 14/2, 1-19.

ALPAC. (1966). Languages and machines: computers in translation and linguistics. Obtenido de National Academy of Sciences, National Research Councel. Washington, D.C.: National Academy of Sciences: http://www.hutchinsweb.me.uk/ALPAC-1996.pdf [05/08/2021]

Arrizabalaga Lizarraga, C. (2020). Sobre fórmulas de tratamiento en el Perú actual. Un análisis de Y de repente, un ángel, de Jaime Bayly. YUYAYKUSUN, 10(1), 97-123.

Bensa, T. (2005). Identidad Latinoamericana en la literatura del boom. Visages d’Amérique Latine. REvista de estudios iberoamericanos, núm. 2, 87-92.

Bengio, Y; Ducharme, R. Vincent, P; Janvin, C. (2003). A Neural Probabilistic Language Model; 1137-1155. Obtenido de Journal of Machine Learning Research 3 : https://www.jmlr.org/papers/volume3/bengio03a/bengio03a.pdf [05/08/2021]

Borer, H. (1984). Parametric syntax: case study in Semitic and Romance languages. Dordrecht: Foris.

Brown, P.; Della Pietra, S; Della Pietra, V. (1993). Las matemáticas de la traducción automática estadística: estimación de parámetros. Lingüística Computacional, 263-311.

Carminati, M. (2002). The processing of Italian subject pronouns (tesis doctoral). Amherst: University of Massachusetts.

Cases, E. (2019). Die Zukunft der Übersetzung mit der neuronalen maschinellen Übersetzung. X-Fage-Kongress. Logroño: FAGE.

Chomsky, N. (1981). Lectures on Government and Binding (7ª edición 1993). Berlín y Nueva York: Mouton de Gruyter.

Chomsky, N. (1986). Knowledge of language: its nature, origin, and use. Nueva York: de Gruyter.

Chomsky, N. (s.f.). A minimalist program for linguistic theory. Obtenido de MIT Ocasional Papers in Linguistics, Cambridge, Mass,The MIT Press: https://www.jstor.org/stable/4176457 [05/08/2021]

Chomsky, N.; Lasnik, H. . (1993). The theory of Principles and Parameters. En J. Jacobs, A. von Stechow, W. Sternfled, & T. Venneman, Syntax: an international handbook of contemporary research, vol. 1 (págs. 506-509). Berlín: de Gruyter.

Costa-Jussà, M. (2018). From Feature To Paradigm: Deep Learning In Machine Translation. Journal of Artificial Intelligence Research 61, 947-974.

Devís, P. (2011). El parámetro del sujeto nulo y la enseñanza del español como lengua extranjera. Reflexión gramatical. Didáctica. Lengua y literatura, 23. Obtenido de http://revistas.ucm.es/index.php/DIDA/article/view/36310

DLE. (2021). Diccionario de la lengua española. Obtenido de https://www.rae.es/tdhle/vusted [12/01/2022]

DPD. (2015). Diccionario panhispánico de dudas. Obtenido de https://www.rae.es/dpd/se [05/08/2021]

Dryer, M. (2013). Expression of pronominal subjects. En M. S. Dryer, & M. Haspelmath, The World Atlas of Language Structures Online. Leipzig: Max Planck Institute for Evolutionary Anthropology.

Fallas Monge, J. y Sancho Ugalde, M. A. (2013). Las variedades del español de Perú: un estudio desde la dialectología. Revista Nuevo Humanismo, 1(1), 49-71.

Fernández Soriano, O. (1999). El pronombre personal. Formas y distribuciones. Pronombres átonos y tónicos. En V. y. Demonte, Gramática descriptiva de la lengua española: sintaxis básica de las clases de palabras (págs. 1209-1274). Madrid: Espasa.

Filiaci, F. (2011). Anaphoric Preferences of Null and Overt Subjects in Italian and Spanish: a Cross-linguistic Comparison (tesis doctoral). Edimburgo: Universidad de Edimburgo.

Fundeu. (2011). El imperativo: ¡sepa cómo utilizarlo! Obtenido de https://www.fundeu.es/escribireninternet/el-imperativo-sepa-como-utilizarlo/

García-Alcaraz, & E. (2015). Comprensión y producción de los pronombres nulos y explícitos de tercera persona en posición de sujeto en la adquisición temprana del español L2 (tesis doctoral). Obtenido de Universidad Pompeu Fabra: https://www.tesisenred.net/bitstream/handle/10803/311971/tega.pdf?sequence=4&isAllowed=y [05/08/2021]

Hyams, N. (1992). A reanalysis of null subjects in child language. En J. Weissenborn, H. Goodluck, & T. Roeper, Theoretical issues in language acquisition: Continuity and change in development (págs. 249-267). Hillsdale: Lawrence Erlbaum.

Jaeggli, O.; Safir, K. (1989). The null subject parameter (Studies in Natural Language and Linguistic Theory 15). Dordrecht, Boston, London: Kluwer Academic Publishers.

Jegerski, J.; Van Patten, B.; Keating, G.D. (2001). Cross-linguistic variation and the acquisition of -pronominal reference in L2 Spanish. Second Language Reasearch, 27 (4).

Jiménez Fernández, A. L., Tubino Blanco, M. (2018). Vagueness in the interpretation of Spanish nosotros: A speech act phrase analysis. En G. Alboiu, 48th Linguistic Symposium on Romance Languages. Toronto: York University.

Kailuweit, R. (2006). «Pro-Drop»; Kongruenz und «optimale Klitika. Ein Beschreibungsansatz im Rahmen der Role and Reference Grammar. Obtenido de Universität Konstanz; Arbeitspapier núm. 120: http://www.romanistik.uni-freiburg.de/kailuweit/downloads/Pro-drop_2006.pdf [05/08/2021]

Keatin, G.D.; Jegerski, J.; Van Patten, B. (2011). Who was walking on the beach? Anaphora resolution in Spanish heritage speakers and adult second language learners. Second Language Acquisition, 33 (2), 193-221.

Le Cun, Y. (2019). Quand la machine apprend. La révolution des neurones artificiels et de l’apprentissage profon. París: Odile Jacob.

Liceras, J.M.; Díaz, L. (1999). Topic-drop versus pro-drop: null subjects and pronominal subjects in the Spanish L2 of Chinese, English, French, German and Japanese speakers. Second Language Research, núm. 15, 1-40.

Liceras, J.M.; Valenzuela, E; Díaz, L. (1999). L1 and L2 developing Spanish grammars and the «pragmatic deficit hipótesis. Second Language Research, núm. 15, 161-190.

Matte Bon, F. (1992). Gramática comunicativa del español. Madrid: Difusión.

Merkert, P. (08 de 2017). Maschinelle Übersetzer: DeepL macht Goggle Translate Konkurrenz. Obtenido de Heise Online; Verlag Heinz Heise: https://www.heise.de/newsticker/meldung/Maschinelle-Uebersetzer-DeepL-macht-Google-Translate-Konkurrenz-3813882.html [05/08/2021]

Perlmutter, D. (1971). Deep and surface structure constraints in syntax. Nueva York: Holt, Rinehart and Winston.

Povedano Guil, P. (1999). La vertiente social de la cortesía castellano-italiano. En L. M. Ladrón de Guevara, Homenaje al profesor Trigueros Cano (págs. 277-295). Murcia: Universidad de Murcia.

Rizzi, L. (1982). Issues in Italian syntax - vol.11 de la serie Studies in Generative Grammar (SGG). Berlín y Nueva York: de Gruyter.

Scarpa, L. (s.f.). Tu, Lei, Voi dans la langue italienne actuelle : aspects culturels, problèmes d’apprentissage, propositions didactiques. Instituto Cervantes. Obtenido de https://cvc.cervantes.es/lengua/coloquio_paris/ponencias/pdf/cvc_scarpa.pdf

Safir, K. (07 de 1982). Syntactic chains and the definiteness effect; Doctoral dissertation. Obtenido de Cambridge, Mass: http://www.ai.mit.edu/projects/dm/theses/safir82.pdf [05/08/2021]

Schmalz, A. (2019). Künstliche Intelligenz. Obtenido de iit-Themenband: https://link.springer.com/content/pdf/10.1007%2F978-3-662-58042-4_12.pdf

Schmidhofer, A.; Mair, N. (2018). Machine translation in translator education. CLINA vol. 4 (2), 163-180.

Sensini, M. (2005). La lingua e i testi. La rifessione sulla lingua. Milán: Mondadori.

Torrejón, A. (1991). Fórmulas de tratamiento de segunda persona singular en el español de Chile. Hispania, 74(4), 1068-1076.

Waldman, G. (2016). Apuntes para una cartografía (parcial) de la literatura latinoamericana a lo largo de los últimos cincuenta años. Del Boom a la nueva narrativa. . Revista Mexicana de Ciencias Políticas y Sociales - Universidad Nacional Autónoma de MéxicoNueva Época, Año LXI, núm. 226, 355-378.

Werthmann, A.; Witt, A. (2014). Maschinelle Übersetzung - Gegenwart und Perspektiven. En Translation and Interpretation in Europe. Contributions to the Annual Conference 2013 of EFNIL in Vilnius (págs. 79-103). Fránkfort del Meno; Berlín; Berna; Bruselas; Nueva York; Oxford; Viena: Peter Lang.

Wexler, T.; Manzini, R. (1987). Parameters and learnability in binding theory. En T. Roeper, & E. Williams, Parameter-setting (págs. 41-76). Dordrecht: Reidel.

Wu, Y. e. (26 de 09 de 2016). Bridging the Gap between Human and Machine Translation. Obtenido de Cornell University: https://arxiv.org/abs/1609.08144 [05/08/2021]
Nieto García, P., & Cases Berbel, E. (2022). Translation of null subjects of a literary text by DeepL into pro-drop and non-pro-drop Romance languages. CLINA Revista Interdisciplinaria De Traducción Interpretación Y Comunicación Intercultural, 7(2), 41–59. https://doi.org/10.14201/clina2022724159

Downloads

Download data is not yet available.
+