Como ya seguramente sabéis, hace tiempo que desde nuestra querida Telefónica se empujó para que la Inteligencia Artificial (y la tecnología en general) hiciera buen uso de nuestra lengua española. Esta iniciativa la tomó como bandera la Real Academia de la Lengua Española, que lo convirtió en un proyecto de estado al que puso el bonito nombre de LEIA. El objetivo último de LEIA no es otro que preocuparse de que la tecnología mime a nuestra lengua y no la dañe por medio de las herramientas mal construidas, inteligencias artificiales mal entrenadas y el uso de recursos erróneos.
La historia de un relato para vencer a la Inteligencia Artificial
Esta historia no es nueva, pues la he compartido con vosotros, queridos zendianos, desde el primer momento que comenzamos con ella. Con mi equipo de Ideas Locas hicimos una inteligencia artificial llamada Maquet que, partiendo de un texto que escribí yo, lo transformaba al estilo que utiliza el maestro en sus novelas del Capitán Alatriste. No era perfecta, ni mucho menos, así que para tener una comparación entre el intelecto original —del maestro— y la copia —de Maquet—, Don Arturo destrozó la falsificación con una interpretación de la historia original hecha por él mismo.
Aquel relato, que el gran maestro tituló como “La noche de los aceros”, quedó precioso, y podéis ver la comparación en el artículo de ‘El futuro está por hackear’ que publiqué al respecto:
La noche de los cuchillos: La inteligencia artificial frente a Arturo Pérez-Reverte
De aquel proyecto sacamos mucho aprendizaje, mucho debate y tres relatos escritos por un escritor aficionado —yo—, una inteligencia artificial —Maquet— y un maestro de la lengua española. Y nos iba a dar mucho más juego de lo que pensamos en un inicio.
La historia de un relato que se convirtió en un libro
Tiempo después, con Juan Luis Cano, ilustre gomaespumero, pergeñamos la idea de hacer un libro de relatos para donar el dinero ganado a proyectos sociales de la Fundación Gomaespuma. Como siempre, hicimos una llamada a amigos y participaron en el proyecto Salvador Larroca, JM Ferri, Ángel Miranda, Javi Padilla, Antonio Castelo, Juan Carlos Galindo, Saúl Cepeda, Pablo González, Jorge Bermúdez, Miguel Campos Galán, Daniel Parra y Selva Orejón, además de un servidor y el propio Juan Luis. Como era una recopilación de relatos, le pedimos permiso al jefe para incluir también el relato de La noche de los cuchillos junto con el mío y el que hizo Maquet, y por supuesto accedió.
El libro, que estaba compuesto por un conjunto de relatos para gastar tiempos perdidos en algo útil, lo titulamos Relatos para hackear el tiempo, y la portada la hice con mi hija pequeña, con Mi Survivor, para que ella también participara en un proyecto tan chulo. Aún puedes comprarlo y colaborar.
El relato se convirtió en NFT
Vale, vale, vale. Es cierto, me he retrotraído un poco atrás en el tiempo, pero es que me gusta que sepáis de dónde vienen las cosas, que las ideas y las buenas historias no aparecen por casualidad. Dejadme continuar, que con el tiempo en Telefónica lanzamos una tienda online de NFTs desde la unidad de innovación —y de la mano de nuestra Chief Metaverse Officer Yaiza Rubio— en la que pusimos, como prueba, algunos originales digitales de autores y artistas.
Ya os conté en qué consistía crear esos NFTs de los originales digitales de los escritores en el artículo del ‘El-Italiano.docx: Las obras de arte únicas en el mundo digital y el expolio de los maestros’, donde hablaba de en qué consiste esto en concreto.
Así que, hablando con Leandro Pérez y con Arturo Pérez-Reverte, les propuse hacer una prueba y convertir el archivo original del maestro, llamado Maquet.docx, en un NFT y ver qué interés había por los originales digitales de los escritores. El objetivo que tenemos es ayudar desde Zenda Libros a los escritores a gestionar sus originales digitales, a cuidarlos, monetizarlos y hacer que esos archivos tengan el valor que merecen.
Dicho y hecho, convertimos ese archivo Maquet.docx en un NFT que pusimos a la venta… y que voló. La verdad. Menos que un chocolate en la puerta de un colegio, que decía mi mamá cuando yo era pequeño. Y ahora estamos pensando en qué preparamos para el año que viene desde Zenda Libros con el resto de los escritores.
Un relato que se convirtió en un ejemplo de LEIA
Y ahora llega la parte final de este relato. Si has sido bueno y has aguantado hasta aquí te mereces el premio de saber por qué cuento esta historia tan larga. Veréis: cuando estábamos haciendo el NFT de este archivo original, yo me fijé en todos los detalles que había en él. Como los estudiosos que se encuentran un original manuscrito y revisan todas las pistas para saber más sobre el relato y más sobre el autor.
Yo comencé mis conferencias internacionales de hacking hablando de una cosa que tenía que ver mucho con esto. Se trataba de localizar todos los detalles de los archivos públicos de una organización para hacer inteligencia y preparar un esquema de ataque contra ella. Pero… ya os contaré más adelante anécdotas de esas charlas, en las que con los metadatos hacía demostraciones con la Casa Blanca o la Agencia de Misiles Americana.
Lo cierto es que una vez con el original en la mano, a punto de convertirlo en un NFT, puedes saber muchas cosas. Muchos detalles. Por ejemplo, cómo es la forma personal en la que Don Arturo trabaja. Como podéis ver en la imagen anterior, pone el título en negrita y centrado. Párrafos justificados. Sangrada la primera línea de cada párrafo. Salto de línea entre cada párrafo. Y la tipografía que usa es… bueno. Averígualo y juega a ser un poco hacker. Déjalo después en los comentarios, así sé que has prestado atención hasta ahora.
También: el nombre del archivo es Maquet.docx, y en los metadatos se puede ver que utiliza un sistema Microsoft Windows con Microsoft Office. Os podría decir que la versión que utiliza de Microsoft Word es una versión no actualizada —que tiene ya unos años—, pero no quiero desvelar la versión exacta, pues me da para un artículo en mi blog hablando de esto. Eso sí, está en formato OOXML (esto es para los más entendidos).
Sí, todo esto está en los metadatos del archivo original y en el NFT, que al final es para esto para lo que los estudiosos y los amantes de un escritor quieren sus originales. Para saber cosas de una historia que no saben los demás.
También se puede descubrir que el documento del relato, que es de tres páginas, lo escribió del tirón. Luego lo imprimió. Y después volvió a guardar cambios. Así que entiendo que lo escribió del tirón, lo revisó manualmente una vez impreso, modificó algo. Lo grabó, y me lo envió.
¿Me equivoco, Don Arturo?
El error de Microsoft Word en el corrector
Los que habíais leído el relato de La noche de los aceros seguramente no habéis visto nunca esto que veis en la imagen. He de explicaros que está en texto blanco sobre fondo negro y no en texto negro sobre fondo blanco porque yo trabajo desde hace años en lo que se conoce como “modo nocturno”. En ese modo se usa el contraste invertido para gastar menos baterías en los portátiles con la energía de la pantalla.
Pero salvo ese detalle de la imagen, el resto es como lo ve y lo trabaja Don Arturo. Y, como veis en la imagen, hay una cosa que yo noté que llama poderosamente la atención. Y es que la herramienta de Microsoft Word marca una frase del relato como un error semántico. Es decir, como que algo no estaba bien escrito acorde al corrector que esta herramienta ofimática tiene. Es la línea azul debajo de “muchos azumbres”.
Yo me quedé con la copla para revisarlo y por eso os estoy escribiendo este artículo hoy.
La primera reflexión que saqué es evidente: Don Arturo no tiene activado el corrector sintáctico ni el corrector semántico.
La segunda reflexión que se me vino encima es… ¿quién lleva razón? Vale, es trampa. Aquí ya todos sabemos quién tiene razón, pero podría haber cabido esa reflexión si no conociéramos a la persona, así que seguí los pasos necesarios para entender dónde estaba el error. El primero de ellos, preguntarle a Microsoft Word por qué estaba marcando ese error semántico en “muchos azumbres”.
Yo, confieso, no tenía claro dónde podría estar la discordancia, porque “muchos azumbres” me suena perfectamente escrito, pero… muchas veces he errado y muchas aún erraré en el futuro, que mi cabeza me la juega y mi conocimiento es limitado.
Como podéis ver, el corrector semántico de Microsoft Word piensa que “azumbres” es femenino y, por tanto, es un error utilizar “muchos” en lugar de “muchos”. A lo mejor el texto de Don Arturo le hubiera caído más simpático al corrector si hubiera escrito “muchx” o “muches” azumbres, pero no veo yo al maestro escribiendo una historia de El Capitán Alatriste en tales términos.
Lo cierto es que quería encontrar el origen de ese error, así que fui a cerciorarme primero a la fuente. Acudí al diccionario de la RAE para localizar “esxs azumbres” y poderlos sexar en firme de una vez. Así que nada, consulta al diccionario y resuelto el misterio del sexo de los ángeles… digo de “aquestes” azumbres.
Dicho esto, está claro que Don Arturo no ha cometido entonces ningún error semántico en su escritura. Y es un error, de falta de conocimiento y por no utilizar las herramientas adecuadas para entrenar al corrector ortográfico, de Microsoft Word. Si hubiera ido a nuestra fuente, esto no le hubiera pasado.
¿Pero dónde está el problema?
Pues el problema viene de que tanto Google como Microsoft han estado utilizado diccionarios de otras empresas —anglosajonas para más detalle— para entrenar su tecnología en nuestra lengua. Ahora, Microsoft ha incluido el Diccionario de la RAE en la búsqueda de sus definiciones en Bing —Google aún está en proceso— (https://www.zendalibros.com/el-diccionario-y-los-buscadores-de-internet/). Esto hace que si buscamos la definición de “azumbre” en Bing veamos que obtenemos el resultado correcto.
Pero está claro que Microsoft Word aún no ha sido actualizado al uso del diccionario de la RAE en todas sus versiones. Teniendo este error semántico, ¿qué es lo que provoca? Pues que la gente como yo, que tenía dudas de si “azumbre” es masculino o femenino, tienda a pensar que está equivocado él, acepte la sugerencia del cambio del corrector semántico de Microsoft Word y haga que “azumbre” sea cada vez más femenino, en lugar de dejar que la lengua evolucione por sí misma. Es decir, un error de una herramienta por utilizar un diccionario que no es nuestro diccionario oficial de la RAE, hace que el futuro de nuestra lengua se modifique. Os hablé largo y tendido de este efecto en el artículo de ‘La viralización de los errores y el cercenamiento del lenguaje’.
Y si has llegado hasta el final, te mereces un premio. Espero que os haya gustado el relato que os he contado, donde he querido convertirlo en una historia para aprovechar y contaros muchas cosas alrededor del mensaje principal del artículo, que es lo que hace que las lecturas nos enganchen un poco más.
Zenda es un territorio de libros y amigos, al que te puedes sumar transitando por la web y con tus comentarios aquí o en el foro. Para participar en esta sección de comentarios es preciso estar registrado. Normas: