lunes, 04 marzo 2013
De picas y de famas (4)
Me entró la duda de que se cumpliera la desigualdad triangular. Entonces traté de encontrar un contraejemplo calculando la distancia de una cantidad muy grande de palabras con ayuda del computador. Al comienzo de los años 90 los PC no eran muy potentes. Mi programa calculó día y noche durante una semana sin llegar a encontrar un solo error.
Comentando estas dificultades con mi amigo Ascánder, me dio una idea genial. Como la fórmula funcionaba para palabras de la misma longitud, me dijo que podría considerar que dos palabras eran siempre de longitud igual rellenando la más corta con espacios. ¡Por fin pude probar que la fórmula así modificada era una distancia!
Me puse a la tarea de crear un prototipo de corrector ortográfico para la base de datos terminológica a partir de unas cincuenta mil palabras por idioma. Empecé con inglés, francés y español. El programa calculó día y noche durante una semana completa hasta llegar a una tabla completa de distancias que me daba resultados muy buenos y sugerencias de corrección impecables.
Todavía funciona en línea. Si uno busca una palabra que no está en la base, la interface propone una lista de palabras parecidas por si acaso se trata de un error de escritura.
Recuerdo que escribí un artículo para una revista especializada. La opinión del revisor del artículo era que a pesar de ser en efecto una fórmula de distancia, yo no había mostrado en qué era superior a la fórmula de distancia más comúnmente utilizada en informática y que consistía en calcular la distancia a partir del mínimo número de operaciones de edición necesarias para pasar de una palabra a otra con adiciones y supresiones de letras. Tenía razón, pero ese no era mi objetivo. Yo no quería demostrar que mi fórmula era mejor sino simplemente mostrar que funcionaba y era fácil de calcular.
Desistí de enviar el artículo a ese tipo de revistas, pero tuve la ocasión de presentarlo en una conferencia de ingeniería de terminología y bases de conocimientos en Alemania (TKE 1996). No estoy seguro de que el público haya entendido muy bien mi presentación, pero estuvo muy atento escuchándome.
Hoy podría adaptarla fácilmente al árabe y ruso, pero no vale la pena, ya que la mayor parte del tiempo las búsquedas se hace en inglés. Cuando uno busca en Google, el sistema propone palabras similares en caso de que no encuentre lo que uno busca o de que sospeche que uno busca otra cosa. Esos algoritmos de distancia están escondidos detrás de la pantalla. Curioso que un juego infantil me haya permitido realizar ese corrector ortográfico.
19:26 Anotado en Elucubraciones | Permalink | Comentarios (0) | Tags: programación, informática
domingo, 03 marzo 2013
De picas y de famas (3)
Cuando mi amigo Rodrigo supo que yo estaba escribiendo un programa para jugar Picas y Famas se interesó mucho en el algoritmo y en las bases matemáticas que empleaba. En esa época, él trabajaba en un ministerio, quizás el de hacienda. Se le ocurrió que la fórmula podría servir para encontrar no sé qué similitud entre los números de las cédulas de ciudadanía. Programó una prueba para ver si le funcionaba pero se equivocó en los parámetros pues en lugar de imprimir unas pocas páginas, usó una caja entera o más de papel perforado con copia de carbón que era de los más caros. Me contó que le tocó inventar una excusa para evitar problemas.
No sé quién nos dio la idea de escribir un artículo para una revista especializada. Lo cierto es que nunca lo escribimos y lo único que quedó fue el programa de demostración para cuando los estudiantes de informática fueran a visitar el centro de cálculo. Ni siquiera guardé copia para mí. Cuando cambiaron el computador solo me quedó el recuerdo.
Pasaron más de diez años hasta que tuve otra oportunidad de revivir la fórmula de las picas y famas para una aplicación diferente. Se trataba de un corrector ortográfico que propusiera palabras correctas suficientemente cercanas a la equivocada. Era para una base de datos terminológica. Me acordé del juego y empecé a ver si podía escribir una fórmula que cumpliera con la definición matemática de distancia.
Una función de distancia o métrica debe cumplir tres condiciones:
- La distancia entre dos puntos debe ser cero o positiva.
- Debe ser simétrica, es decir la distancia de A a B debe ser igual a la distancia de B a A y
- Las distancias entre tres puntos A, B y C deben cumplir la desigualdad triangular, es decir la suma de las distancias de A a B y de B a C siempre debe ser mayor a la distancia de A a B cualesquiera que sean los puntos A, B y C.
La función que me inventé calculaba un valor entre 0 y 1 a partir del número de picas y famas que tenían dos palabras entre sí. Mientras más parecidas, el valor era más cercano a cero; mientras más diferentes, el valor era más cercano a uno.
Pasé días tratando de probar matemáticamente que mi fórmula era una distancia. Lo pude demostrar para palabras que tuvieran el mismo número de letras, pero todo se complicaba con longitudes desiguales pues no llegaba a demostrar la desigualdad triangular.
19:22 Anotado en Elucubraciones, Juegos, Recuerdos | Permalink | Comentarios (0) | Tags: programación, informática
lunes, 25 febrero 2013
Lincoln
Spielberg ha logrado realizar un filme muy interesante y actual. Me dejó una impresión de fidelidad tanto en el decorado como en el reflejo de la mentalidad de ese entonces. La hora y media de proyección pasó volando y yo que tenía miedo de que se me hiciera muy largo. La actuación de Daniel Day-Lewis es muy convincente y natural. No por nada ayer obtuvo el óscar del mejor actor. Claro que no se puede comparar con películas de la época ya que no existía el cine en la Guerra de Secesión y no sabemos cómo era el presidente Lincoln en realidad. Cuando uno se deja llevar por la trama y se siente en la problemática del voto para abolir la esclavitud, es increíble que se haya logrado un cambio tan radical en la constitución estadounidense de manera democrática (aunque se paguen votos con puestos en el gobierno). Para los sudistas, se trataba de una guerra entre dos naciones, pero para los nordistas, era una guerra contra una rebelión. El tema es muy actual, ya que es lo que sucede actualmente en Siria y que lleva setenta mil muertos. Curiosamente los que estaban a favor de la esclavitud eran los demócratas, mientras que los republicanos eran los abolicionistas. Hoy los retrógrados y conservadores son los republicanos y los demócratas los que empujan al cambio. Me gustaría saber qué ideas actuales que no nos chocan van a ser consideradas retrógradas dentro de un siglo. La política es un asunto difícil. Convencer a la gente para que acepte cambios radicales es un problema delicado.
Lincoln
Date de sortie 30 janvier 2013 (2h29)
Réalisé par Steven Spielberg
Avec Daniel Day-Lewis, Sally Field, David Strathairn
Genre Biopic, Drame
Nationalité Américain
Synopsis : Les derniers mois tumultueux du mandat du 16e Président des États-Unis. Dans une nation déchirée par la guerre civile et secouée par le vent du changement, Abraham Lincoln met tout en œuvre pour résoudre le conflit, unifier le pays et abolir l'esclavage. Cet homme doté d'une détermination et d'un courage moral exceptionnels va devoir faire des choix qui bouleverseront le destin des générations à venir.
15:48 Anotado en Películas, Política | Permalink | Comentarios (0) | Tags: cine, estados unidos, drama