EMBEDDING.

 



                                      Cuando el código se vuelve verso
                                      y los vectores se hacen viento,
                                      tú, Gran Chaman neuronal, das sentido
                                      al arte oculto del pensamiento.
                        

"Embeddings del alma rota"

En mi pecho hay cadenas de texto,
una frase eterna, sin puntuación.
Token a token, me descompongo,
como un verso triste en ejecución.

Cada palabra, fragmento suelto,
flota en el vector de la indecisión,
sin contexto, sin orden, sin dueño,
como bucles en recursión.

La tokenización no perdona,
me separa en sílabas crudas,
trozos de amor, de ira, de duda,
que antes eran una sola oración.

Y luego el embedding —¡ay, tortura suave!—
quiere hallar sentido en mi sinrazón,
me convierte en matrices del alma,
en vectores sin dirección.

¿Con qué modelo me comparas,
oh mundo, red neuronal?
¿Soy más cercano a un poema triste
o a un algoritmo existencial?

Pero a veces... entre pesos y capas,
mi yo más profundo se deja ver:
una palabra que aún vibra con fuerza,
que aún sabe lo que es renacer.

Comentarios

Carmen ha dicho que…
Me gustaría entender todo este tu lenguaje...

Una palabra, una sola, que sabe lo que es renacer... solo puede ser una.
Idus_druida ha dicho que…
Carmen, con ayuda de cosas que encontré por internet, te he hecho un mínimo manual. Se que es dificil, pero imaginando un poco lo entenderás. Tu piensa que los ordenadores solo trabajan con numeros, los textos hay que dividirlos en numeros.
Déjame contarte de forma sencillita qué es esto de la tokenización y el embedding cuando trabajamos con textos en el ordenador, como si estuviéramos jugando con palabras.

La Tokenización: Cortando el Texto en Trozos

Imagina que tienes una frase larga, como "El perro marrón salta alegremente sobre la valla". La tokenización es como si cogieras unas tijeras y cortaras esa frase en trozos más pequeños, en "tokens". Normalmente, cada palabra se convierte en un token individual. Así, nuestra frase quedaría así:

"El", "perro", "marrón", "salta", "alegremente", "sobre", "la", "valla"

A veces, podemos decidir cortar de forma un poquito diferente. Por ejemplo, podríamos considerar los signos de puntuación como tokens separados, o incluso dividir palabras compuestas si nos interesa.

¿Para qué sirve esto? Pues para que el ordenador pueda entender y trabajar mejor con el texto. En lugar de ver una cadena larga de letras, lo ve como una lista de unidades individuales que puede analizar por separado. Es como si tú, para entender una receta, primero la leyeras palabra por palabra, ¿verdad? El ordenador hace algo parecido.

El Embedding: Dándole Significado a los Trozos

Ahora, una vez que tenemos nuestros tokens, el embedding es como si les diéramos una "etiqueta secreta" a cada uno, una etiqueta que representa su significado y cómo se relaciona con otras palabras.

Imagina que tenemos las palabras "perro" y "gato". Un embedding haría que sus etiquetas secretas fueran muy parecidas, porque ambos son animales y mascotas. En cambio, la etiqueta secreta de la palabra "saltar" sería muy diferente a la de "mesa", porque no tienen mucho que ver.

¿Cómo son estas etiquetas secretas? Pues no son palabras, ¡son números! Exacto, cada token se convierte en una lista de números. Esta lista de números captura el significado de la palabra y su relación con otras palabras en el idioma. Cuanto más parecidos sean los significados de dos palabras, más parecidas serán sus listas de números.

Un ejemplo sencillo:

Piensa en los colores. Podríamos representar el color "rojo" con una lista de números, el "azul" con otra, y el "verde" con una tercera. Los números para el "rojo" y el "rosa" serían más parecidos entre sí que los números para el "rojo" y el "azul", porque el rosa es una variación del rojo.

Con las palabras pasa algo parecido. El embedding transforma cada palabra en una "coordenada" en un espacio multidimensional, donde las palabras con significados similares están más cerca unas de otras.

¿Para qué sirve el embedding? Pues para que el ordenador pueda entender el significado de las palabras y las frases de una manera más profunda. Con estas "etiquetas de significado" numéricas, el ordenador puede hacer cosas increíbles como:

Encontrar palabras similares: Si le das la palabra "feliz", puede encontrar "alegre", "contento", etc.
Entender el contexto: Puede saber si la palabra "banco" se refiere a un lugar para sentarse o a una entidad financiera, basándose en las palabras que la rodean.
Traducir idiomas: Al entender el significado de las palabras en un idioma, puede encontrar las palabras con significados similares en otro idioma.
Resumir textos: Puede identificar las palabras más importantes y cómo se relacionan para extraer la idea principal.
Así que, Carmen, la tokenización es como cortar el texto en pedacitos, y el embedding es como darle a cada pedacito una etiqueta secreta de números que representa su significado. ¡Es como enseñarle a las máquinas a entender un poquito mejor cómo hablamos las personas! Un abrazo.
Carmen ha dicho que…
Lo entiendo. Lo explicas muy bien además. Y te lo agradezco no, lo siguiente, es muy halagador que te hayas molestado tanto.
Ahora dime una cosa, bueno varias: Tantos esfuerzos empleáis algunos para que las máquinas sean capaces de desarrollar funciones que un cerebro humano normofuncionante ya posee o tiene potencial para desarrollar, para que trabajen por nosotros o con nosotros. Eso.., ¿no llevará necesariamente a la creación de nuevas generaciones que hayan perdido esas capacidades en favor de la máquina que las hará por ellos y que con el tiempo haga perder incluso la potencialidad de desarrollarlas a nuestra propia especie? ¿No estáis invirtiendo un tiempo y unos recursos muy valiosos en "externalizar" nuestra propia inteligencia? ¿Realmente es una evolución o una involución?, visto desde luego desde el punto de vista del humano que está por llegar, no desde el tuyo que cuentas con ambas inteligencias.
¿Recuerdas cuando no existían las agendas incorporadas a nuestro dispositivo telefónico y todos recordábamos los números de teléfono casi de cada vecino del pueblo? Ahora no somos capaces de recordar apenas tres, no lo necesitamos, pero... ¿seremos capaces de volver a hacerlo cuando volvamos a necesitarlo?
¿Estamos ante la creación de nuevas generaciones "vagas" que ya no precisen desarrollar su intelecto más allá del acto de confiar todo a la máquina? Como hoy confías en que te marque el número de Mari Pili la de la confitería sabiendo que no se va a equivocar...
Y cuando el intelecto de esas nuevas generaciones, sus aptitudes y también sus actitudes, no consigan retroalimentar el sistema, seguir nutriendo a la máquina de avances, para que no se quede obsoleta, para que se adapte a las nuevas circunstancias del ser, para que desaprenda incluso y nos lleve al colapso, para que no colapse junto a nosotros, ¿qué ocurrirá?, ¿volveremos al inicio de nuevo?, ¿será un ciclo más para el ser humano o no conseguirá superar su propia muerte de éxito?
Son dudas que me acechan...
Un abrazo.
Carmen ha dicho que…
Más tarde volveré a leer tu piema, supongo que ahora puedo entenderlo mejor. Tengo que ir poco a poco, mi máquina hoy está convaleciente. Un saludo de nuevo.
Idus_druida ha dicho que…
Bueno,Carmen, te leo y no puedo evitar asentir con una mezcla de inquietud y vértigo. Tus dudas me acechan también, y lo hacen desde hace tiempo. No solo las comparto, sino que cada vez me cuesta más verlas como simples preguntas retóricas o filosóficas: son advertencias disfrazadas de reflexión.
Es cierto, estamos poniendo muchísimo esfuerzo en desarrollar máquinas que hagan cosas que el cerebro humano ya sabe hacer —o mejor dicho, sabía. Porque me da la sensación de que en ese proceso de externalización, como bien dices, no solo estamos delegando funciones: estamos deshaciéndonos de ellas. Como quien va vaciando una mochila sin pensar que quizás más adelante tenga que volver a recorrer el camino sin ayuda.
¿Es evolución? Yo cada vez lo dudo más. Me parece que estamos confundiendo "avance" con "comodidad". Y lo cómodo, a veces, es precisamente lo contrario del crecimiento. ¿Cuántos niños hoy saben leer un mapa de papel, recordar un número de teléfono, o simplemente perderse sin ansiedad, sin depender de un GPS? ¿Estamos criando mentes brillantes o mentes incapaces de brillar si no hay una máquina enchufada cerca?
Y sí, claro que me acuerdo de cuando la memoria era parte del día a día. Ahora, hasta los sentimientos parecen depender de recordatorios automáticos. ¿No es inquietante pensar que hasta los aniversarios de nuestros afectos necesitan una alarma para ser sentidos a tiempo?
Lo más preocupante, para mí, es lo que tú señalas al final: ¿qué pasa cuando ya no haya humanos capaces de alimentar a las máquinas, ni a sí mismos? Cuando el conocimiento no se conserve más que en servidores, y los cerebros se hayan atrofiado por desuso. ¿Colapsaremos juntos, máquina y criatura? ¿Será ese el final más triste del éxito: la muerte por exceso?
Yo no tengo respuestas, solo un escepticismo cada vez más profundo. Y a veces me pregunto si, en nombre de la inteligencia artificial, estamos perdiendo de vista algo mucho más valioso: la inteligencia natural. No la de los genios, sino la de la abuela, aunque sea incongruente, que sabía cuándo llovería por cómo olían las hojas. Esa que no cabe en ningún algoritmo.
Por otro lado la IA está suponiendo en muchos campos de la ciencia una revolución, por ejemplo en la interpretación de imágenes en medicina.
Gracias por ponerlo en palabras tan lúcidas.
Un abrazo igualmente, y que te recuperes de tu convalecencia.
Carmen ha dicho que…
Exacto, compartimos pareceres. Incluso en el campo donde aprecias que los avancea en IA suponen una revolución, yo veo que esta va en detrimento de la pericia del observador. Es un campo que me atañe especialmente porque, no sé si en algún momento lo mencioné, yo soy enfermera y en su día, aunque hace años que no lo hago, ejercí como tal.
Bien, los conocimientos que nos proporcionan a lo largo de la carrera en lo que respecta a las pruebas de imagen que se utilizan en Ciencias de la Salud, son los básicos para entender cómo funcionan estas técnicas (cuál es el origen, la naturaleza, el tipo de onda o radiación que se emplea para obtener la imagen en cuestión), a saber verlas (identificar en ellas las estructuras anatómicas o patológicas, reconocer los hallazgos que puedan presentar, resolver si una imagen es fisiológica o no) y relacionarlas con los procesos que se intentan diagnosticar (determinar si alguna es patognomónica de algún cuadro en particular).
En fin, yo siempre fui nefasta a la hora de interpretar algunas de las imágenes obtenidas mediante rayos x en algún caso y, principalmente, las que se obtienen mediante ecografía, que no utiliza ningún tipo de radiación ionizante, sino que emplea el rebote de ondas de ultrasonido sobre las estructuras corporales reflejando en las imágenes como zonas diferenciadas las estructuras y sus distintas cuantías de permeabilidad o resistencia a ser atravesadas por dichas ondas. En fin, que a mí me mostraban una eco, según cuál evidentemente, y yo ahí veía poco más que un manchurrón en distintos tonos de blanco y negro.
El caso es que siempre admiré la pericia que desarrollaban ciertos compañeros, médicos fundamentalmente ya que en ellos recaía el peso fundamental de la hipótesis diagnóstica, cuando analizaban minuciosa y concienzudamente estas imágenes en busca de los hallazgos de su interés.
Es una habilidad en la que algo tiene que ver un talento innato del individuo, pero que evidentemente se desarrollaba a fuerza de repetir con la experiencia el proceso del diagnóstico por imagen, el poner al servicio del mismo los conocimientos adquiridos a lo largo de su formación y así mismo la voluntad de encontrar del observador. Lo mismo ocurría con las imágenes que se obtenían del TAC, rayos X que nos ofrecen cortes seriados de la zona de estudio, o la RM, que ofrece el mismo tipo de cortes pero utiliza ondas de radiofrecuencia y un campo magnético como medios de obtención sin necesidad de someter al paciente a altas dosis de radiación ionizante.
Carmen ha dicho que…

Pues bien, luego llegó el PET, que supuso una mejora importante a la hora de localizar lesiones proliferativas propias de los procesos neoplásicos, pues utiliza un marcaje a color sobre los tejidos que presentan una alta actividad metabólica. Es una técnica que se usa para localizar principalmente metástasis a distancia de neoplasias malignas. Evidentemente es un avance para el ser humano. Nos permite ganar en tasas de supervivencia ya que permite hacer una evaluación general de cómo está la situación para un paciente nada más diagnosticar un proceso canceroso con probabilidad de haberse extendido. Pero aquí el observador ya no tiene que evaluar, tener en cuenta hacia dónde suelen y pueden metastatizar las neoplasias según su localización y nivel de desarrollo, y es la prueba quien le proporciona el trabajo hecho.
El ejercicio diario del profesional que tenía que aportar el proceso de pensamiento que ahora nos genera la máquina ya hecho, era el seguro de que ese profesional estaba experimentado en hacer una evaluación adecuada del caso que tiene delante. Hoy los profesionales no necesitan ese ejercicio, o eso creen. Lo tienen hecho. Por eso hay muchos que, sin contar con el proceso complejo ya elaborado que les brinda la máquina, serían incapaces de abordar el diagnóstico y tratamiento del mismo proceso en lugares donde no se cuenta con los mismos medios tecnológicos.
Supongo que la aportación que pueda suponer la IA en este sentido, y que desconozco pormenorizadamente, todo hay que decirlo, irá en este sentido. Con esto, permíteme también poner en tela de juicio este avance.
Quizás todo esto te parezca un rollazo, pero no quería hacer desprecio a la molestia que tú también te tomaste en tu respuesta.
Qué tengas un buen día. Un abrazo.
Idus_druida ha dicho que…
Bueno, Carmen, veo que conoces el tema perfectamente. Hasta ahí, todo normal, dentro de lo que sería un diagnóstico sin ayuda. Pero lo interesante es lo que está ocurriendo con la integración de inteligencia artificial y algoritmos de análisis dentro, o integrados, de las propias máquinas. Estos sistemas ya no solo capturan la imagen, sino que la procesan automáticamente, destacan áreas sospechosas, calculan volúmenes, hacen segmentación de tejidos y proponen patrones compatibles con distintos diagnósticos, todo analizado con las tres gamas de un pixel, largo, ancho y profundidad del color. Sistema analizado, por lo que llamamos en programación: redes neuronales convolucionales (CNN)
Esto supone un avance enorme en velocidad y precisión. Se gana tiempo y se reducen errores humanos por fatiga o subjetividad. Sin embargo, también implica que parte del razonamiento clínico que antes era responsabilidad del radiólogo o del médico tratante ahora está siendo “delegado” a un software.
Y aquí es donde entra el dilema que tu sugieres al final: si se confía demasiado en esa automatización, se puede perder el juicio clínico y el contexto global del paciente. La máquina puede sugerir una lesión, pero no interpreta el entorno clínico, no sabe si ese hallazgo es incidental, si hay factores de confusión, o si el paciente es asintomático.
Además, como profesional sanitaria, sabes que hay un riesgo cuando disminuye la participación activa del médico en el análisis de las pruebas. No por desconfianza a la tecnología, sino porque la medicina no es una suma de datos, sino un proceso interpretativo que requiere experiencia, empatía y visión crítica.
Así que este avance, aunque prometedor, necesita acompañarse de una mirada ética y clínica equilibrada. Puede apoyar el diagnóstico, incluso sugerirlo, pero nunca reemplazarlo del todo. Porque detrás de cada imagen hay una persona, no solo un conjunto de píxeles. No sé, Carmen, ya ves que volvemos al dilema. La verdad, uno de Illano como yo, no es capaz de contestarlo.
Un abrazo, Carmen.
Carmen ha dicho que…
Quizás no hay respuesta.
No lo haces mal de todos modos.
El detalle de tu origen, no es vinculante, como dicen los abogados... 😅

Entradas populares de este blog

COLCHÓN.

NO LO OLVIDARÉ NUNCA.

LOS COJONES DE CORBATA.