Estimados

Estoy pensando en una forma para acomodar datos, estos son una sola o más
de una palabra, la única palabra o asociación de estas tiene un
significado, no estaba pensando en un análisis en particular, pero sí en
algo que pueda ser procesado por redes neuronales reconociendo ciertos
patrones, pero que permita un análisis bajo otras técnicas, posiblemente en
un ejemplo se comprenda mejor.

Supongamos unas palabras como

Azul

Rojo

Verde

Amarillo

Auto

Bicicleta

Ferrari

Semáforo

Color

Vehículo



Ahora supongamos tres columnas, la cuarta es el significado, y puede haber
columnas vacías

Azul                       |                              |
= Color y azul

Rojo                      |Verde                 |Amarillo            =
Semáforo y color

Semáforo           |                              |
= Semáforo

Auto                     |                             |
= Vehículo y auto (no bici)

Auto                     |Rojo                    |
= Ferrari  * pero también vehículo

Auto                     |Rojo                    |Vehículo           =
Vehículo * , auto, color y ferrari



Por ejemplo, está claro que los compradores de autos Ferrari posiblemente
tengan un gusto asociado al color rojo. Ese puede ser un análisis

Pero si yo quiero reconocer lo que hay según el patrón de palabras, tipo
ejemplos de redes neuronales, en el último ejemplo con tres palabras tengo
cuatro posibilidades (auto, rojo, vehículo) => vehículo, auto, color,
Ferrari, pero en el ejemplo dos (Rojo, Verde, Amarillo) => semáforo, como
color, pero el reconocimiento importante es casi únicamente semáforo.

Hay ejemplos donde se buscan patrones en una foto y se reconocen objetos,
pero en un esquema como el que describo, donde el resultado que puede ser
más de uno, también está en la entrada, esta entrada en el ejemplo son tres
columnas, pero todas tienen palabras que están en una sola lista.

¿Alguna sugerencia o ejemplo? En otras palabras, yo podría realizar una
tabla pero hay formas que quedaría afuera, porque auto, rojo, vehículo no
se me ocurriría, salvo que piense en un análisis posterior donde analizo
bicicletas rojas vs autos rojos, o pelota roja donde una pelota no es
vehículo pero en la playa por ahí prefieren las rojas o amarillas antes de
las azules. Entonces posiblemente hay una forma de codificar para luego
poder hacer análisis no pensados al momento de codificar los datos. Esta
segunda parte estaría contemplada al colocar columnas, pero se me crean
dudas para las redes neuronales.

Desde ya muchas gracias

        [[alternative HTML version deleted]]

_______________________________________________
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Responder a