Estimados Estoy pensando en una forma para acomodar datos, estos son una sola o más de una palabra, la única palabra o asociación de estas tiene un significado, no estaba pensando en un análisis en particular, pero sí en algo que pueda ser procesado por redes neuronales reconociendo ciertos patrones, pero que permita un análisis bajo otras técnicas, posiblemente en un ejemplo se comprenda mejor.
Supongamos unas palabras como Azul Rojo Verde Amarillo Auto Bicicleta Ferrari Semáforo Color Vehículo Ahora supongamos tres columnas, la cuarta es el significado, y puede haber columnas vacías Azul | | = Color y azul Rojo |Verde |Amarillo = Semáforo y color Semáforo | | = Semáforo Auto | | = Vehículo y auto (no bici) Auto |Rojo | = Ferrari * pero también vehículo Auto |Rojo |Vehículo = Vehículo * , auto, color y ferrari Por ejemplo, está claro que los compradores de autos Ferrari posiblemente tengan un gusto asociado al color rojo. Ese puede ser un análisis Pero si yo quiero reconocer lo que hay según el patrón de palabras, tipo ejemplos de redes neuronales, en el último ejemplo con tres palabras tengo cuatro posibilidades (auto, rojo, vehículo) => vehículo, auto, color, Ferrari, pero en el ejemplo dos (Rojo, Verde, Amarillo) => semáforo, como color, pero el reconocimiento importante es casi únicamente semáforo. Hay ejemplos donde se buscan patrones en una foto y se reconocen objetos, pero en un esquema como el que describo, donde el resultado que puede ser más de uno, también está en la entrada, esta entrada en el ejemplo son tres columnas, pero todas tienen palabras que están en una sola lista. ¿Alguna sugerencia o ejemplo? En otras palabras, yo podría realizar una tabla pero hay formas que quedaría afuera, porque auto, rojo, vehículo no se me ocurriría, salvo que piense en un análisis posterior donde analizo bicicletas rojas vs autos rojos, o pelota roja donde una pelota no es vehículo pero en la playa por ahí prefieren las rojas o amarillas antes de las azules. Entonces posiblemente hay una forma de codificar para luego poder hacer análisis no pensados al momento de codificar los datos. Esta segunda parte estaría contemplada al colocar columnas, pero se me crean dudas para las redes neuronales. Desde ya muchas gracias [[alternative HTML version deleted]] _______________________________________________ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es