Estimados He resuelto mi preocupación, por un lado creando una columna que de un punto fijo, por ejemplo vehículo, entonces todas las demás columnas son auto, bici, Ferrari, etc., pero a este punto fijo no lo puedo calcular como cluster, sería sencillo pero en lugares como mi país donde es extremadamente difícil ver una Ferrari (son mucho más caras que en Europa), este punto fijo debe tener intervención humana porque de las formas que conozco en el caso de Ferrari Argentina darían cualquier cosa bajo una clasificación automatizada, luego sería posible algún otro análisis como una red neuronal.
Dicho de otra forma, este punto fijo asegura un renglón independiente de las columnas siguientes, con un resultado fijado para el entrenamiento, por ejemplo el punto fijo señal de tránsito, con tres columnas, rojo, amarillo y azul, dan únicamente semáforo, por otro lado en punto fijo color estos se repiten pero con otro significado, u otro punto dijo juguete donde puede ser exactamente rojo, amarillo, verde, y ser semáforo, pero al cruzar los datos puedo detectar semáforos reales de los de juguete. Lógicamente no di con una forma automatizada para calcular puntos fijos sin intervención humana, estos serían como un grupo cluster, pero no encontré la forma de evitar que datos con pocos valores no sean detectados como ruido cuándo en realidad son importantes, pero escasos como el oro o un diamante, motivo por el cuál estos costosos y en su costo está la importancia aunque sus números en unidades sean muy pequeños en relación al resto de objetos. Javier Rubén Marcuzzi El 4 de mayo de 2018, 17:19, Javier Marcuzzi < javier.ruben.marcu...@gmail.com> escribió: > Estimados > > Estoy pensando en una forma para acomodar datos, estos son una sola o más > de una palabra, la única palabra o asociación de estas tiene un > significado, no estaba pensando en un análisis en particular, pero sí en > algo que pueda ser procesado por redes neuronales reconociendo ciertos > patrones, pero que permita un análisis bajo otras técnicas, posiblemente en > un ejemplo se comprenda mejor. > > Supongamos unas palabras como > > Azul > > Rojo > > Verde > > Amarillo > > Auto > > Bicicleta > > Ferrari > > Semáforo > > Color > > Vehículo > > > > Ahora supongamos tres columnas, la cuarta es el significado, y puede haber > columnas vacías > > Azul | | > = Color y azul > > Rojo |Verde |Amarillo = > Semáforo y color > > Semáforo | | > = Semáforo > > Auto | | > = Vehículo y auto (no bici) > > Auto |Rojo | > = Ferrari * pero también vehículo > > Auto |Rojo |Vehículo = > Vehículo * , auto, color y ferrari > > > > Por ejemplo, está claro que los compradores de autos Ferrari posiblemente > tengan un gusto asociado al color rojo. Ese puede ser un análisis > > Pero si yo quiero reconocer lo que hay según el patrón de palabras, tipo > ejemplos de redes neuronales, en el último ejemplo con tres palabras tengo > cuatro posibilidades (auto, rojo, vehículo) => vehículo, auto, color, > Ferrari, pero en el ejemplo dos (Rojo, Verde, Amarillo) => semáforo, como > color, pero el reconocimiento importante es casi únicamente semáforo. > > Hay ejemplos donde se buscan patrones en una foto y se reconocen objetos, > pero en un esquema como el que describo, donde el resultado que puede ser > más de uno, también está en la entrada, esta entrada en el ejemplo son tres > columnas, pero todas tienen palabras que están en una sola lista. > > ¿Alguna sugerencia o ejemplo? En otras palabras, yo podría realizar una > tabla pero hay formas que quedaría afuera, porque auto, rojo, vehículo no > se me ocurriría, salvo que piense en un análisis posterior donde analizo > bicicletas rojas vs autos rojos, o pelota roja donde una pelota no es > vehículo pero en la playa por ahí prefieren las rojas o amarillas antes de > las azules. Entonces posiblemente hay una forma de codificar para luego > poder hacer análisis no pensados al momento de codificar los datos. Esta > segunda parte estaría contemplada al colocar columnas, pero se me crean > dudas para las redes neuronales. > > Desde ya muchas gracias > [[alternative HTML version deleted]] _______________________________________________ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es