Qué saber cuando la minería de datos con el K-Means Algorithim

Share on facebook
Share on twitter
Share on linkedin
Share on telegram
Share on whatsapp
Share on email
Share on print
VALORACIÓN DEL ARTÍCULO:
5/5


El algoritmo de agrupamiento de medios k- es una herramienta de minería de datos y aprendizaje automático utilizada para agrupar observaciones en grupos de observaciones relacionadas sin ningún conocimiento previo de esas relaciones. Mediante el muestreo, el algoritmo intenta mostrar a qué categoría, o conglomerado, pertenecen los datos, y el número de conglomerados se define por el valor k.

El algoritmo k-means es una de las técnicas de agrupamiento más simples y se utiliza comúnmente en imágenes médicas, biometría y campos relacionados. La ventaja de k-significa que le informa sobre sus datos (usando su forma no supervisada) en lugar de tener que instruir al algoritmo sobre los datos al principio (usando la forma supervisada del algoritmo).

A veces se le llama Algoritmo de Lloyd, particularmente en los círculos de ciencias de la computación porque el algoritmo estándar fue propuesto por primera vez por Stuart Lloyd en 1957. El término “k-means” fue acuñado en 1967 por James McQueen.

Cómo funciona el algoritmo K-Means

El algoritmo k-means es un algoritmo evolutivo que toma su nombre de su método de funcionamiento. El algoritmo agrupa las observaciones en grupos k, donde k se proporciona como parámetro de entrada. A continuación, asigna cada observación a los conglomerados en función de la proximidad de la observación a la media del conglomerado. La media del clúster se vuelve a calcular y el proceso comienza de nuevo. Así es como funciona el algoritmo:

  1. El algoritmo selecciona arbitrariamente k puntos como los centros iniciales del cluster (el medio).
  2. Cada punto en el conjunto de datos se asigna al cúmulo cerrado, basado en la distancia euclidiana entre cada punto y cada centro de cúmulo.
  3. Cada centro de clúster se calcula de nuevo como el promedio de los puntos en ese clúster.
  4. Los pasos 2 y 3 se repiten hasta que los grupos convergen. La convergencia puede definirse de manera diferente dependiendo de la implementación, pero normalmente significa que o bien ninguna observación cambia de grupo cuando se repiten los pasos 2 y 3, o bien que los cambios no hacen una diferencia material en la definición de los grupos.

Selección del número de clusters

Una de las principales desventajas de k- significa que debe especificar el número de clusters como entrada al algoritmo. Tal como está diseñado, el algoritmo no es capaz de determinar el número apropiado de clusters y depende de que el usuario lo identifique de antemano.

Por ejemplo, si usted tiene un grupo de personas que van a ser agrupadas en base a la identidad de género binaria como hombre o mujer, llamar al k- significa algoritmo usando la entrada k=3 forzaría a las personas a formar tres grupos cuando sólo dos, o una entrada de k=2, proporcionaría un ajuste más natural.

De manera similar, si un grupo de individuos se agrupara fácilmente basándose en el estado de residencia y usted llamara al algoritmo k-media con la entrada k=20,, los resultados podrían ser demasiado generalizados para ser efectivos.

Por esta razón, a menudo es una buena idea experimentar con diferentes valores de k para identificar el valor que mejor se adapte a sus datos. También es posible que desee explorar el uso de otros algoritmos de minería de datos en su búsqueda de conocimientos aprendidos con máquinas.

Deja un comentario

TAMBIÉN TE INTERESA

Comparativa tipos auriculares Xiaomi Mi Earphones

¿Mi Earphones Basic o Mi In-Ear Earphones? Comparativa de los auriculares Xiaomi

  Mi Earphones Basic y Mi In-Ear son dos auriculares alámbricos de Xiaomi, que pueden ser una buena opción para el usuario que busca modelos más baratos en el mercado. Si bien muchos usuarios se están decantando por auriculares inalámbricos que usan la tecnología bluetooth para conectarse con sus dispositivos, los auriculares con cable siguen

review del proyector Epson EpiqVision Ultra LS500

El proyector Epson que promete “reemplazar” cualquier televisor

  El proyector Epson EpiqVision Ultra LS500 es la más reciente iteración de la marca en el mercado en el segmento de los vídeo proyectores. Confirmado el pasado miércoles (16 de septiembre), la plataforma llega para competir directamente con el estreno de Samsung, que fue revelado en su propio evento en la víspera de la

apps para crear notas

7 aplicaciones para tomar notas en el PC y smartphone

Cuando se habla de aplicaciones para tomar notas u organizar tareas, una de las opciones más populares suele ser Evernote. Sin embargo, existen alternativas que pueden dar un resultado muy similar y que sincronizan automáticamente el contenido en la computadora o el móvil. A continuación, te hablaremos de 7 alternativas perfectas.   Índice de contenidos1

Samsung-Notes

¿Cómo funciona Samsung Notes? 6 consejos para usar la app

Aplicaciones para anotaciones como Samsung Notes pueden ser grandes aliadas en la vida cotidiana de aquellos que prefieren organizar sus actividades diarias por medio del smartphone. Esta app, que viene instalada de fábrica en los teléfonos inteligentes Samsung y está disponible para su descarga en la tienda Google Play Store para Android, ofrece funciones útiles

Productos-Xiaomi

5 productos de Xiaomi que son éxitos de ventas

Xiaomi es uno de los mayores fabricantes de dispositivos inteligentes del mundo y sus productos son un éxito de ventas en China. Entre los artículos más vendidos del gigante chino se encuentran televisores, teléfonos celulares, computadoras portátiles y otros productos. Además, Xiaomi ya ha superado a varios competidores, como Sony, TCL y Philips, por lo

comparativa Galaxy Tab S6 Lite vs. iPad Air 2019

Galaxy Tab S6 Lite vs. iPad Air 2019: ¿Cuál es mejor?

Samsung reveló en 2019 el S6 Lite Galaxy Tab, una tablet que llegó para competir directamente con el iPad Air 2019 de Apple. La rivalidad entre ambas marcas no es nueva y viene de lejos. De hecho además de las Galaxy Tab, otros teléfonos de la entidad surcoreana rivalizan con los iPhone de Apple. En