¿Qué es un clúster y ejemplos?

Cluster sampling deutsch

Un racimo es un pequeño grupo de personas o cosas. Cuando tú y tus amigos os apiñáis incómodamente alrededor de la mesa de la merienda en una fiesta, susurrando y tratando de reunir los nervios suficientes para salir a la pista de baile, habéis formado un clúster.

Cluster viene de la palabra inglesa antigua clyster, que significa grupo. Hoy en día, se puede utilizar cluster como sustantivo o como verbo. Cuando éramos niños, nos agrupábamos (sustantivo) en la esquina de la calle, esperando ansiosamente la aparición del camión del Buen Humor cada tarde. Luego nos agrupábamos (verbo) ansiosamente alrededor del conductor, exigiendo un helado. Prácticamente todo puede formar un racimo: flores, células, estrellas, seres humanos e incluso acontecimientos.

Ejemplo de clustering K-means

Un clúster temático es un método que utiliza una única “página pilar” como centro principal de contenido para un tema determinado. Todos los activos de contenido relacionados con ese tema se vinculan a la página pilar, y el pilar se vincula a cada activo.

“Una página pilar es la base sobre la que se construye un grupo de temas. Una página pilar cubre todos los aspectos del tema en una sola página, con espacio para una información más profunda en entradas de blog más detalladas del clúster que enlazan con la página pilar. Las páginas pilar cubren ampliamente un tema en particular, y el contenido del cluster debe abordar en profundidad una palabra clave específica relacionada con ese tema”.

Lo que es más, la idea de una página pilar es cubrir un contenido amplio de una manera que sea altamente enlazable en sí misma – es decir, los sitios externos la enlazarían como un recurso canónico para el tema. Así que, para ponerlo en términos visuales, esto es lo que la arquitectura de nuestro blog solía parecer usando este viejo libro de jugadas:

Aquí es donde entra en juego el modelo de cluster de temas. Utilizando los temas para los que quieres clasificar, puedes organizar el desorden de contenido anterior optimizándolo para palabras clave específicas relacionadas con su respectivo tema. A continuación, hipervínculo todos esos temas de nuevo a una página pilar.

Ejemplo de muestreo estratificado

El muestreo por conglomerados es una técnica de muestreo probabilístico en la que los investigadores dividen la población en varios grupos (conglomerados) para la investigación. A continuación, los investigadores seleccionan grupos aleatorios con una técnica de muestreo aleatorio simple o sistemático para la recogida y el análisis de datos.

Ejemplo:  Un investigador quiere llevar a cabo un estudio para juzgar el rendimiento de los estudiantes de segundo año de educación empresarial en todo EE.UU. Es imposible llevar a cabo un estudio de investigación que incluya a un estudiante en cada universidad. En su lugar, utilizando el muestreo por conglomerados, el investigador puede agrupar las universidades de cada ciudad en un conglomerado. A continuación, utilizando el muestreo aleatorio simple o el muestreo aleatorio sistemático, elige al azar los grupos para el estudio de investigación. Posteriormente, utilizando el muestreo simple o sistemático, se puede elegir a los estudiantes de segundo año de cada uno de estos conglomerados seleccionados sobre los que realizar el estudio de investigación.

En esta técnica de muestreo, los investigadores analizan una muestra que consta de múltiples parámetros muestrales, como los datos demográficos, los hábitos, los antecedentes o cualquier otro atributo de la población, que puede ser el objeto de la investigación realizada. Este método suele llevarse a cabo cuando grupos similares pero internamente diversos forman una población estadística. En lugar de seleccionar a toda la población, el muestreo por conglomerados permite a los investigadores recoger datos bifurcándolos en pequeños grupos más productivos.

Muestreo aleatorio

El análisis de conglomerados o clustering es una tarea de minería de datos que consiste en agrupar un conjunto de experimentos (observaciones) de tal manera que los elementos que pertenecen al mismo grupo son más similares (en algún sentido matemático) entre sí que los de los otros grupos. Llamamos a los grupos con el nombre de clusters.

En este ejemplo veremos cómo funciona el clustering basado en centroides. La idea básica del clustering basado en el centroide es definir los clusters basándose en la distancia de cada miembro del cluster y el llamado centroide del propio cluster.

El algoritmo de clustering basado en centroides más común es el llamado K-means. El procedimiento sigue una forma sencilla y fácil de clasificar un conjunto de datos dado a través de un cierto número de clusters predefinidos.

La idea es definir k centroides, uno para cada clúster. El siguiente paso es tomar cada punto perteneciente a un conjunto de datos dado y asociarlo al centroide más cercano. Cuando no hay ningún punto pendiente, se completa el primer paso y se realiza una agrupación anticipada. En este punto, el algoritmo vuelve a calcular los nuevos centroides como los centros de los clusters resultantes del paso anterior. El algoritmo se detiene cuando no se observan más cambios entre una iteración y la siguiente.

Entradas relacionadas