Che cos'è il clustering per spiegare il suo ruolo nel datamining?
Che cos'è il clustering per spiegare il suo ruolo nel datamining?

Video: Che cos'è il clustering per spiegare il suo ruolo nel datamining?

Video: Che cos'è il clustering per spiegare il suo ruolo nel datamining?
Video: Raggruppare le cose: un algoritmo di clustering costruito da zero 2024, Maggio
Anonim

Introduzione. Esso è un data mining tecnica utilizzata per posizionare gli elementi dei dati in i loro gruppi correlati. Raggruppamento è il processo di partizionamento dei dati (o degli oggetti) nella stessa classe, i dati in una classe sono più simili a ogni diversi da quelli in altro grappolo.

Oltre a questo, qual è l'uso del clustering?

Raggruppamento viene utilizzato nella segmentazione del mercato; dove cerchiamo di multare i clienti che sono simili tra loro sia in termini di comportamenti o attributi, segmentazione/compressione dell'immagine; dove cerchiamo di raggruppare regioni simili, documentare raggruppamento sulla base di argomenti, ecc.

Ci si potrebbe anche chiedere, perché usiamo l'analisi dei cluster? Analisi di gruppo può essere un potente strumento di data mining per qualsiasi organizzazione che ha bisogno di identificare gruppi discreti di clienti, transazioni di vendita o altri tipi di comportamenti e cose. Ad esempio, i fornitori di assicurazioni utilizzano analisi di gruppo per rilevare crediti fraudolenti e le banche lo utilizzano per il credit scoring.

Inoltre, cos'è il clustering nel data mining con l'esempio?

Raggruppamento è il processo di trasformazione di un gruppo di oggetti astratti in classi di oggetti simili. UN grappolo di dati gli oggetti possono essere trattati come un gruppo. mentre lo fai grappolo analisi, partiamo prima l'insieme di dati in gruppi basati su dati somiglianza e quindi assegnare le etichette ai gruppi.

Perché K significa che viene utilizzato il clustering?

Usi aziendali. Il K - significa che viene utilizzato l'algoritmo di clustering per trovare gruppi che non sono stati esplicitamente etichettati nei dati. Questo può essere Usato per confermare ipotesi aziendali su quali tipi di gruppi esistono o per identificare gruppi sconosciuti in insiemi di dati complessi.

Consigliato: