說(shuō)明:如果您有任何疑問(wèn)或想咨詢(xún)其他業(yè)務(wù)請(qǐng)撥打電話 400 685 0732
全網(wǎng)監(jiān)測(cè)海量數(shù)據(jù)按需發(fā)布監(jiān)測(cè)預(yù)警
實(shí)時(shí)把握輿情動(dòng)態(tài)精準(zhǔn)追溯信息源頭
聚類(lèi)分析是一種理想的多變量統(tǒng)計(jì)技術(shù),在網(wǎng)頁(yè)建設(shè)的過(guò)程當(dāng)中是一個(gè)非常重要的分析方法,那么聚類(lèi)分析法究竟是什么?以及有哪些具體的分析方法呢?接下來(lái)我們就一起來(lái)好好的了解一下吧。
聚類(lèi)分析法——聚類(lèi)分析法簡(jiǎn)介
1、基本思想:我們所研究的樣品(網(wǎng)點(diǎn))或指標(biāo)(變量)之間存在程度不同的相似性(親疏關(guān)系——以樣品間距離衡量)。于是根據(jù)一批樣品的多個(gè)觀測(cè)指標(biāo),具體找出一些能夠度量樣品或指標(biāo)之間相似程度的統(tǒng)計(jì)量,以這些統(tǒng)計(jì)量為劃分類(lèi)型的依據(jù)。把一些相似程度較大的樣品(或指標(biāo))聚合為一類(lèi),把另外一些彼此之間相似程度較大的樣品(或指標(biāo))又聚合為另一類(lèi),直到把所有的樣品(或指標(biāo))聚合完畢,這就是分類(lèi)的基本思想。在聚類(lèi)分析中,通常我們將根據(jù)分類(lèi)對(duì)象的不同分為Q型聚類(lèi)分析和R型聚類(lèi)分析兩大類(lèi)。
R型聚類(lèi)分析是對(duì)變量進(jìn)行分類(lèi)處理,Q型聚類(lèi)分析是對(duì)樣本進(jìn)行分類(lèi)處理。
R型聚類(lèi)分析的主要作用是:1、不但可以了解個(gè)別變量之間的關(guān)系的親疏程度,而且可以了解各個(gè)變量組合之間的親疏程度。
2、根據(jù)變量的分類(lèi)結(jié)果以及它們之間的關(guān)系,可以選擇主要變量進(jìn)行回歸分析或Q型聚類(lèi)分析。
Q型聚類(lèi)分析的優(yōu)點(diǎn)是:1、可以綜合利用多個(gè)變量的信息對(duì)樣本進(jìn)行分類(lèi);2、分類(lèi)結(jié)果是直觀的,聚類(lèi)譜系圖非常清楚地表現(xiàn)其數(shù)值分類(lèi)結(jié)果;3、聚類(lèi)分析所得到的結(jié)果比傳統(tǒng)分類(lèi)方法更細(xì)致、全面、合理。
為了進(jìn)行聚類(lèi)分析,首先我們需要定義樣品間的距離。常見(jiàn)的距離有:①絕對(duì)值距離②歐氏距離③明科夫斯基距離④切比雪夫距離
聚類(lèi)的分析方法是什么
(1)直接聚類(lèi)法
先把各個(gè)分類(lèi)對(duì)象單獨(dú)視為一類(lèi),然后根據(jù)距離最小的原則,依次選出一對(duì)分類(lèi)對(duì)象,并成新類(lèi)。如果其中一個(gè)分類(lèi)對(duì)象已歸于一類(lèi),則把另一個(gè)也歸入該類(lèi);如果一對(duì)分類(lèi)對(duì)象正好屬于已歸的兩類(lèi),則把這兩類(lèi)并為一類(lèi)。每一次歸并,都劃去該對(duì)象所在的列與列序相同的行。經(jīng)過(guò)m-1次就可以把全部分類(lèi)對(duì)象歸為一類(lèi),這樣就可以根據(jù)歸并的先后順序作出聚類(lèi)譜系圖。
聚類(lèi)分析法(2)最短距離聚類(lèi)法
最短距離聚類(lèi)法,是在原來(lái)的m×m距離矩陣的非對(duì)角元素中找出,把分類(lèi)對(duì)象Gp和Gq歸并為一新類(lèi)Gr,然后按計(jì)算公式計(jì)算原來(lái)各類(lèi)與新類(lèi)之間的距離,這樣就得到一個(gè)新的(m-1)階的距離矩陣;再?gòu)男碌木嚯x矩陣中選出最小者dij,把Gi和Gj歸并成新類(lèi);再計(jì)算各類(lèi)與新類(lèi)的距離,這樣一直下去,直至各分類(lèi)對(duì)象被歸為一類(lèi)為止。
聚類(lèi)分析法(3)最遠(yuǎn)距離聚類(lèi)法
最遠(yuǎn)距離聚類(lèi)法與最短距離聚類(lèi)法的區(qū)別在于計(jì)算原來(lái)的類(lèi)與新類(lèi)距離時(shí)采用的公式不同。最遠(yuǎn)距離聚類(lèi)法所用的是最遠(yuǎn)距離來(lái)衡量樣本之間的距離。
以上就是有關(guān)聚類(lèi)分析法的所有內(nèi)容,想要完全掌握這一種方法,還是需要大家在平時(shí)多去練習(xí),多去積累相關(guān)的知識(shí)的,如果大家還想了解更多與之有關(guān)的內(nèi)容,歡迎關(guān)注我們文軍營(yíng)銷(xiāo)的官網(wǎng)。
推薦閱讀
數(shù)據(jù)分析方法 常用數(shù)據(jù)分析方法有哪些 | 文軍營(yíng)銷(xiāo)1、聚類(lèi)分析(ClusterAnalysis)它可以將被訪者從人口背景、消費(fèi)習(xí)慣、生活方式、個(gè)性等方面進(jìn)行分類(lèi),并將這些特性與消費(fèi)習(xí)慣結(jié)合起來(lái),是營(yíng)銷(xiāo)管理中“市場(chǎng)區(qū)隔劃分”的主要手段。 2、因子分析(FactorAnalysis)影響消費(fèi)者購(gòu)買(mǎi)的原因有很多,但有些原因是相關(guān)的,有內(nèi)在的必然性,只要深入了解這些內(nèi)在的必然性,就可以將復(fù)雜問(wèn)...網(wǎng)絡(luò)輿情管理都是有哪些說(shuō)法以及主要技術(shù) | 文軍營(yíng)銷(xiāo)需要指出的是:輿情分析系統(tǒng)的核心技術(shù)在于輿情分析引擎,涉及的最主要的技術(shù)包括文本分類(lèi)、聚類(lèi)、觀點(diǎn)傾向性識(shí)別、主題檢測(cè)與跟蹤、自動(dòng)摘要等計(jì)算機(jī)文本信息內(nèi)容識(shí)別技術(shù)。由于網(wǎng)上的信息量十分巨大,僅依靠人工的方法難以應(yīng)對(duì)網(wǎng)上海量信息的收集和處理,需要現(xiàn)代信息技術(shù)加強(qiáng)相關(guān)信息技術(shù)的研究,對(duì)網(wǎng)絡(luò)輿情予以分析,形成一套自動(dòng)...網(wǎng)絡(luò)輿情分析有哪些過(guò)程,有哪些重要的步驟 | 文軍營(yíng)銷(xiāo)網(wǎng)絡(luò)輿情分析是一個(gè)長(zhǎng)年的過(guò)程,主要指網(wǎng)絡(luò)信息采集新技術(shù)與信息人工智能處理新技術(shù)的結(jié)合,網(wǎng)絡(luò)輿情分析通過(guò)網(wǎng)絡(luò)海量信息自動(dòng)整合,自動(dòng)歸類(lèi)聚類(lèi),主題檢驗(yàn),主題關(guān)注,實(shí)現(xiàn)使用者信息監(jiān)控和新聞報(bào)道主題跟蹤等信息需求,形成分析的結(jié)果,如簡(jiǎn)報(bào),調(diào)查報(bào)告,表格,網(wǎng)絡(luò)輿情分析報(bào)告。為客戶(hù)提供全面性把握民眾思想動(dòng)態(tài),做出準(zhǔn)確的輿論...光年社區(qū)上幾個(gè)關(guān)于詞庫(kù)建設(shè)的問(wèn)題整理 | 文軍營(yíng)銷(xiāo)分類(lèi)通常不做,因?yàn)榫炔皇呛茏屓藵M(mǎn)意,分出一堆碎片分類(lèi)看著頭疼建立詞庫(kù)的過(guò)程中不斷維護(hù)一個(gè)白名單和黑名單,抽取出強(qiáng)特征用于過(guò)濾高頻詞還有詞性等通常不過(guò)濾,尤其是不需要抽取query實(shí)體的場(chǎng)景下,高頻詞以及詞性的過(guò)濾反倒有可能導(dǎo)致語(yǔ)義轉(zhuǎn)義掉,這對(duì)于以分析為目的的詞庫(kù)而言是得不償失。網(wǎng)絡(luò)輿情研究到底有多么的重要,到底如何做 | 文軍營(yíng)銷(xiāo)雖然互聯(lián)網(wǎng)信息采集技術(shù)及信息智能處理技術(shù),是通過(guò)對(duì)互聯(lián)網(wǎng)海量信息自動(dòng)抓取、自動(dòng)分類(lèi)聚類(lèi)、主題檢測(cè)、專(zhuān)題聚焦,實(shí)現(xiàn)用戶(hù)的網(wǎng)絡(luò)輿情監(jiān)測(cè)和新聞專(zhuān)題追蹤等信息需求,形成簡(jiǎn)報(bào)、報(bào)告、圖表等分析結(jié)果,為客戶(hù)全面掌握群眾思想動(dòng)態(tài),做出正確輿論引導(dǎo),提供分析依據(jù)。但不可完全依賴(lài)爬蟲(chóng)系統(tǒng),上文已經(jīng)提到關(guān)于觸發(fā)關(guān)鍵詞和情感詞庫(kù)權(quán)...
說(shuō)明:如果您有任何疑問(wèn)或想咨詢(xún)其他業(yè)務(wù)請(qǐng)撥打電話 400 685 0732