黑人精品XXX一区一二区,91久久精品无码一区二区毛片进,久久久久国产Av麻豆,精品动漫3D一区二区三区免费版,欧美性受XXXX黑人XYX性爽
歡迎光臨上海公關公司官網!
10年專注企業(yè)危機公關處理 網絡輿情口碑維護公司、網絡公關公司
微信:haotu616
當前位置:網絡公關 > 輿情處理 >
輿情處理

大數據在輿情研究中的應用

作者:admin 來源:未知 時間:2022-01-13 16:28:45 點擊:

[文章前言]:傳統的民意研究方法主要是基于問卷和抽樣調查的民意調查法,最早起源于20世紀30年代的美國,以美國民意研究所(蓋洛普公司的前身)為標志。它是在不斷汲取統計學、心理學、社會
傳統的民意研究方法主要是基于問卷和抽樣調查的民意調查法,最早起源于20世紀30年代的美國,以美國民意研究所(蓋洛普公司的前身)為標志。它是在不斷汲取統計學、心理學、社會學、人口學等多學科的成果基礎上逐漸發(fā)展起來的,目前已形成了整體設計、抽樣方法、樣本框建立、問卷設計、樣本獲取、實地調查、質量控制、數據處理與分析、報告撰寫等一整套完善的程序和規(guī)范,調查方法也從早期的入戶調查和郵寄問卷發(fā)展到電話調查、計算機輔助訪問系統等多種形式。
 
但無論中外,劇烈的社會變動正在使傳統的民意調查的實施變得越來越困難。在我國,入戶調查開始被街頭攔訪取代。首先,由于戶籍制度的限制,大量的外來常住人口的資料在現有抽樣框資料中得不到體現。這部分人的比例在大中城市甚至達到30%~40%。其次,多數中高檔住宅社區(qū)實行嚴格的保安制度和門禁制度,使得針對中高收入人群的調查基本無法實現。這兩個因素使得傳統面訪調查獲得的數據與實際人口構成往往形成很大偏差。但街頭攔訪由于其難以做到隨機抽樣和嚴格的質量控制,而使調查結果大打折扣。
 
在歐美各國,電話調查方法一直是主流,但幾乎都存在成本飆升、有效應答率下降的問題。據美國皮尤中心的分析,電話調查的有效應答率已從1997年的36%下降到了2012年的9%。
 
 
(一)在線概率樣本調查
 
 
隨著網絡興起與普及,在線調查迅速普及。在線調查是指通過互聯網及其調查系統把傳統的調查、分析方法在線化和智能化,二者并沒有本質的不同。但在樣本選擇、質量控制等方面依然面臨很多新的課題。
 
由于在線調查的低門檻、低成本和便利性,越來越多的非專業(yè)調查機構也開始采用在線調查的方法,這造成了調查結果的品質差異巨大和公眾認知的混亂。其中,最普遍的是各種商務型網站為吸引眼球而開展的調查。這些網站利用網絡簡單編程的方式將問卷生成頁面,用戶在瀏覽頁面的時候,對問卷進行回答,生成簡單的調查結果。無論是誰都可以來參與調查,對調查對象沒有甄別,自然也就沒有代表性。加之很多網站在設定上,一個人可以多次參與回答,重復率沒有排除。這樣的調查,有時回答人數在上萬或者幾十萬,但因為背離了調查的科學性,不僅毫無意義,甚至會誤導輿情。
 
專業(yè)在線調查公司為了保證數據的真實性會采取抽樣的方式,被抽取到的受訪者會接到一封包括問卷URL地址的郵件,點擊這個地址、經過各種問題的甄別才能開始回答專業(yè)問卷。而受訪者的背景信息、提供數據的質量、操作流程的規(guī)范性都經過嚴格控制。因而專業(yè)的在線調查機構,通常不是使用隨意招募的樣本,而是建立和擁有自己的樣本庫。
 
在線樣本一般可分為概率樣本和非概率樣本。概率樣本庫(Probability-based panels)采用隨機抽樣方式招募樣本庫成員,可以覆蓋不上網人群。非概率樣本庫的成員則以自愿的方式在網上招募,只能覆蓋上網人群。因此,這兩個樣本庫在人口特征上存在系統差異。目前使用的在線樣本庫中,以非概率樣本為主,概率樣本庫的比例很小。
 
在目前的中國國情下,建立概率樣本庫,并以此為基礎開展各種不同方式的調研是實施高精度調研的有效途徑。首先,概率樣本庫采用隨機抽樣方式招募樣本庫成員,并覆蓋不上網人群,能最大限度地保證與實際人口構成的均衡性;其次,概率樣本庫可以用于網絡調查,也可用于面訪和各種特定條件的調查。為保證成本與效率的最優(yōu)化,通常針對網民進行網絡調查,而非網民則以面訪或提供上網設施來彌補。
 
 
 
 
(二)輿情監(jiān)測與大數據運用
 
 
中國網民數量已達7億,一些重大的輿情事件,參與用戶往往多達數千萬。無論是發(fā)帖、轉發(fā)、點贊還是閱讀、搜索,都構成了輿情大數據。
 
盡管學界和業(yè)界對于什么是大數據尚未形成統一的定義,但綜合來看,大數據通常具有4個要素,也稱作4V,即海量(Volume)、快速(Velocity)、多樣(Variety)和價值(Value),即數據量空前巨大,并且以非常快的速度不斷產生,數據的形式多種多樣,結構化數據只占很小部分,多數是半結構化和非結構化數據[2]。在這種大背景下,只有具備從海量數據中快速抓取和分析數據的能力,才能使大數據產生價值。否則,只是不斷累積的數據垃圾。
 
網絡輿情監(jiān)測系統是運用數據采集和挖掘技術,對非結構化的互聯網大數據進行輿情挖掘和研判的一種主要手段。一般的輿情監(jiān)測系統都包含兩大功能。一是信息自動采集功能,主要是通過網絡頁面之間的鏈接關系,從網上自動獲取頁面信息,并且隨著鏈接不斷向整個網絡擴展。而新的技術突破點是關于社交媒體的信息采集和音視頻信息的抓取。二是輿情分析引擎功能,涉及的最主要的技術包括文本分類、聚類、觀點傾向性識別、主題檢測與跟蹤、自動摘要等計算機文本信息內容識別技術和音視頻識別技術。
 
輿情分析引擎的功能是整個監(jiān)測系統的核心,通常包括以下幾個方面。①識別功能。熱點話題、敏感話題識別??梢愿鶕侣劤鎏帣嗤?、評論數量、發(fā)言時間密集程度等參數,識別出給定時間段內的熱門話題。利用關鍵字布控和語義分析,識別敏感話題。②追蹤功能。對主題、人物或機構的追蹤和聚焦。跟蹤的具體內容包括:信息來源、轉載量、轉載地址、地域分布、信息發(fā)布者等相關信息元素。③關注度分析功能。通過參與度和波及度等要素來考量,是衡量相關話題網絡影響力的重要指標,網絡關注度越高,表明其在網絡中越受關注,網民參與討論越活躍,相關話題在網站間的傳播越廣。④趨勢分析功能。對突發(fā)事件進行跨時間、跨空間綜合分析,獲知事件發(fā)生的全貌并預測事件發(fā)展的趨勢。⑤信息自動摘要功能。能夠根據文檔內容自動抽取文檔摘要信息。用戶無須查看全部文章內容,通過該智能摘要即可快速了解文章大意與核心內容,提高用戶信息利用效率。⑥報警功能。對突發(fā)事件、涉及內容安全的敏感話題及時發(fā)現并發(fā)出危機預警??梢愿鶕录奈C等級,啟動不同的危機公關處理方案,從而快速控制事件的發(fā)展方向。⑦統計報告功能。根據輿情分析引擎處理后的結果庫生成報告,為用戶提供決策支持。
 
近年來,輿情監(jiān)測系統的功能在不斷升級,專業(yè)的輿情分析方法也在不斷改善,并且有各種各樣的輿情分析師專業(yè)培訓來不斷提升輿情分析人員的技能。盡管如此,網絡監(jiān)測的從業(yè)者和研究人員都感受到了一種巨大壓力,那就是采用網絡監(jiān)測的方法來研究網絡輿情,特別是真實的社會輿情的局限性越來越突出,各種技術和方法的改進都難以突破這一瓶頸。究其原因,主要有以下幾個方面。
 
 
 
 
 
1.代表性偏差
 
 
盡管我國互聯網普及程度日益提高,但用戶仍然只占總人口半數左右,農村人口、低收入階層等,不上網的人比例非常大。即使有上網能力的人,也幾乎不會在網絡上發(fā)表自己的意見,網民中大都屬于“沉默的大多數”。此外,越來越多的網絡社交平臺,對于來自外部的數據抓取采取種種技術手段進行限制,因此,很難采集到完整數據。同時,這些網站也為用戶提供了定制化隱私設置選項,多數人會選擇將個人隱私設定為非公開。這樣的數據缺失進一步加大了數據的偏差值。
 
 
 
 
 
2.信息源頭的污染
 
 
互聯網時代,盡管網民享有了表達自己意見的自由,但網絡信息卻并非其態(tài)度、意見和情緒的直接和客觀反映。首先,由于網絡的虛擬性,網民的真實身份不為他人所知,網絡言論往往呈現情緒化和極端化現象,較少有客觀理性的分析與言論。其次,大量網絡“水軍”出于獲利的目的,故意歪曲事實和炮制假新聞。再次是由于各種形式的網絡評論員的存在。雖然有一種觀點認為網絡評論員在維護中國社會穩(wěn)定,消除不利于政府的網絡謠言,維護政府形象,促進政府與民眾溝通,建設和諧社會方面能起到積極作用;但更多意見認為,組織網絡評論員制造輿論壓制對方,以及利用公權力來制造虛假輿論,進一步增大了網絡輿情的噪聲。
 
 
 
 
 
3.中文的“高語境”帶來的分析難題
 
 
美國學者愛德華·霍爾創(chuàng)建了“高語境”與“低語境”概念。所謂高語境是指那些對語境依賴程度較高的語言,主要代表是中文和日文。在以“高語境”為特點的傳播過程里,語言的絕大部分信息藏匿于語境之中,或高度依附于語境,很少清晰呈現于文字里,如說話拐彎抹角、含糊不清,空話、套話、官話泛濫,正話反說等現象,使基于關鍵詞正負面評價的分析常常失效。
 

  以上就是小編為大家介紹的大數據在輿情研究中的應用的全部內容,如果大家還對相關的內容感興趣,請持續(xù)關注上海危機公關公司

  本文標題:大數據在輿情研究中的應用  地址:/yuqingchuli/2022/0113/2550.html