什麼是大數據?定義、工作原理和用途

大數據是指來自各種來源且以不斷增長的速度增長的大量、多樣化的信息。

什麼是大數據?

大數據是指以不斷增長的速度增長的大量、多樣化的信息(稱為大數據的“三個V 。

要點

  • 大數據是大量不同的信息,其數量和速度不斷增加。
  • 大數據可以是結構化的(通常是數字的,易於格式化和存儲)或非結構化的(形式更自由,可量化程度較低)。
  • 公司中幾乎每個部門都可以利用大數據分析的結果,但處理其混亂和噪音可能會帶來問題。
  • 大數據可以從社交網絡和網站上公開分享的評論中收集,也可以通過問卷調查、產品購買和電子簽到從個人電子產品和應用程序中自願收集。
  • 大數據通常存儲在計算機數據庫中,並使用專門設計用於處理大型、複雜數據集的軟件進行分析。1

大數據如何運作

大數據可分為非結構化數據和結構化數據。結構化數據由組織在數據庫和電子表格中管理的信息組成;本質上通常是數字。非結構化數據是無組織且不屬於預定模型或格式的信息。它包括從社交媒體來源收集的數據,幫助機構收集有關客戶需求的信息。

大數據可以從社交網絡和網站上公開分享的評論中收集,也可以通過問卷調查、產品購買和電子簽到從個人電子產品和應用程序中自願收集。智能設備中傳感器和其他輸入的存在使得數據可以被收集。收集了廣泛的情況和環境。1

大數據通常存儲在計算機數據庫中,並使用專門設計用於處理大型複雜數據集的軟件進行分析。

大數據的用途

數據分析師查看不同類型數據之間的關係,例如人口統計數據和購買歷史記錄,以確定是否存在相關性。此類評估可能由內部完成,也可能由專注於將大數據處理為可消化的外部第三方完成。企業經常利用這些專家對大數據的評估,將其轉化為可操作的信息。

許多公司,例如 Alphabet 和 Meta(以前稱為 Facebook),都利用大數據向社交媒體上的用戶和網上沖浪的用戶投放有針對性的廣告來產生廣告收入。

公司中幾乎每個部門都可以利用數據分析的結果,從人力資源和技術到營銷和銷售。大數據的目標是提高產品進入市場的速度,減少產品上市所需的時間和資源。獲得市場採用、目標受眾並確保客戶保持滿意。

大數據的優點和缺點

可用數據量的增加既帶來了機遇,也帶來了問題。一般來說,擁有更多有關客戶(和潛在客戶)的數據應該使公司能夠更好地定制產品和營銷工作,以創造最高水平的滿意度和回頭客。收集大量數據的公司有機會進行更深入、更豐富的分析,以造福所有利益相關者。

鑑於當今個人的個人數據量巨大,公司採取措施保護這些數據至關重要;這個話題已成為當今網絡世界的熱門話題,特別是考慮到公司在過去幾年中經歷了許多數據洩露事件。

雖然更好的分析是積極的,但大數據也會造成過載和噪音,從而降低其有用性。公司必須處理更大量的數據,並確定哪些數據與噪音相比代表信號。決定數據的相關性成為關鍵因素。

此外,數據的性質和格式在執行之前可能需要特殊處理。由數值組成的結構化數據可以輕鬆存儲和排序。非結構化數據,例如電子郵件、視頻和文本文檔,可能需要更多處理在變得有用之前要應用複雜的技術。

 

發佈留言