A.MapReduce
B.Pregel
C.Dremel
D.Storm
第6題
A、數據獲取、數據清洗、數據分析、數據可視化
B、數據清洗、數據獲取、數據分析、數據可視化
C、數據清洗、數據獲取、數據可視化、數據分析
D、數據可視化、數據清洗、數據獲取、數據分析
第7題
A、醫療領域,存在大量數據。例如,患者體征數據、住院數據、問診數據、臨床診治數據、用藥數據及各類檢查數據等。合理利用這些海量數據,挖掘其中的價值,對于精準咨詢、臨床決策、精準醫療、醫藥研發等方面的發展,都能提供巨大幫助。
B、谷歌將人們使用搜索引擎檢索信息時使用的關鍵詞視為用戶需求,且反映用戶當前情況。谷歌將包括溫度計、流感癥狀、肌肉疼痛、胸悶等在內的詞視為流感關鍵詞,只要用戶輸入這些關鍵詞,系統就會展開跟蹤分析,創建地區流感圖表和流感地圖。谷歌于2008年推出的一款預測流感的產品Google流感趨勢(Google Flu Trends),根據匯總的Google搜索數據,近乎實時地對全球當前的流感疫情進行估測。
C、零售業寡頭沃爾瑪為其網站Walmart.com自行設計了最新的搜索引擎Polaris,利用語義數據進行文本分析、機器學習和同義詞挖掘等。根據沃爾瑪的說法,語義搜索技術的運用使得在線購物的完成率提升了10%到15%。對沃爾瑪來說,這就意味著數十億美元的金額。
D、電子商務網站會采集用戶訪問網站的時間、頁面停留時間、瀏覽的商品信息等,對于一個用戶的這些數據信息會被逐漸積累起來,讓企業能夠逐步建立起清晰的用戶畫像(User Profile),有利于幫助企業更好地根據客戶的興趣來設計網站主頁和安排網頁內容,改善市場營銷決策。同時,能夠對客戶群進行細分,針對不同客戶制定個性化的促銷策略等。
第8題
大數據時代下的今日頭條 大數據場景應用下,以今日頭條為代表的搜索、推薦、個性化定制的新聞客戶端憑借技術優勢成為業界焦點。通過數據分析、數據挖掘、信息檢索、個性推薦算法、人工智能等技術手段,今日頭條得以實現最精準的內容推薦。 今日頭條作為最近年來最火的移動互聯網產品之一,其成功在很大程度上取決于頭條團隊大膽地利用大數據和人工智能技術顛覆傳統的內容傳播形式。12月9日,今日頭條算法架構師曹博士將首次全面介紹今日頭條在內容創作、內容管理、以及內容分發方面的大數據與人工智能實踐。通過眾多詳細的線上案例,介紹內容傳播領域正在發生的大數據與人工智能革命。 截至2016年8月底,今日頭條已有超過5.5億的用戶,日活躍用戶超過6000 萬,單用戶日均啟動次數約9次,單用戶日均使用時長超過76分鐘。 5.5億頭條用戶中,女性用戶占45%,男性用戶占55%;從地域分布看,一線和二線城市的用戶占到一半,三線及以下城市用戶占比49.8%。 從用戶年齡構成來看,頭條用戶中比重最大的是24-30歲的用戶,接近47%,他們數量龐大,是目前最為接受互聯網消費方式的人群。3/4的頭條用戶在1985年后出生,是現在和將來推動產生新興消費方向、消費升級的主力。 算數中心是今日頭條的數據部門,其數據全部由個性化推薦所積累。而今日頭條是一款基于機器學習的個性化推薦引擎,其基本邏輯主要有兩條: 第一,用戶使用App越多時,發生的動作類型就越多,如用戶的互動、閱讀內容的數量、速度及場景等。通過這些動作收集而來的數據能夠完整的描述用戶畫像,就像醫生見到病人后從各個角度進行觀察,并把其特征描述地很細。當細化的描述形成有結構的表格后,今日頭條就能“認識”每一個人。然后再以同樣的方法“認識”每篇文章、每個關鍵詞后,系統就能夠讓他們在向量空間中擁有各自的位置,并通過算法進行匹配。當匹配度越高的時候,系統就認為這是該用戶最想得到的信息,并進行推送。 第二,用戶可能之前沒有足夠的歷史信息提供給數據庫。這種情況就需要第二條邏輯來為他們提供感興趣的信息,即“越多的人用越懂你”。即便用戶對推薦引擎來說是陌生的,但總會有相同特征的用戶,比如使用蘋果手機的男性、三十到四十歲年齡之間等人群畫像是系統已經了解過的。它可以據此對類似人群進行解讀,把用戶最可能感興趣的信息推送過去。因此,每個人的頭條都是不一樣的,即“你所關心的才是頭條”。 按照以上兩條邏輯,我們對文章和用戶的匹配和連接對象進行了更細化的拆分。今日頭條的推薦引擎按照關鍵詞和分類先把文章分到具體的特征向量中,再對用戶進行定位,并分配到具體的特征向量中。最后將這兩者進行匹配,按照推薦引擎學習到的算法,把不同的信息推送到每位用戶。 在整個推薦過程中,受眾也會對文章進行反饋。對于反饋信息,會把它沉淀下來放到媒體實驗室,而媒體實驗室就是對今日頭條后臺數據進行提取和分析的數據產品。但媒體實驗室現在最主要的功能就是來促進創作、服務創作者,用數據來告訴創作者,目前的內容的潮頭在哪里?他們寫什么樣的東西可能會受歡迎?受眾是什么樣子的?等等。 目前,人工智能已經可以在財經報道,體育賽事報道等領域自動創作內容,可讀性完全可以媲美人工編輯;智能算法還可以自動給出封面建議,以減少視頻上傳者的選擇成本;智能算法也可以從體育比賽,MV等長視頻中自動抽取精彩片段,甚至生成gif,可以節省用戶時間和流量。 根據案例: (1)試從決策支持的角度分析今日頭條的特點。 (2)試從大數據應用分析的角度分析今日頭條的特點。 (3)從人工智能的角度,預測一下今日頭條的發展趨勢。
為了保護您的賬號安全,請在“上學吧”公眾號進行驗證,點擊“官網服務”-“賬號驗證”后輸入驗證碼“”完成驗證,驗證成功后方可繼續查看答案!