A.開放政府數據
B.開展關鍵技術研究
C.推動大數據應用
D.大數據處理
第9題
大數據時代下的今日頭條 大數據場景應用下,以今日頭條為代表的搜索、推薦、個性化定制的新聞客戶端憑借技術優勢成為業界焦點。通過數據分析、數據挖掘、信息檢索、個性推薦算法、人工智能等技術手段,今日頭條得以實現最精準的內容推薦。 今日頭條作為最近年來最火的移動互聯網產品之一,其成功在很大程度上取決于頭條團隊大膽地利用大數據和人工智能技術顛覆傳統的內容傳播形式。12月9日,今日頭條算法架構師曹博士將首次全面介紹今日頭條在內容創作、內容管理、以及內容分發方面的大數據與人工智能實踐。通過眾多詳細的線上案例,介紹內容傳播領域正在發生的大數據與人工智能革命。 截至2016年8月底,今日頭條已有超過5.5億的用戶,日活躍用戶超過6000 萬,單用戶日均啟動次數約9次,單用戶日均使用時長超過76分鐘。 5.5億頭條用戶中,女性用戶占45%,男性用戶占55%;從地域分布看,一線和二線城市的用戶占到一半,三線及以下城市用戶占比49.8%。 從用戶年齡構成來看,頭條用戶中比重最大的是24-30歲的用戶,接近47%,他們數量龐大,是目前最為接受互聯網消費方式的人群。3/4的頭條用戶在1985年后出生,是現在和將來推動產生新興消費方向、消費升級的主力。 算數中心是今日頭條的數據部門,其數據全部由個性化推薦所積累。而今日頭條是一款基于機器學習的個性化推薦引擎,其基本邏輯主要有兩條: 第一,用戶使用App越多時,發生的動作類型就越多,如用戶的互動、閱讀內容的數量、速度及場景等。通過這些動作收集而來的數據能夠完整的描述用戶畫像,就像醫生見到病人后從各個角度進行觀察,并把其特征描述地很細。當細化的描述形成有結構的表格后,今日頭條就能“認識”每一個人。然后再以同樣的方法“認識”每篇文章、每個關鍵詞后,系統就能夠讓他們在向量空間中擁有各自的位置,并通過算法進行匹配。當匹配度越高的時候,系統就認為這是該用戶最想得到的信息,并進行推送。 第二,用戶可能之前沒有足夠的歷史信息提供給數據庫。這種情況就需要第二條邏輯來為他們提供感興趣的信息,即“越多的人用越懂你”。即便用戶對推薦引擎來說是陌生的,但總會有相同特征的用戶,比如使用蘋果手機的男性、三十到四十歲年齡之間等人群畫像是系統已經了解過的。它可以據此對類似人群進行解讀,把用戶最可能感興趣的信息推送過去。因此,每個人的頭條都是不一樣的,即“你所關心的才是頭條”。 按照以上兩條邏輯,我們對文章和用戶的匹配和連接對象進行了更細化的拆分。今日頭條的推薦引擎按照關鍵詞和分類先把文章分到具體的特征向量中,再對用戶進行定位,并分配到具體的特征向量中。最后將這兩者進行匹配,按照推薦引擎學習到的算法,把不同的信息推送到每位用戶。 在整個推薦過程中,受眾也會對文章進行反饋。對于反饋信息,會把它沉淀下來放到媒體實驗室,而媒體實驗室就是對今日頭條后臺數據進行提取和分析的數據產品。但媒體實驗室現在最主要的功能就是來促進創作、服務創作者,用數據來告訴創作者,目前的內容的潮頭在哪里?他們寫什么樣的東西可能會受歡迎?受眾是什么樣子的?等等。 目前,人工智能已經可以在財經報道,體育賽事報道等領域自動創作內容,可讀性完全可以媲美人工編輯;智能算法還可以自動給出封面建議,以減少視頻上傳者的選擇成本;智能算法也可以從體育比賽,MV等長視頻中自動抽取精彩片段,甚至生成gif,可以節省用戶時間和流量。 根據案例: (1)試從決策支持的角度分析今日頭條的特點。 (2)試從大數據應用分析的角度分析今日頭條的特點。 (3)從人工智能的角度,預測一下今日頭條的發展趨勢。
為了保護您的賬號安全,請在“上學吧”公眾號進行驗證,點擊“官網服務”-“賬號驗證”后輸入驗證碼“”完成驗證,驗證成功后方可繼續查看答案!