北大新研究用數(shù)學(xué)模型揭網(wǎng)紅崛起奧秘,登上Nature子刊
【導(dǎo)讀】社交媒體上的「網(wǎng)紅」是怎樣產(chǎn)生的?在一項發(fā)表于《自然·通訊》的研究中,北京大學(xué)與瑞士蘇黎世聯(lián)邦理工大學(xué)領(lǐng)導(dǎo)的研究團隊合作,通過數(shù)學(xué)模型揭示了「網(wǎng)紅」崛起之路。
社交網(wǎng)絡(luò)對我們生活的影響越來越廣:在信息傳播、新技術(shù)應(yīng)用、輿論營造和形成中都發(fā)揮著關(guān)鍵作用。2020 年,推特用戶每天發(fā)送 5 億條推文,超過 8000 萬張圖片通過Instagram發(fā)布。
這些基于 UGC 的定向在線平臺在很大程度上影響了社會,社交網(wǎng)絡(luò)用戶所能接觸到的信息和受眾,遠遠超出現(xiàn)實生活中的朋友。在這個過程中,一些用戶迅速獲得人氣,成為所謂的「網(wǎng)紅」。
這些追隨者眾多的「網(wǎng)紅」的社會影響力不可小覷。,已經(jīng)深刻影響了消費者和公司在市場中的行為,2017 年,超過 70% 的美國企業(yè)聘請 Instagram 網(wǎng)紅來推廣產(chǎn)品。
網(wǎng)紅是如何產(chǎn)生的?背后的機制究竟是什么?這些問題引發(fā)了越來越多學(xué)者的關(guān)注。
論文鏈接:
https://www.nature.com/articles/s41467-021-27089-8.pdf
近日,由北京大學(xué)、瑞士蘇黎世聯(lián)邦理工大學(xué)領(lǐng)導(dǎo)的研究團隊就從數(shù)學(xué)模型角度,對社交網(wǎng)絡(luò)上的「顯著影響者」,即「網(wǎng)紅」的產(chǎn)生和被用戶關(guān)注的機制進行了分析。
這篇文章發(fā)表在近日出版的《自然·通信》上。
與 21 世紀(jì)頭十年蓬勃發(fā)展的 Facebook 和 LinkedIn 相比,當(dāng)今最流行的平臺,例如 Twitter、Instagram 或 TikTok,表現(xiàn)出一些其他明顯的特征。
最明顯的區(qū)別之一是,這些新的在線社交平臺屬于定向網(wǎng)絡(luò),也就是說,不需要雙方同意,也可以按照算法推薦建立關(guān)系。
新網(wǎng)紅是如何產(chǎn)生的?
從直觀上,質(zhì)量更好的 UGC 更有可能吸引用戶,情感價值更高,更容易成為「網(wǎng)紅」。 但研究表明,除了少數(shù)模型之外,其他領(lǐng)域的「網(wǎng)紅」產(chǎn)生規(guī)模效應(yīng)的研究更加集中社會經(jīng)濟方面,忽略了 UGC 的影響。
之前闡釋網(wǎng)紅誕生機制的模型,基于「優(yōu)先依戀」模型。不過這種「富人會越來越富」的理論,并不能證明新的 Instagram網(wǎng)紅崛起的原因,很多網(wǎng)紅在成功之前都是沒什么名氣的。
「內(nèi)容為王」:生成內(nèi)容質(zhì)量更高
文章提出了一種簡單但可預(yù)測的網(wǎng)絡(luò)形成機制,結(jié)合了功利原則和 UGC 質(zhì)量。 研究假設(shè)用戶有共同的興趣,并將他們與定義其 UGC 質(zhì)量的屬性相關(guān)聯(lián)。
為了定義基于 UGC 的形成過程,研究人員收集了Twitter 數(shù)據(jù)集,分析連接的時間序列,發(fā)現(xiàn)有證據(jù)表明,網(wǎng)紅的形成過程源于個人對更好質(zhì)量的 UGC 的不斷搜索,并與關(guān)注者的興趣出現(xiàn)了「對齊」,即網(wǎng)紅與粉絲的興趣同質(zhì)性。
關(guān)注者的數(shù)量可以被視為網(wǎng)紅UGC質(zhì)量的agent。按照UGC質(zhì)量降序給agent進行編號。agent1被視作UGC質(zhì)量最高,agent2質(zhì)量次之,以此類推。
對于agent i,計算出新連接比之前連接的中位數(shù)排名更高(在排名中)的可能性。
研究結(jié)果與假設(shè)吻合,按照被關(guān)注可能性評估,關(guān)注者始終在追尋UGC質(zhì)量更好的網(wǎng)紅。
研究數(shù)據(jù)與純隨機結(jié)果(淺藍色)的比較,二者在統(tǒng)計學(xué)上差異顯著。
齊夫定律
齊夫定律(Zipf"s law)是由哈佛大學(xué)的語言學(xué)家喬治·金斯利·齊夫于1949年發(fā)表的實驗定律。它可以表述為:在自然語言的語料庫里,一個單詞出現(xiàn)的頻率與它在頻率表里的排名成反比。
所以,頻率最高的單詞出現(xiàn)的頻率大約是出現(xiàn)頻率第二位的單詞的2倍,而出現(xiàn)頻率第二位的單詞則是出現(xiàn)頻率第四位的單詞的2倍。
實驗證明,本研究中的模型也遵循這一縮放定律。
網(wǎng)紅粉絲的「重疊」
分析兩個網(wǎng)紅被同一個第三個用戶關(guān)注的概率也是一個有趣的問題。 換句話說,目標(biāo)是研究不同agent的粉絲集合之間的相似性。 這個相似性揭示了粉絲的共同興趣的存在。
為了驗證模型,研究人員在Twitch上收集了三個數(shù)據(jù)集,這是一個流行的在線游戲平臺,并成功驗證了模型的正確性。
這表明,本文中的模型盡管形式簡單,但已經(jīng)得出了幾個現(xiàn)實世界中影響「網(wǎng)紅」崛起的屬性。
如上圖所示,agent的粉絲在前 15 個節(jié)點之間的重疊結(jié)果和驗證數(shù)據(jù)集對照。a圖平均數(shù)值結(jié)果是從模擬中獲得的,當(dāng)達到平衡時,有 10^5 個代理。b圖來自與國際象棋類別相關(guān)的 Twitch 數(shù)據(jù)集結(jié)果。
未來方向
許多當(dāng)今最流行的在線社交網(wǎng)絡(luò)都在很大程度上基于 UGC。 此文分析了基于 UGC 的在線社交網(wǎng)絡(luò)的幾個宏觀特征。
此外,由于簡單,該模型可以向不同方向擴展,例如通過考慮不同的更新規(guī)則和社會學(xué)激勵加以豐富。另一種可能是引入多維質(zhì)量屬性,來應(yīng)對多種興趣的可能性。
該模型還可以適應(yīng)不斷增長的網(wǎng)絡(luò)形成模型,用戶可以在不同時間加入,研究一些網(wǎng)紅的崛起和。在理想情況下,這些研究可以與不同平臺的實證分析相結(jié)合,比如在新一代中占主導(dǎo)地位的 Instagram 或 TikTok等。
未來,關(guān)于推薦系統(tǒng)在社交媒體平臺上的作用,及其對用戶行為的影響的初步結(jié)果,可能進一步擴展。用戶行為與平臺機制之間的相互作用,屬于一個廣泛、未探索的研究方向,可能會進一步闡明數(shù)字化大趨勢對我們社會的影響。
參考資料:
https://www.nature.com/articles/s41467-021-27089-8#Sec2
https://www.groovypost.com/howto/instagram-tips-tricks
本文來自微信公眾號“新智元”(ID:AI_era),編輯:David,36氪經(jīng)授權(quán)發(fā)布。