電影上映后的百度指數(shù)能推測(cè)出票房成績(jī)嗎?
注:如果你想快速提升百度指數(shù),迅速刷百度指數(shù)上去,加微信號(hào):jipiiiii? 了解。
在上一期中,我們分析了映前百度指數(shù)峰值和映前百度指數(shù)平均值對(duì)票房和排片的影響,結(jié)果發(fā)現(xiàn)百度指數(shù)上映前一周的平均值參考意義要大于峰值,百度指數(shù)平均值確實(shí)是與票房和排片是強(qiáng)關(guān)聯(lián)的,但是無(wú)奈模型的解釋率太低,暫時(shí)還沒(méi)找到有效的線性預(yù)測(cè)模型。
溫故而知新看這里:
電影上映前的百度指數(shù)和首日排片和票房有關(guān)系嗎?
0 1 、引言
當(dāng)時(shí)做完這個(gè)分析后,我們就在思考,如果像第一期提到的那樣,貓眼評(píng)分和豆瓣評(píng)分所代表的映后口碑與票房是有關(guān)聯(lián)的,那么,電影上映后,受到口碑影響的百度搜索指數(shù),是否也會(huì)對(duì)票房產(chǎn)生影響呢?
詳細(xì)解釋一下為什么會(huì)產(chǎn)生這個(gè)想法。首先,對(duì)于普通電影,百度指數(shù)會(huì)在上映前一天(-1)至上映后一天(+1)達(dá)到峰值,隨后慢慢回落,例如《侏羅紀(jì)世界2》這種,
《侏羅紀(jì)世界2》的百度指數(shù)在上映后一天達(dá)到峰值
而許多我們說(shuō)的“黑馬電影”,都是由于映后口碑起來(lái)了,導(dǎo)致更多人搜索電影的相關(guān)訊息,所以百度指數(shù)的峰值在上映后幾天才達(dá)到頂峰;映后搜索量會(huì)出現(xiàn)連綿小波峰,熱度甚至比上映前還高。
用今年現(xiàn)象級(jí)黑馬電影《超時(shí)空同居》和《我不是藥神》來(lái)舉個(gè)例子:
《超時(shí)空同居》5.18上映,5.20日搜索量達(dá)到峰值,熱度是上映當(dāng)天的三倍,而且上映后的搜索量平均值比上映前高出了許多,出現(xiàn)了幾個(gè)搜索波峰。
《我不是藥神》7.5上映,上映后三天(7.8)搜索量達(dá)到峰值,為上映當(dāng)天的1.5倍,且映后出現(xiàn)小波峰。
經(jīng)過(guò)觀察一系列黑馬電影,發(fā)現(xiàn)搜索熱度普遍是在上映后2-4天內(nèi)達(dá)到頂峰,于是我們產(chǎn)生了一個(gè)大膽的想法:
??把百度指數(shù)上映后一周的平均值作為反映口碑的變量之一,分析它與票房的關(guān)系;
??此外,在上一期,我們研究了百度指數(shù)峰值(不包括上映當(dāng)天及上映后)對(duì)票房的影響,這次為了把搜索熱度所反映的口碑納入考量,我們決定加入“宣發(fā)期百度峰值”(包括上映當(dāng)天及上映后)作為一個(gè)變量,這樣能幫助我們更好的理解口碑對(duì)票房的影響到底有多大。
0 2 、方法
我們還是使用同一個(gè)數(shù)據(jù)庫(kù)——17年4月至18年6月,首日排片率≥8%,共計(jì)147部電影作為樣本。
這次的變量是:
①宣發(fā)期百度指數(shù)峰值:電影整個(gè)宣發(fā)周期內(nèi)達(dá)到的百度峰值,包括映前及映后
②百度指數(shù)上映后一周平均值:電影上映后一周的百度指數(shù)相加再除以七天,用其代表上映后一周網(wǎng)民對(duì)于電影的搜索情況。
③總票房
研究問(wèn)題 :電影的宣發(fā)期百度指數(shù)峰值和百度指數(shù)上映后一周平均值,與總票房有關(guān)系嗎?
0 3 、 過(guò)程
先是進(jìn)行數(shù)據(jù)清理:有些片子由于百度指數(shù)異?;蛉笔?,比方《速度與激情》其中“激情”沒(méi)有搜索結(jié)果,數(shù)據(jù)清理后留下124部電影。
我們重點(diǎn)對(duì)3個(gè)數(shù)據(jù)之間進(jìn)行兩組線性分析:
A. 宣發(fā)期百度指數(shù)峰值 x 票房
結(jié)果顯示:相關(guān)性為0.814,挺強(qiáng)的正相關(guān)關(guān)系,之前的分析都沒(méi)見(jiàn)過(guò)這么高的。顯著性為0.000,證明有99.999%的可能性宣發(fā)期百度指數(shù)的峰值與票房是有關(guān)系的。
調(diào)整后R方為0.66,這也是我們最近幾次分析,看到的最高的數(shù)值了,說(shuō)明這個(gè)預(yù)測(cè)模型解釋率有66%,也許可以通過(guò)模型來(lái)預(yù)測(cè)票房。
公式:總票房=-81.538+0.334*宣發(fā)期百度峰值(這可是66%解釋率的公式呢)
懷著激動(dòng)的心情,我拿了一部正常電影(非爆款、非黑馬、中規(guī)中矩、口碑沒(méi)崩、正常檔期)來(lái)做實(shí)驗(yàn),看看測(cè)的準(zhǔn)不準(zhǔn)——
就是你了!
《暴裂無(wú)聲》,峰值13252
→ 預(yù)測(cè)票房4344.6萬(wàn),實(shí)際票房5424.5萬(wàn),相差1000萬(wàn)+,卒
我不信,再試一個(gè)《奇葩朵朵》,峰值15670
→ 預(yù)測(cè)5152萬(wàn),實(shí)際3021.4萬(wàn),相差2000萬(wàn),卒
最后一個(gè)吧,《寂靜之地》,峰值86162
→ 預(yù)測(cè)28696萬(wàn),實(shí)際22100萬(wàn),相差6500萬(wàn)……h(huán)mmm。下一題下一題。
B. 百度指數(shù)上映后一周平均值 x 票房
結(jié)果顯示:相關(guān)性為0.837,很強(qiáng)的正相關(guān)關(guān)系,甚至比前一組還高。顯著性為0.000,證明有99.999%的可能性百度指數(shù)上映后一周平均值與票房是有關(guān)系的。
調(diào)整后R方為0.698,也比前一組高,說(shuō)明這個(gè)預(yù)測(cè)模型解釋率有69.8%,接近70%了哦。也許可以通過(guò)模型來(lái)預(yù)測(cè)票房。
得出公式:總票房=-424.247+0.514*百度指數(shù)映后一周均值
模型解釋率高達(dá)69.8%,顯示后期口碑是影響票房的重要因素。
不死心的我再拿驗(yàn)證峰值的那幾部電影來(lái)測(cè)試一下,看看這個(gè)模型是不是的確更好預(yù)測(cè)票房!
《暴裂無(wú)聲》,百度指數(shù)映后一周平均值11252
預(yù)測(cè)票房5359.28,實(shí)際票房5424.5萬(wàn)。只相差了65萬(wàn)??!
《奇葩朵朵》,百度指數(shù)映后一周平均值6808
預(yù)測(cè)票房3075萬(wàn),實(shí)際票房3021.4萬(wàn),差距縮小到了53萬(wàn)??!興奮到飛起??!
《寂靜之地》,百度指數(shù)映后一周平均值122817
預(yù)測(cè)票房62703萬(wàn),實(shí)際票房22100萬(wàn),這個(gè)就差的比較遠(yuǎn)了。它的映后平均值過(guò)高了,顯示出《寂靜之地》的關(guān)注度很高,但很多人是觀望態(tài)度的,真正走進(jìn)電影院的人卻很少,這種小眾電影的情況就很有意思了。
綜上,百度指數(shù)上映后一周平均值,真的,是一個(gè)非常非常有意義的變量。用這個(gè)變量預(yù)測(cè)票房的模型解釋率也很高。像我們做試驗(yàn)看到的那樣,預(yù)測(cè)普通國(guó)產(chǎn)影片的效果比較好,但是預(yù)測(cè)外國(guó)片子的票房,尤其是一些口碑好但卻又小眾的電影,效果則不佳,畢竟大家都會(huì)在網(wǎng)上看到高清版本。
0 4 、結(jié)論
大成就——
預(yù)測(cè)模型:
總票房=-81.538+0.334*宣發(fā)期百度峰值(66%解釋度)
總票房=-424.247+0.514*百度指數(shù)映后一周均值(69%解釋度)
??宣發(fā)期百度指數(shù)峰值和百度指數(shù)上映后一周平均值,都和電影票房有著強(qiáng)相關(guān)關(guān)系,并且預(yù)測(cè)模型的解釋率都達(dá)60%以上。
??相比之下,百度指數(shù)上映后一周平均值對(duì)業(yè)內(nèi)人士更有參考意義。電影上映后的百度指數(shù)越高,搜索電影的人越多,那么恭喜,電影的票房很有希望。但是本末倒置地去刷指數(shù)是沒(méi)有什么意義的。
??關(guān)心電影票房的朋友們,可以把百度指數(shù)上映后一周的平均值當(dāng)參考,粗略估計(jì)票房,有個(gè)心理預(yù)期。
??模型的局限性依然存在,有許多電影并不適用,所以…如果算出的數(shù)值很低,千萬(wàn)別灰心。
注:如果你想,迅速刷百度指數(shù)上去,加微信號(hào):jipiiiii? 了解。