上映 10 天,票房就突破 10 億的《海王》真的有那么好看?
寫在前面
本文將主要通過Python加上一些數據分析,來證明《海王》好看。
《海王》一部電影帶你重溫《馴龍高手》《變形金剛》《星球大戰》《星河戰隊》《鐵血戰士》《安德的游戲》《異形》可能還借鑒了對手的《鋼鐵俠》與《黑豹》劇情,再稍稍帶一點《大魚海棠》的味道,配上一丟丟溫子仁式恐怖片套路,優秀的商業片,應該是DC年度最佳了。溫子仁,優秀的集大成者。
上映 10 天,票房就達到了 10 億。
在做數據分析之前,我們需要先對數據做清洗,將數據處理到最佳
讀取數據,讀取數據的時候記住,需要把header=None然后增加names
#?讀取數據
def?get_data():
df?=?pd.read_csv("haiwang.csv",sep=",",header=None,names=["nickName","cityName","content","approve","reply","startTime","avatarurl","score"],encoding="utf-8")
return?df
清洗數據
查看數據是否有重復,采用drop_duplicates刪除數據
刪除數據之后,需要重置索引 reset_index
處理時間字段為datetime類型
增加一個字段為content_length查閱用戶評論數量
#?清洗數據
def?clean_data():
df?=?get_data()
has_copy?=?any(df.duplicated())
data_duplicated?=?df.duplicated().value_counts()
#print(data_duplicated)?#?查看有多少數據是重復的
data?=?df.drop_duplicates(keep="first")??#?刪掉重復值
data?=?data.reset_index(drop=True)??#?重置索引
data["startTime"]?=?pd.to_datetime(data["startTime"])
data["content_length"]?=?data["content"].apply(len)
#?print(data.isnull().any())?判斷空值
#?print(data[data.isnull().values?==?True])
#?print(data[data.nickName=="."])
return?data
查看所有數據情況
的最高數目是2783 非常高了,但是平均值才0.25 可見,貓眼上人們并不是很喜歡。回復數最高的才 43 可以說非常低了。
《海王》50%以上的人給了5分,肯定是很好看了。
看一下最高的一些數據
“幻影XL”獲得了最多的,可以看一下他的評論內容。恩,寫的確實不錯,夸了一下導演,這個地方出現一點小的疏漏,我看到貓眼最高的,我竟然沒有抓取到數據,應該是給遺漏掉了,疏忽啊!
排名
回復排名
#?查看數據基本情況
def?analysis1():
data?=?clean_data()
print(data.describe())
#?刪除.
#?need_delete?=?data[data["nickName"]=="."]
data?=?data[~(data['nickName']==".")]
#?data?=?data[~data['nickName'].isin(["."])]
#?data.drop(need_delete,axis=1,inplace=True)
print(data["nickName"].describe())
print(data["cityName"].describe())
查看nickName的描述,發現竟然有個“.” ,需要把數據過濾掉,觀影此處最多的城市是北京。
去除 “.” 數據的辦法是 data = data[~(data['nickName']==".")]
count?57838
unique?55934
top?qzuser
freq?57
Name:?nickName,?dtype:?object
看一下qzuser這個人發了57條都是啥?
這位老鐵還真的發了很多,一個勁的夸這個電影。
看評分
5分遙遙領先,周末的票已經買好,準備去看啦~
圖表的實現用的是pychats,官方文檔詳見:http://pyecharts.org/#/zh-cn/prepare。
你可以去查閱文檔,看一下詳細的參數設置:
#?分析打分score情況
def?analysis2():
data?=?clean_data()
grouped?=?data.groupby(by="score")["nickName"].size()
grouped?=?grouped.sort_values(ascending=False)
index?=?grouped.index
values?=?grouped.values
#?柱狀圖
bar?=?Bar("柱狀圖",title_pos="left",width=240)
bar.add("",index,values,is_label_show=True,is_legend_show=True,mark_line=["min","max"])
#?Pie圖
pie?=?Pie("餅圖",title_pos="right",width=240)
pie.add("",index,values,radius=[45,65],center=[70,50],is_label_show=True,legend_pos="90%",legend_orient=?"vertical")
grid?=?Grid(page_title="《海王》評分詳情",width=1200,height=500)
grid.add(bar,grid_right="50%")
grid.add(pie,?grid_left="70%")
grid.render("html/score.html")
print(data)
print(data[data["score"]==0])
看評語
def?analysis3():
data?=?clean_data()
sort_data?=?data.sort_values(by="content_length",ascending=False)
print(sort_data.head(10)["content"])
節選幾個,可以看看,順便我還可以學習一下語文:
劇情和特效在科幻片中的精彩佳作。劇情延續著海神波塞冬用的玄鐵打造的三叉戟鋪開,影片中的海王的身世讓力量成為了傳奇,他有其它亞特蘭蒂斯人不具備的亞特蘭王的能力。海王在漫畫中和其他很多英雄不一樣的是,他并不反感殺戮,甚至有些渴望鮮血,這使得他在外型和性格上很難討喜。溫子仁對海王的性格做了一定程度上的改編,弱化了他的殘忍,突出了他自卑的性格。整部《海王》表面看上去是一場王位爭奪戰,實際是亞瑟戰勝自卑的成長史,而獲得三叉戟就是他性格極為重要的轉折點。
“溫子仁真的厲害,在這部電影的鏡頭上和音效上真的是下了功夫,影片中適時響起的音效結合畫面,很加分,影片大的方向來看是一部英雄成長史,有主角的披荊斬棘也有活潑溫情, 擅長拍恐怖驚悚題材的他,在有些鏡頭的處理上能讀到驚悚的味道,用最擅長的恐怖元素牢牢把握住觀眾的注意力,但點到為止沒破壞電影的整體氛圍,度把握的很不錯 ,DC這次請溫子仁操刀算是做對了一件事,而且海底世界的特效也相當給力,故事劇情上有幾個點的設計很靈性,我覺得比毒液好看,因為毒液前面殺人的驚悚畫面嚇到我了,當然這部電影不是沒有缺點,比如有幾個地方我覺得節奏進程過快,劇情套路容易被猜中等等,但畢竟放眼整部影片來看,我給出四個字——瑕不掩瑜”
特效還可以的啦,但是劇情真的細碎,就本人而言槽點滿滿,起因在于海網的母親因為生下海王而死,也沒在海王小時候就派人弄死他,之后奧姆因為陸地人伏擊他們決定發起戰爭(也有可能是奧姆的陰謀,但是海底人被各種殘害是事實)結果眉拉,作為奧姆的青梅竹馬就背叛奧姆了,就去找海王了,也不知道怎么一牽手,一擁抱,就擦起了愛情的火花(很多人說女主超級美,我看到了寡姐的影子,一頭紅發,犀利的眼神,個人感覺像寡姐的山寨)然后海王就找到了三叉戟,開啟了主角光環之嘴炮無敵,拿到三叉戟,噼里啪啦的先弄死一堆海族人,然后成了海族人的王,奧姆被綠了,王位被搶。海王還說我是海洋的領主,你怕不是翻譯官的頭頭。海族人也凄慘,打不過啊。
先說優點特效很足!特效很足!特效很足!劇情全程沒有挖坑。但是不知道為什么!看得不過癮感覺就跟一般,男女主角愛得莫名其妙,感覺亞特蘭蒂斯的女人都有一個特點:喜歡陸地上的男人,不喜歡本土的。挺同情海里的男人的,自己未婚妻和陸地上的男人跑了,還生了個兒子。把老婆搶回來后不是寵愛,而是生完孩子女兒后,拿去祭獻給丑陋的退化的海怪???女兒長大后上陸地又愛上了同母異父的哥哥???背叛得莫名其妙。最后男主拿到了自己的武器不是因為自己有多勇敢多牛逼,而是因為男主能和海里的動物對話???那我倒是奇怪了海里的動物怎么聽得懂英語。離題了就回來,有點鉆牛角尖了。要我說海神三叉戟就是個大型信號擴散器,幫助擴散命令罷了。
看一下評論時間
對于《海王》我只獲取了4天的數據,看一下大家都在什么時間進行評論吧,晚上10點以后寫評論的比較多,估計是大家看完電影,回家沒啥事情才開始寫評論。
def?analysis4():
data?=?clean_data()
#?獲取時間
#?添加小時
data["hour"]?=?data["startTime"].dt.hour
data["startTime"]?=?data["startTime"].dt.date
need_date?=?data[["startTime","hour"]]
def?get_hour_size(data):
hour_data?=?data.groupby(by="hour")["hour"].size().reset_index(name="count")
return?hour_data
data?=?need_date.groupby(by="startTime").apply(get_hour_size)
data_reshape?=?data.pivot_table(index="startTime",columns="hour",values="count")
bar?=?Bar("分時評論分析",width?=1200,height=600,title_pos?="center")
data_reshape.fillna(0,inplace=True)
print(data_reshape)
for?index,row?in?data_reshape.T.iterrows():
print(data_reshape.index)
v1?=?list(row.values)
bar.add(str(index)+"時",row.index,v1,is_legend_show=True,legend_pos="80%",legend_text_size=8)
bar.render("html/1.html")
粉絲分布
#?處理地名數據,解決坐標文件中找不到地名的問題
def?handle(cities):
#?獲取坐標文件中所有地名
data?=?None
with?open(
'city_coordinates.json文件地址',
mode='r',?encoding='utf-8')?as?f:
data?=?json.loads(f.read())??#?將str轉換為json
#?循環判斷處理
data_new?=?data.copy()??#?拷貝所有地名數據
for?city?in?set(cities):??#?使用set去重
#?處理地名為空的數據
if?city?==?'':
while?city?in?cities:
cities.remove(city)
count?=?0
for?k?in?data.keys():
count?+=?1
if?k?==?city:
break
if?k.startswith(city):
#?print(k,?city)
data_new[city]?=?data[k]
break
if?k.startswith(city[0:-1])?and?len(city)?>=?3:
data_new[city]?=?data[k]
break
#?處理不存在的地名
if?count?==?len(data):
while?city?in?cities:
cities.remove(city)
#?寫入覆蓋坐標文件
with?open(
'city_coordinates.json文件地址',
mode='w',?encoding='utf-8')?as?f:
f.write(json.dumps(data_new,?ensure_ascii=False))??#?將json轉換為str
def?analysis6():
data?=?clean_data()
cities?=?list(data[~data["cityName"].isnull()]["cityName"].values)
handle(cities)
style?=?Style(
title_color='#fff',
title_pos='center',
width=1200,
height=600,
background_color='#404a59'
)
new_cities?=?Counter(cities).most_common()
geo?=?Geo("《海王》粉絲分布","數據來源:CSDN-夢想橡皮擦",**style.init_style)
attr,?value?=?geo.cast(new_cities)
geo.add('',?attr,?value,?visual_range=[0,?3500],visual_text_color='#fff',?symbol_size=15,is_visualmap=True,?is_piecewise=True,?visual_split_number=10)
geo.render('粉絲位置分布-GEO.html')
詞云圖
import?jieba.analyse
def?analysis7():
data?=?clean_data()
contents?=?list(data["content"].values)
try:
jieba.analyse.set_stop_words('stopwords.txt')
tags?=?jieba.analyse.extract_tags(str(contents),?topK=100,?withWeight=True)
name?=?[]
value?=?[]
for?v,?n?in?tags:
#?權重是小數,為了湊整,乘了一萬
name.append(?v)
value.append(?int(n?*?10000))
wordcloud?=?WordCloud(width=1300,?height=620)
wordcloud.add("",?name,?value,?word_size_range=[20,?100])
wordcloud.render()
except:
print("錯誤")
全是好評啊,特效好看、劇情好看、DC、海王、溫子仁、女主。大家可以約起了~~
---------------
本文轉自CSDN資訊
數據平臺
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。