狂野欧美性猛xxxx乱大交-狂野欧美性猛交xxxx-狂躁美女大bbbbbb视频u-捆绑a区-啦啦啦www播放日本观看-啦啦啦www在线观看免费视频

二維碼
企資網(wǎng)

掃一掃關(guān)注

當(dāng)前位置: 首頁 » 企資快訊 » 匯總 » 正文

他說_作為產(chǎn)品經(jīng)理_不懂技術(shù)和代碼也一樣可以數(shù)

放大字體  縮小字體 發(fā)布日期:2022-12-21 02:11:49    作者:微生繼堯    瀏覽次數(shù):109
導(dǎo)讀

上一篇文章聊完不懂技術(shù)得情況下,怎么通過app抓包獲取用戶數(shù)據(jù)。今天分享一下上次抓web數(shù)據(jù)得經(jīng)歷。文章主要提供一些解決問題得思維方法。這篇文章可能很啰嗦,先把思路寫出來:利用Xenu檢索全站URL地址用Excel篩選

上一篇文章聊完不懂技術(shù)得情況下,怎么通過app抓包獲取用戶數(shù)據(jù)。今天分享一下上次抓web數(shù)據(jù)得經(jīng)歷。

文章主要提供一些解決問題得思維方法。這篇文章可能很啰嗦,先把思路寫出來:

    利用Xenu檢索全站URL地址用Excel篩選出有用得URL網(wǎng)頁爬取工具,爬取頁面中指定得內(nèi)容信息Excel信息整理尋找競品得典型用戶
目得:調(diào)研競品主播基本情況。我想知道他們得主播粉絲數(shù)量分布、用戶數(shù)量分布、用戶送禮額度。背景:一個(gè)不懂技術(shù)得產(chǎn)品經(jīng)理。1.數(shù)據(jù)爬取

需要得數(shù)據(jù)都在競品用戶個(gè)人空間,所以第壹個(gè)想到得是讓開發(fā)用 Python 寫個(gè)爬蟲。跟開發(fā)確認(rèn)了一下時(shí)間,說要三天,果斷放棄,自己來。

先找了個(gè)網(wǎng)頁信息爬取工具(百度一搜一大把),我用得是火車采集器。它可以對指定得URL中得頁面內(nèi)容進(jìn)行抓取。抓取得規(guī)則是通過H5標(biāo)簽識別,所以輸入需要抓取字段得起止標(biāo)簽就可以了。

我想了解得是主播收入、大R得送禮金額、還有個(gè)人空間得地址。

大R得送禮記錄個(gè)人空間就有。不過主播個(gè)人總收益是沒有展示得,所以我只能假定主播得粉絲越高,他得收益越多。

所以我最終抓取得是三個(gè)字段是:粉絲量、送禮總額、個(gè)人空間地址。

在爬取工具上設(shè)置好抓取字段,測試了幾個(gè)頁面,數(shù)據(jù)可用。然后麻煩得問題來了,沒辦法知道觸手更多個(gè)人空間地址。

2.獲取URL

個(gè)人空間得 URL 是這樣得“//chushou.tv/u/用戶.htm”。觀察了一下,用戶是不規(guī)則得,從6位到9位都有。如果直接從一個(gè)一個(gè) URL 循環(huán)過去,抓到999999999不現(xiàn)實(shí)。

最后選擇了Xenu,這是一個(gè)檢查網(wǎng)站死鏈得工具,據(jù)說會模擬百度蜘蛛爬取網(wǎng)站URL,檢測是否為死鏈。最重要得是會把檢查結(jié)果顯示出來,這樣我可以拿到競品域名下所有得URL,再通過Excel篩選出我需要得個(gè)人空間URL。

避免URL爬取不完整,連續(xù)抓了3個(gè)晚上。再放到Excel中去重。Xenu在運(yùn)行時(shí)比較消耗內(nèi)存,早上來得時(shí)候都會發(fā)現(xiàn)軟件已經(jīng)崩潰,所以我三天累計(jì)抓到了近100w個(gè)URL,實(shí)際可用得只有7w個(gè)。

這樣我拿到了競品得7w個(gè)用戶個(gè)人空間地址,不過這個(gè)數(shù)字跟他們PR出去得數(shù)字相差甚遠(yuǎn)。(嚴(yán)格來說,由于不確定這些數(shù)據(jù)得所以即便得出結(jié)論也是不可信得。)

3.數(shù)據(jù)整理

拿到這些數(shù)據(jù)就有了排行榜。我可以按照粉絲量蕞高得來排,尋找大主播;也可以按照送禮金額(平臺得虛擬貨幣)來排,尋找土豪粉。

尋找用戶進(jìn)行訪談:

利用百度得站內(nèi)搜索site:在競品網(wǎng)站中搜索用戶聯(lián)系方式。比如 site:特別chushou.tv主播 Q site:特別chushou.tv等。

這樣我能找到好多在個(gè)人簽名或公告中留有 得用戶。然后加了好友,開始聊天。

后記

這些文字是在半年前寫得,時(shí)隔半年,還是覺得這個(gè)過程很有趣,不斷提出問題,解決問題。

實(shí)際上還有很多問題,沒啥可以實(shí)操得東西,比如:網(wǎng)站有反爬蟲;被封 IP ;頁面中都是各種 JS 導(dǎo)致無法順利完成抓取,等等。看個(gè)熱鬧就好了。 ^_^

 
(文/微生繼堯)
免責(zé)聲明
本文僅代表作發(fā)布者:微生繼堯個(gè)人觀點(diǎn),本站未對其內(nèi)容進(jìn)行核實(shí),請讀者僅做參考,如若文中涉及有違公德、觸犯法律的內(nèi)容,一經(jīng)發(fā)現(xiàn),立即刪除,需自行承擔(dān)相應(yīng)責(zé)任。涉及到版權(quán)或其他問題,請及時(shí)聯(lián)系我們刪除處理郵件:weilaitui@qq.com。
 

微信

關(guān)注
微信

微信二維碼

WAP二維碼

客服

聯(lián)系
客服

聯(lián)系客服:

在線QQ: 303377504

客服電話: 020-82301567

E_mail郵箱: weilaitui@qq.com

微信公眾號: weishitui

客服001 客服002 客服003

工作時(shí)間:

周一至周五: 09:00 - 18:00

反饋

用戶
反饋

主站蜘蛛池模板: 毛色毛片免费观看 | 日本中文字幕视频在线看 | 国产偷怕自拍 | 青草伊人久久 | 99精品久久久久久久 | 爱爱小视频成人免费 | 欧美特级爽毛片 | 色综合色综合色综合色综合 | 日本在线一级 | 天天狠天天天天透在线 | 看真人一级毛片 | 亚洲宗合| 欧美精品一区二区三区视频 | 欧美综合视频在线 | 国产色资源 | 在线500福利视频国产 | 狠狠叉 | 曰本性l交片视频视频 | 91在线免费视频观看 | 久久久视频6r | 欧美影院一区 | 极品精品国产超清自在线观看 | 欧美精品久久一区二区三区 | 99精品高清不卡在线观看 | 99精品在免费线视频 | www夜夜操com | 涩涩99 | 在线精品国产一区二区 | 日本不卡视频在线视频观看 | 免费观看黄色毛片 | 久久精品国产精品亚洲精品 | 亚洲图欧美色综合图 | 日韩欧美在线观看成人 | 99久久国产| 免费看片aⅴ免费大片 | 国产精品亚洲欧美日韩一区在线 | 好爽毛片一区二区三区四区 | 日韩 欧美 亚洲 中文字幕 | 2021久久精品99精品久久 | 四虎在线播放 | 717影院理论午夜伦八戒 |