一直以来都容易忘记东西,我一个季度基本要追10部以上的新番,基本都会忘记去看,有时碰巧遇上,更多的时候都是被我遗忘在岁月长河中……(远望……
一直想找一个能够新番出了提醒我,{自动}记录哪集是我看过的,或者哪集是我看到一半坑掉的……之类的.
没找到?!(有的话请务必留言告诉我)
好吧,那我就自主研发……
在没找到合适的APP来做这个事情之前,我就弄一个吧!
想了一下,按照我自己的意愿,我想有以下功能:
- 自动更新节目表
- 最新集数自动更新
- 邮件(App推送提醒)提醒
- [考虑中]Chrome插件,自动记录看过的集数
- [考虑中]干脆把B站的播放器弄进去好了……?!
- [考虑中]B站个人账号播放记录抓取,自动更新看过的番
- ……
想法很美好,实现有点困难.
首先在选用哪个语言来做爬虫,抓取新番数据呢?!
又或者,选择哪个网站来抓取新番数据呢?!
B站吗?还是迅雷看看?(←貌似有人提供了一个成品?? https://gist.github.com/RicterZ/8134886 )
貌似python的数据处理能力很牛逼,但是我对这个语言不怎么熟悉……
PHP貌似也能勉强干活……?
好吧,整理下思路,:
爬虫抓取新番数据→数据库→网页端选择要关注的新番→[爬虫]新番出现→按照预先设定的通知方式通知
Chrome插件这个貌似也可以有:
设置bilibili.tv域名触发器→获取浏览器地址[标题]→判断该视频是否为新番→将数据写入数据库
假如进展顺利还可以考虑把这些东西整理到一些GTD App(或者TDL App)之类的……?!
多想,总是好的.
#########
果然爬虫还是用python写好了,在解析html上面实在比PHP方便太多……
這個是要搶星祈娘的飯碗咩?
噗哈哈 他的是自动下载。。我们之间的需求(目的)不同
1.如果不需要後端的話,感覺還是Chrome的擴充功能比較好,畢竟不用交互通信。但如果要自動查詢(較長時間不開瀏覽器)的話就要做後端了,不過我看那個可以有,就可以省點時間,不過麻煩在下面。
2.如果都是在B站看的話就可以讀歷史記錄啦,不過可能難以判斷是不是坑了。況且還有下載下來看了的話會比較麻煩。可以試試手機端,但是同步又要又是一個大坑(除非即時同步)。
如果要達到完全自動化的話請注意有這樣的麻煩
「僅在B站看 –> Chrome擴充搞定一切」
「迅雷看看也看一看,不過只在電腦上 –> 運行在操作系統上程式(注意要是全平臺(PC)的,而且代碼**不可能**被復用)」
「Android手機也看一看(非B站應用) –> 自動化你得會Java或者C++」
「iOS設備也看一看(非B站應用) –> 請越獄後學習iOS私有API並且使用Mac系統」
如果不用這麼強大(編死你啊)的話,根據提醒速度的不同又不一樣
「僅當我開Chrome的時候問我是不是看了(挑戰記憶力) –> Chrome擴充搞定一切」
「Chrome擴展丟失心跳時手機上問我(注意這樣無法處理手機上的自動化) –> 後端強支持(推薦不要用PHP)+Android應用(PhoneGap就可以了)」
「定時提醒 –> *一直*開着行動數據(PhoneGap) OR 絕對不幹(定時開App的App或者鬧鐘或者是學習Java或者C++)」
「啓動指定APP之後提醒我 –> Android(Java/C++)、iOS(越獄+私有API+Mac)」
3.我之前的那個Data & Process可能可以幫到你,不過只是儲存類的。
4.建議可以模塊&擴充化
剛剛看了下那個,要是看得懂Python的話,感覺還是抽出來比較好吧,畢竟API調用代價可能會比較高。不過似乎是靠分析迅雷看看的,
「修正一點,上面的僅在B站看也可以改爲僅在B站+迅雷看看網頁版看,只要可以馬上發現的就可以了」
P.S.那個頁面你鏈接錯了
我想了一下的確需要後端;
在B站看的確可以用歷史紀錄解決問題,其實判斷是不是坑了,這個問題不大(應該),只要有了插件,或者直接調用B站的API的确可以直接获取到播放过的视频,你说的“不知道有没有坑掉”的这个问题,我认为值得深入探讨,目前没有什么已知的方法可以判断,这个以后再说……
目前我的短期目标是通过python的爬虫先把新番的数据扒到数据裤先,解决了这个我再写一个在线的Web平台,目前先解决手工记录哪些看过这个问题先,然后再写一个邮件提醒,所以目前最先要解决的是用python写一个每X分钟爬一次B站的爬虫,把新番数据入库,发现新番发个邮件……
解决了这些以后,再弄一个html5的webapp,这样全平台暂时就解决。
各种各样的提醒方式这个以后再说,先把基本框架(后端)弄出来吧……
这任务艰巨
把你的D&P讲讲。。
##
现在的确是模块化开发,我现在就在写爬虫这个模块。。
~~
話說如果是檢查的話不如重用一下那個代碼庫。
有沒有坑掉可能就要詢問用戶了。
全平台說的是Win Linux (Mac)啊!
如果像這樣寫的話自動化可能會有點差,要成為習慣才可以呢。而且自動化程度要求高的話,WebAPP的代碼沒辦法重用呢。感覺還是現在就想好什麼效果能夠接受比較好呢。
D&P的話,這是一個(暫時是,以後我會用一些API來封裝一下,但是不會有Python的,畢竟我不會嘛,不過你需要我試著學一下也行)JSON的數據格式,儲存數據會方便一點。要文檔的話也有。