New Project!準備寫一個新番提醒系統

一直以來都容易忘記東西,我一個季度基本要追10部以上的新番,基本都會忘記去看,有時碰巧遇上,更多的時候都是被我遺忘在歲月長河中……(遠望……

一直想找一個能夠新番出了提醒我,{自動}記錄哪集是我看過的,或者哪集是我看到一半坑掉的……之類的.

沒找到?!(有的話請務必留言告訴我)

好吧,那我就自主研發……

在沒找到合適的APP來做這個事情之前,我就弄一個吧!

想了一下,按照我自己的意願,我想有以下功能:

  • 自動更新節目表
  • 最新集數自動更新
  • 郵件(App推送提醒)提醒
  • [考慮中]Chrome插件,自動記錄看過的集數
  • [考慮中]乾脆把B站的播放器弄進去好了……?!
  • [考慮中]B站個人賬號播放記錄抓取,自動更新看過的番
  • ……

想法很美好,實現有點困難.

首先在選用哪個語言來做爬蟲,抓取新番數據呢?!

又或者,選擇哪個網站來抓取新番數據呢?!

B站嗎?還是迅雷看看?(←貌似有人提供了一個成品?? https://gist.github.com/RicterZ/8134886  )

貌似python的數據處理能力很牛逼,但是我對這個語言不怎麼熟悉……

PHP貌似也能勉強幹活……?

好吧,整理下思路,:

爬蟲抓取新番數據→數據庫→網頁端選擇要關注的新番→[爬蟲]新番出現→按照預先設定的通知方式通知

Chrome插件這個貌似也可以有:

設置bilibili.tv域名觸發器→獲取瀏覽器地址[標題]→判斷該視頻是否為新番→將數據寫入數據庫

假如進展順利還可以考慮把這些東西整理到一些GTD App(或者TDL App)之類的……?!

 

多想,總是好的.

#########

果然爬蟲還是用python寫好了,在解析html上面實在比PHP方便太多……

作者

OX

我是一個住在大阪農村,在家種菜的人。 曾經一時興起學吹單簧管,結果沒堅持下來。 現在一邊上學一邊炒作垃圾股賺零花錢。

“New Project!準備寫一個新番提醒系統” 有 6 則評論

  1. 1.如果不需要後端的話,感覺還是Chrome的擴充功能比較好,畢竟不用交互通信。但如果要自動查詢(較長時間不開瀏覽器)的話就要做後端了,不過我看那個可以有,就可以省點時間,不過麻煩在下面。
    2.如果都是在B站看的話就可以讀歷史記錄啦,不過可能難以判斷是不是坑了。況且還有下載下來看了的話會比較麻煩。可以試試手機端,但是同步又要又是一個大坑(除非即時同步)。
    如果要達到完全自動化的話請注意有這樣的麻煩
    「僅在B站看 –> Chrome擴充搞定一切」
    「迅雷看看也看一看,不過只在電腦上 –> 運行在操作系統上程式(注意要是全平臺(PC)的,而且代碼**不可能**被復用)」
    「Android手機也看一看(非B站應用) –> 自動化你得會Java或者C++」
    「iOS設備也看一看(非B站應用) –> 請越獄後學習iOS私有API並且使用Mac系統」
    如果不用這麼強大(編死你啊)的話,根據提醒速度的不同又不一樣
    「僅當我開Chrome的時候問我是不是看了(挑戰記憶力) –> Chrome擴充搞定一切」
    「Chrome擴展丟失心跳時手機上問我(注意這樣無法處理手機上的自動化) –> 後端強支持(推薦不要用PHP)+Android應用(PhoneGap就可以了)」
    「定時提醒 –> *一直*開着行動數據(PhoneGap) OR 絕對不幹(定時開App的App或者鬧鐘或者是學習Java或者C++)」
    「啓動指定APP之後提醒我 –> Android(Java/C++)、iOS(越獄+私有API+Mac)」
    3.我之前的那個Data & Process可能可以幫到你,不過只是儲存類的。
    4.建議可以模塊&擴充化

    1. 剛剛看了下那個,要是看得懂Python的話,感覺還是抽出來比較好吧,畢竟API調用代價可能會比較高。不過似乎是靠分析迅雷看看的,
      「修正一點,上面的僅在B站看也可以改爲僅在B站+迅雷看看網頁版看,只要可以馬上發現的就可以了」
      P.S.那個頁面你鏈接錯了

    2. 我想了一下的確需要後端;
      在B站看的確可以用歷史紀錄解決問題,其實判斷是不是坑了,這個問題不大(應該),只要有了插件,或者直接調用B站的API的确可以直接获取到播放过的视频,你说的“不知道有没有坑掉”的这个问题,我认为值得深入探讨,目前没有什么已知的方法可以判断,这个以后再说……
      目前我的短期目标是通过python的爬虫先把新番的数据扒到数据裤先,解决了这个我再写一个在线的Web平台,目前先解决手工记录哪些看过这个问题先,然后再写一个邮件提醒,所以目前最先要解决的是用python写一个每X分钟爬一次B站的爬虫,把新番数据入库,发现新番发个邮件……
      解决了这些以后,再弄一个html5的webapp,这样全平台暂时就解决。
      各种各样的提醒方式这个以后再说,先把基本框架(后端)弄出来吧……
      这任务艰巨
      把你的D&P讲讲。。
      ##
      现在的确是模块化开发,我现在就在写爬虫这个模块。。
      ~~

      1. 話說如果是檢查的話不如重用一下那個代碼庫。
        有沒有坑掉可能就要詢問用戶了。
        全平台說的是Win Linux (Mac)啊!
        如果像這樣寫的話自動化可能會有點差,要成為習慣才可以呢。而且自動化程度要求高的話,WebAPP的代碼沒辦法重用呢。感覺還是現在就想好什麼效果能夠接受比較好呢。
        D&P的話,這是一個(暫時是,以後我會用一些API來封裝一下,但是不會有Python的,畢竟我不會嘛,不過你需要我試著學一下也行)JSON的數據格式,儲存數據會方便一點。要文檔的話也有。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *