当前位置:首页 > 宅科技 > 正文

抓取分析淘宝视频直链

这个文章主要是给像窝一样的小白引导一下思路,实现的最终目地是获取一个视频的直链,仅以淘宝视频为例,若违反相关权益,请与博主(慕若曦)取得联系。

声明:博主(慕若曦)非专业人士,对前后端没接触过,有写错的地方望指出,喷子请自重。

准备工作:

  1. Fiddler(或任意一款抓包工具)
  2. IDM(或迅雷等下载工具)
  3. UE编辑器(稍微专业点的文本编辑器就行)
  4. Chrome(或任意浏览器)

写这篇文章我酝酿了一段日子,因为这篇文章会同步发到卡饭论坛去,那么观看者就不光来我博客的这几位读者。所以这个文章要写,还要写的好,要让70%人能看懂,让50%人能照着教程做下去,让20%人能在此基础上有所突破,所以我借助了一些可以不用的工具,如IDM,同时为了让想在电脑上发展的朋友少走弯路,将一些较为专业的工具也逐步介绍给大家,如UltraEdit编辑器。

第一步,安装上述软件

FD下载地址:略

IDM下载地址:Internet Download Manager v6.27.2—— 一款国外流行的优秀下载工具

UE下载地址:UltraEdit v23.20.0.43 中文河蟹版 —— 最强大的文本编辑器

Chrome下载地址:谷歌浏览器 v55.0.2883.87 稳定版

安装完毕后打开FD,在工具-Telelik Fiddler选项面板里勾选捕获https连接并解密

打开FD,确认左下角为监听(捕获)状态,如图示:

打开Chrome浏览器,随意访问一个网页,比如访问我的博客——暮若夕

回到FD,看看FD左侧是否出现捕获的网络会话,如图:

如果捕获到网络会话,说明软件工作正常,否则请检查网卡等设置问题

此处需要记住的两个操作:

F12——捕获通信

Delete——删除选中的通信

好的,做一个最简单的操作证明你学会了上述提到的只是,框选左侧所有的通信,按Del将他们删掉(也可以使用快捷键Ctrl+X清空列表)

第二步,抓包

和刚才的测试操作一样,找到我们本次的目标——

http://cloud.video.taobao.com/play/u/128349686/e/1/t/1/p/1/44243579.swf

在Chrome浏览器里新建一个隐身窗口(快捷键Ctrl+Shift+N),在隐身窗口里预览一下这则视频

恩,2分52秒的小视频

现在我们重新打开一个隐身窗口,打开FD,开始捕获,打开目标网页。

当网页加载完了我们在FD里按F12停止捕获,如下图:

在右侧的窗口中,我们可以看到第14项出现了可疑信息:

图太小了,贴代码出来看看:

<?xml version="1.0" encoding="utf-8"?>
<result>
  <adtemplate>0</adtemplate>
  <autoplay>true</autoplay>
  <duration>173</duration>
  <logo_type>taobao</logo_type>
  <mid>tR/9ENwA3HwCASpYKItmGup2</mid>
  <pic_url>[img]http://img02.taobaocdn.com/bao/uploaded/i2/TB1R3KyNXXXXXXQaXXX1rlbFXXX.JPG[/img]</pic_url>
  <play_type>0</play_type>
  <samekeyframes>true</samekeyframes>
  <uid>128349686</uid>
  <videos>
    <video>
      <bitrate>110</bitrate>
      <init_len>0</init_len>
      <length>2379959</length>
      <type>ld</type>
      <video_url>[flash]http://vodcdn.video.taobao.com/oss/taobao-ugc/49a738b48898432db4c9032a2b3e17ae/1473142091/video.flv[/flash]</video_url>
    </video>
    <video>
      <bitrate>158</bitrate>
      <init_len>0</init_len>
      <length>3416305</length>
      <type>sd</type>
      <video_url>[flash]http://vodcdn.video.taobao.com/oss/taobao-ugc/2dcc8ba8e1c84f3f9cc713c080b741b6/1473142091/video.flv[/flash]</video_url>
    </video>
    <video>
      <bitrate>206</bitrate>
      <init_len>0</init_len>
      <length>4459102</length>
      <type>hd</type>
      <video_url>[flash]http://vodcdn.video.taobao.com/oss/taobao-ugc/1feb3cf054bc420d9e1c68c3764f677d/1473142091/video.flv[/flash]</video_url>
    </video>
    <video>
      <bitrate>268</bitrate>
      <init_len>0</init_len>
      <length>5785315</length>
      <type>ud</type>
      <video_url>[flash]http://vodcdn.video.taobao.com/oss/taobao-ugc/ce2e0ecebe924467964bab00e0061df9/1473142091/video.flv[/flash]</video_url>
    </video>
  </videos>
  <video_id>44243579</video_id>
  <is_auth>false</is_auth>
  <is_success>true</is_success>
</result>
和我的上一篇文章一样,出现了让人很迷茫的鸟语代码,没事,一行一行翻译看看:
首先第一个看不懂的单词:
adtemplate
呐,有道跪了,但这个单词实际上可以拆分一下,template是模板的意思,搭配上ad,如果给中间加一个空格组成“ad template”,直译过来就是广告模板的意思
autoplay——自动播放
duration——持续时间
为了不让这个帖子变成初中英语的听写,其余翻译略过
要注意的是samekeyframes同样是需要拆分的翻译“same key frames”,相同关键帧?不懂这是啥,或许我翻译有问题
当然这些鸟语和我们的主题关系不大,只是带大家克服一下面对代码的恐惧感,接下来回归正题,让我们分析一下里面包含那些可用的信息
bitrate(比特率),总共出现了4次,值依次为:110,158,206,268;
length(长度),总共出现了4次,值依次为:2379959,3416305,4459102,5785315;
type(类型),总共出现了4次,值依次为:ld,sd,hd,ud;
还有一个出现4次的,叫video_url,这就不用说了吧,视频地址
然后就是猜测阶段:
把比特率,长度,类型,视频地址联系起来能想到啥?
哎,对,就是清晰度(我为何想到了葛平?)
回到之前的视频预览里看一下有哪些清晰度,对照一下就知道:
ld是流畅  sd是标清  hd是高清  ud是超清
然后小伙伴就高兴的关闭这则帖子,开始下载video_url中的链接了
然而很快他们就回来了
然后就吐槽,博主骗宝宝,宝宝心里苦
咳,不卖萌了,现在要用到的是我之前在准备工作里说过的软件:IDM
打开IDM,在Chrome浏览器里会提示让你安装IDM的插件,安装上,没安装的自己百度如何解决吧,之前的存稿丢了,这一部分不再叙述
如上图示,为谷歌浏览器在开启IDM插件的情况下提示的对本页面视频的下载
点击下载视频,可以下载到一定大小的视频文件
根据你选择的网址、目标不同,下载到的文件大小也是不同的
因为淘宝对视频采用分段的处理方法,这里不再叙述如何将分段的视频进行合并 ,否则容易被查水表
打开下载的视频可以看到下载到的视频是不完整的,这不是我们的目地,我们需要的是刚才看到的下载链接,复制出来看看
http://vodcdn.video.taobao.com/oss/taobao-ugc/1feb3cf054bc420d9e1c68c3764f677d/1473142091/video.flv/start_1101844/end_2254649/1.flv
在我们之前找到的地址里对比一下:
<video>
<bitrate>206</bitrate>
<init_len>0</init_len>
<length>4459102</length>
<type>hd</type>
<video_url>http://vodcdn.video.taobao.com/oss/taobao-ugc/1feb3cf054bc420d9e1c68c3764f677d/1473142091/video.flv</video_url>
</video>
嗯,没错,这是高清版本的视频地址,将地址贴到UE里详细对比一下
猜测:可下载的原因是因为后面多出来的东西
分析一下多出来的部分
/start_1101844/end_2254649/1.flv
start和end很好理解,开始和结束,尝试着修改一下这两个数值,比如改成
/start_100/end_2250000/1.flv
拼接一下链接,发现也是可以下载的,但下载后与之前的视频在起始和结束上略有区别
那么就要知道这两个参数到底取什么的时候才能取得完整的视频链接
经过测试比较,最终得出,当start参数与init_len一致,end参数与length一致时,此视频为完整视频
好的我们已经结束了对此次教程的完整叙述,接下来总结一些经(xia)验(xie)的问题:
  • 首先是对代码问题不要方,在看不懂的时候可以将文本复制到UE里,利用UE的代码高亮功能快速选取关键性的词组进行判断
  • 有时候抓到的直接就是视频地址,但下载的时候却发现禁止下载,此时可能是cookie在作怪,比如某网站的vip会员视频
  • 最后的1.flv是下载后默认保存的文件名,可以改成任意值
  • 多测试,多对比,作为看不懂js的你我只能用对照法,排除法这种基础的玩意
  • 本文不涉及到C值解析等复杂的玩意,我是来写平民能看懂的教程的,不是来装逼的
  • 按此文中的方法对于淘宝的过长视频下载不了,不要问我为什么,也不要问我怎么解决
  • IDM是个神奇的下载工具,可以用来下载男性交友网站(B站)的视频,手动滑稽
  • FD有汉化版本,但请小心病毒和捆绑
  • 谷歌浏览器安装后默认是谷歌搜索引擎,经常引起很多人说谷歌浏览器打不开网页,麻烦把搜索引擎换成百度再说话
  • 为何要用隐身模式?因为隐身模式会删除所有新 Cookie

QQ群号:543825203[电脑问题互助交流]

文章标题:抓取分析淘宝视频直链
本文作者:慕若曦
发表日期:2017-01-16 03:43 星期一    首发于    暮若夕
本文固定链接: https://www.muruoxi.com/1102.html
 
文章标签:
上一篇: 下一篇:

21 条评论

评论加载中...
  1. 7楼
    姜辰   

    哈哈,高手!!

    2017年1月16日 下午9:17 评论
    • 慕若曦   

      姜大大你好 (= ̄ω ̄=)

      2017年1月16日 下午9:26 评论
      • 姜辰   

        你才是大佬!另外,能不能把自动播放解决了?这样很吓人···

        2017年1月16日 下午9:30 评论
        • 慕若曦   

          啥自动播放

          2017年1月16日 下午9:46 评论
          • 姜辰   

            视频····

            2017年1月17日 上午11:44 评论
            • 慕若曦   

              你用不自动播放Flash的播放器,比如谷歌等不就行了,自动播放flash安全系数低,容易中flash病毒,adobe之所以放弃flash就是因为flash的BUG实在是修不过来

              2017年1月17日 下午5:58 评论
              • 姜辰   

                表示,火狐这个····2333,用谷歌一直无法适应。

                2017年1月17日 下午6:22 评论
                • 慕若曦   

                  我大谷歌肯定好用,不管你信不信,反正我信了

                  2017年1月17日 下午6:27 评论
                  • 姜辰   

                    前来催更~管你谷歌好不好用,我就火狐

                    2017年1月20日 下午10:39 评论
                    • 慕若曦   

                      嗯哼,没啥好思路啊。在筹备电脑优化篇,2月在卡饭的投稿就电脑优化了

                      2017年1月20日 下午10:52 评论
                      • 姜辰   

                        居然直接筹备二月,而我还在每日一文····

                        2017年1月20日 下午11:14 评论
                        • 慕若曦   

                          过会儿发一篇电脑优化吧,以后的作品估计要写软文了,店里销量上不去啊

                          2017年1月20日 下午11:20 评论
                          • 姜辰   

                            专业承接商业性写作~~2333

                            2017年1月20日 下午11:41 评论
  2. 6楼
    西门吹雪   

    膜拜大佬。、、、

    2017年1月18日 上午9:33 评论
    • 慕若曦   

      大佬能写个啥优酷播放么,我提供优酷会员账号

      2017年1月18日 下午2:54 评论
  3. 5楼
    枫雨   

    激动的点进来,看到一大堆东西后,嗯,我不打算继续往下看了,果然小白就该有小白的自觉 ╮( ̄▽ ̄)╭

    2017年1月18日 下午9:50 评论
    • 慕若曦   

      这么说我还是写的太枯燥无味了么QAQ

      2017年1月18日 下午11:02 评论
  4. 除了膜拜,别无它言!

    2017年1月19日 上午9:27 评论
  5. 地板
    colin   

    绝妙好文!提供了一个很好的下载在线视频的思路!

    2017年1月19日 下午8:52 评论
  6. 板凳
    文栋说自媒体   

    向高手致敬!

    2017年1月21日 下午3:36 评论
  7. 沙发
    Leonn   

    羡慕会写代码的菊苣!

    2017年1月21日 下午9:23 评论

发表评论

╮( ̄▽ ̄)╭ |  (= ̄ω ̄=) |  (>﹏<) |  Σ( ° △ °|||)︴ |  Σ(っ °Д °;)っ |  X﹏X |  (╯-_-)╯╧╧

小提示:Ctrl+Enter快速提交助您一臂之力~
十年之约
加载中……