ytdl-nightly/youtube_dl/extractor/once.py

# coding: utf-8
from __future__ import unicode_literals

import re

from .common import InfoExtractor


class OnceIE(InfoExtractor):
    _VALID_URL = r'https?://once\.unicornmedia\.com/now/[^/]+/[^/]+/(?P<domain_id>[^/]+)/(?P<application_id>[^/]+)/(?:[^/]+/)?(?P<media_item_id>[^/]+)/content\.(?:once|m3u8|mp4)'
    ADAPTIVE_URL_TEMPLATE = 'http://once.unicornmedia.com/now/master/playlist/%s/%s/%s/content.m3u8'
    PROGRESSIVE_URL_TEMPLATE = 'http://once.unicornmedia.com/now/media/progressive/%s/%s/%s/%s/content.mp4'

    def _extract_once_formats(self, url):
        domain_id, application_id, media_item_id = re.match(
            OnceIE._VALID_URL, url).groups()
        formats = self._extract_m3u8_formats(
            self.ADAPTIVE_URL_TEMPLATE % (
                domain_id, application_id, media_item_id),
            media_item_id, 'mp4', m3u8_id='hls', fatal=False)
        progressive_formats = []
        for adaptive_format in formats:
            # Prevent advertisement from embedding into m3u8 playlist (see
            # https://github.com/rg3/youtube-dl/issues/8893#issuecomment-199912684)
            adaptive_format['url'] = re.sub(
                r'\badsegmentlength=\d+', r'adsegmentlength=0', adaptive_format['url'])
            rendition_id = self._search_regex(
                r'/now/media/playlist/[^/]+/[^/]+/([^/]+)',
                adaptive_format['url'], 'redition id', default=None)
            if rendition_id:
                progressive_format = adaptive_format.copy()
                progressive_format.update({
                    'url': self.PROGRESSIVE_URL_TEMPLATE % (
                        domain_id, application_id, rendition_id, media_item_id),
                    'format_id': adaptive_format['format_id'].replace(
                        'hls', 'http'),
                    'protocol': 'http',
                })
                progressive_formats.append(progressive_format)
        self._check_formats(progressive_formats, media_item_id)
        formats.extend(progressive_formats)
        return formats
[once] Add new format extractor 2016-03-17 16:05:31 +01:00			`# coding: utf-8`
			`from __future__ import unicode_literals`

			`import re`

			`from .common import InfoExtractor`


			`class OnceIE(InfoExtractor):`
			`_VALID_URL = r'https?://once\.unicornmedia\.com/now/[^/]+/[^/]+/(?P<domain_id>[^/]+)/(?P<application_id>[^/]+)/(?:[^/]+/)?(?P<media_item_id>[^/]+)/content\.(?:once\|m3u8\|mp4)'`
			`ADAPTIVE_URL_TEMPLATE = 'http://once.unicornmedia.com/now/master/playlist/%s/%s/%s/content.m3u8'`
			`PROGRESSIVE_URL_TEMPLATE = 'http://once.unicornmedia.com/now/media/progressive/%s/%s/%s/%s/content.mp4'`

			`def _extract_once_formats(self, url):`
			`domain_id, application_id, media_item_id = re.match(`
			`OnceIE._VALID_URL, url).groups()`
[once] check http formats availability 2016-03-18 11:50:04 +01:00			`formats = self._extract_m3u8_formats(`
[once] Add new format extractor 2016-03-17 16:05:31 +01:00			`self.ADAPTIVE_URL_TEMPLATE % (`
			`domain_id, application_id, media_item_id),`
			`media_item_id, 'mp4', m3u8_id='hls', fatal=False)`
[once] check http formats availability 2016-03-18 11:50:04 +01:00			`progressive_formats = []`
			`for adaptive_format in formats:`
[once] Prevent ads from embedding into m3u8 playlists (Closes #8893) 2016-03-22 18:48:05 +01:00			`# Prevent advertisement from embedding into m3u8 playlist (see`
			`# https://github.com/rg3/youtube-dl/issues/8893#issuecomment-199912684)`
			`adaptive_format['url'] = re.sub(`
			`r'\badsegmentlength=\d+', r'adsegmentlength=0', adaptive_format['url'])`
[once] Add new format extractor 2016-03-17 16:05:31 +01:00			`rendition_id = self._search_regex(`
			`r'/now/media/playlist/[^/]+/[^/]+/([^/]+)',`
			`adaptive_format['url'], 'redition id', default=None)`
			`if rendition_id:`
			`progressive_format = adaptive_format.copy()`
			`progressive_format.update({`
			`'url': self.PROGRESSIVE_URL_TEMPLATE % (`
			`domain_id, application_id, rendition_id, media_item_id),`
			`'format_id': adaptive_format['format_id'].replace(`
			`'hls', 'http'),`
			`'protocol': 'http',`
			`})`
[once] check http formats availability 2016-03-18 11:50:04 +01:00			`progressive_formats.append(progressive_format)`
			`self._check_formats(progressive_formats, media_item_id)`
			`formats.extend(progressive_formats)`
[once] Add new format extractor 2016-03-17 16:05:31 +01:00			`return formats`