yt-dlp/yt_dlp/extractor/hgtv.py

from .common import InfoExtractor


class HGTVComShowIE(InfoExtractor):
    IE_NAME = 'hgtv.com:show'
    _VALID_URL = r'https?://(?:www\.)?hgtv\.com/shows/[^/]+/(?P<id>[^/?#&]+)'
    _TESTS = [{
        # data-module="video"
        'url': 'http://www.hgtv.com/shows/flip-or-flop/flip-or-flop-full-episodes-season-4-videos',
        'info_dict': {
            'id': 'flip-or-flop-full-episodes-season-4-videos',
            'title': 'Flip or Flop Full Episodes',
        },
        'playlist_mincount': 15,
    }, {
        # data-deferred-module="video"
        'url': 'http://www.hgtv.com/shows/good-bones/episodes/an-old-victorian-house-gets-a-new-facelift',
        'only_matching': True,
    }]

    def _real_extract(self, url):
        display_id = self._match_id(url)

        webpage = self._download_webpage(url, display_id)

        config = self._parse_json(
            self._search_regex(
                r'(?s)data-(?:deferred-)?module=["\']video["\'][^>]*>.*?<script[^>]+type=["\']text/x-config["\'][^>]*>(.+?)</script',
                webpage, 'video config'),
            display_id)['channels'][0]

        entries = [
            self.url_result(video['releaseUrl'])
            for video in config['videos'] if video.get('releaseUrl')]

        return self.playlist_result(
            entries, display_id, config.get('title'), config.get('description'))
[hgtv] Add new extractor(closes #3999) 2016-08-12 19:05:49 +02:00			`from .common import InfoExtractor`
[hgtvcom:show] Add extractor (Closes #10365) 2016-08-17 23:37:14 +02:00

			`class HGTVComShowIE(InfoExtractor):`
			`IE_NAME = 'hgtv.com:show'`
			`_VALID_URL = r'https?://(?:www\.)?hgtv\.com/shows/[^/]+/(?P<id>[^/?#&]+)'`
[hgtv.com:show] Relax video config regex and update test (closes #13279, closes #13461) 2017-06-22 19:42:42 +02:00			`_TESTS = [{`
			`# data-module="video"`
			`'url': 'http://www.hgtv.com/shows/flip-or-flop/flip-or-flop-full-episodes-season-4-videos',`
[hgtvcom:show] Add extractor (Closes #10365) 2016-08-17 23:37:14 +02:00			`'info_dict': {`
[hgtv.com:show] Relax video config regex and update test (closes #13279, closes #13461) 2017-06-22 19:42:42 +02:00			`'id': 'flip-or-flop-full-episodes-season-4-videos',`
[hgtvcom:show] Add extractor (Closes #10365) 2016-08-17 23:37:14 +02:00			`'title': 'Flip or Flop Full Episodes',`
			`},`
			`'playlist_mincount': 15,`
[hgtv.com:show] Relax video config regex and update test (closes #13279, closes #13461) 2017-06-22 19:42:42 +02:00			`}, {`
			`# data-deferred-module="video"`
			`'url': 'http://www.hgtv.com/shows/good-bones/episodes/an-old-victorian-house-gets-a-new-facelift',`
			`'only_matching': True,`
			`}]`
[hgtvcom:show] Add extractor (Closes #10365) 2016-08-17 23:37:14 +02:00
			`def _real_extract(self, url):`
			`display_id = self._match_id(url)`

			`webpage = self._download_webpage(url, display_id)`

			`config = self._parse_json(`
			`self._search_regex(`
[hgtv.com:show] Fix typo 2017-06-22 21:54:12 +02:00			`r'(?s)data-(?:deferred-)?module=["\']video["\'][^>]>.?<script[^>]+type=["\']text/x-config["\'][^>]*>(.+?)</script',`
[hgtvcom:show] Add extractor (Closes #10365) 2016-08-17 23:37:14 +02:00			`webpage, 'video config'),`
			`display_id)['channels'][0]`

			`entries = [`
			`self.url_result(video['releaseUrl'])`
			`for video in config['videos'] if video.get('releaseUrl')]`

			`return self.playlist_result(`
			`entries, display_id, config.get('title'), config.get('description'))`