Merge d2ab253266 into 46f4c80bc3

Slight refactor
[ie/SampleFocus] Fix extractor (#10947 )
2024-09-07 16:26:45 +00:00 · 2024-09-07 18:26:47 +02:00 · 2024-09-07 17:06:12 +02:00 · 2024-08-30 23:06:28 +02:00 · 2024-08-30 22:54:19 +02:00 · 2024-08-30 22:52:52 +02:00
3 changed files with 79 additions and 2 deletions
--- a/yt_dlp/extractor/_extractors.py
+++ b/yt_dlp/extractor/_extractors.py
@ -217,6 +217,7 @@ from .bbc import (
    BBCCoUkIPlayerGroupIE,
    BBCCoUkPlaylistIE,
 )
+from .beacon import BeaconTvIE
 from .beatbump import (
    BeatBumpPlaylistIE,
    BeatBumpVideoIE,
--- a/yt_dlp/extractor/beacon.py
+++ b/yt_dlp/extractor/beacon.py
@ -0,0 +1,68 @@
+import json
+
+from .common import InfoExtractor
+from ..utils import (
+    ExtractorError,
+    parse_iso8601,
+    traverse_obj,
+)
+
+
+class BeaconTvIE(InfoExtractor):
+    _VALID_URL = r'https?://(?:www\.)?beacon\.tv/content/(?P<id>[\w-]+)'
+
+    _TESTS = [{
+        'url': 'https://beacon.tv/content/welcome-to-beacon',
+        'md5': 'b3f5932d437f288e662f10f3bfc5bd04',
+        'info_dict': {
+            'id': 'welcome-to-beacon',
+            'ext': 'mp4',
+            'upload_date': '20240509',
+            'description': 'md5:ea2bd32e71acf3f9fca6937412cc3563',
+            'thumbnail': 'https://cdn.jwplayer.com/v2/media/I4CkkEvN/poster.jpg?width=720',
+            'title': 'Your home for Critical Role!',
+            'timestamp': 1715227200,
+            'duration': 105.494,
+        },
+    }, {
+        'url': 'https://beacon.tv/content/re-slayers-take-trailer',
+        'md5': 'd879b091485dbed2245094c8152afd89',
+        'info_dict': {
+            'id': 're-slayers-take-trailer',
+            'ext': 'mp4',
+            'title': 'The Re-Slayer’s Take | Official Trailer',
+            'timestamp': 1715189040,
+            'upload_date': '20240508',
+            'duration': 53.249,
+            'thumbnail': 'https://cdn.jwplayer.com/v2/media/PW5ApIw3/poster.jpg?width=720',
+        },
+    }]
+
+    def _real_extract(self, url):
+        video_id = self._match_id(url)
+        webpage = self._download_webpage(url, video_id)
+
+        content_data = traverse_obj(self._search_nextjs_data(webpage, video_id), (
+            'props', 'pageProps', '__APOLLO_STATE__',
+            lambda k, v: k.startswith('Content:') and v['slug'] == video_id, any))
+        if not content_data:
+            raise ExtractorError('Failed to extract content data')
+
+        jwplayer_data = traverse_obj(content_data, (
+            (('contentVideo', 'video', 'videoData'),
+             ('contentPodcast', 'podcast', 'audioData')), {json.loads}, {dict}, any))
+        if not jwplayer_data:
+            if content_data.get('contentType') not in ('videoPodcast', 'video', 'podcast'):
+                raise ExtractorError('Content is not a video/podcast', expected=True)
+            if traverse_obj(content_data, ('contentTier', '__ref')) != 'MemberTier:65b258d178f89be87b4dc0a4':
+                self.raise_login_required('This video/podcast is for members only')
+            raise ExtractorError('Failed to extract content')
+
+        return {
+            **self._parse_jwplayer_data(jwplayer_data, video_id),
+            **traverse_obj(content_data, {
+                'title': ('title', {str}),
+                'description': ('description', {str}),
+                'timestamp': ('publishedAt', {parse_iso8601}),
+            }),
+        }
--- a/yt_dlp/extractor/samplefocus.py
+++ b/yt_dlp/extractor/samplefocus.py
@ -36,7 +36,7 @@ class SampleFocusIE(InfoExtractor):

    def _real_extract(self, url):
        display_id = self._match_id(url)
-        webpage = self._download_webpage(url, display_id)
+        webpage = self._download_webpage(url, display_id, impersonate=True)

        sample_id = self._search_regex(
            r'<input[^>]+id=(["\'])sample_id\1[^>]+value=(?:["\'])(?P<id>\d+)',
@ -82,7 +82,15 @@ class SampleFocusIE(InfoExtractor):
        return {
            'id': sample_id,
            'title': title,
-            'url': mp3_url,
+            'formats': [{
+                'url': mp3_url,
+                'ext': 'mp3',
+                'vcodec': 'none',
+                'acodec': 'mp3',
+                'http_headers': {
+                    'Referer': url,
+                },
+            }],
            'display_id': display_id,
            'thumbnail': thumbnail,
            'uploader': uploader,
Author	SHA1	Message	Date
Deukhoofd	b8449a9a22	Merge `d2ab253266` into `46f4c80bc3`	2024-09-07 16:26:45 +00:00
sepro	d2ab253266	Slight refactor	2024-09-07 18:26:47 +02:00
sepro	46f4c80bc3	[ie/SampleFocus] Fix extractor (#10947 ) Closes #10945 Authored by: seproDev	2024-09-07 17:06:12 +02:00
Deukhoofd	0eedb14342	[ie/Beacon] Inline return statement, validations	2024-08-30 23:06:28 +02:00
Deukhoofd	32dc95c458	[ie/beacon] Update for linter changes	2024-08-30 22:54:19 +02:00
Deukhoofd	9c8a29fb91	Merge branch 'yt-dlp:master' into master	2024-08-30 22:52:52 +02:00
Deukhoofd	4cdd48a302	[ie/beacon] PR Review changes	2024-08-30 22:50:27 +02:00
Deukhoofd	e093a34462	Fix for linter changes	2024-06-01 10:19:51 +02:00
bashonly	5b9a30f258	Merge branch 'master' into master	2024-05-30 22:37:24 -05:00
Deukhoofd	ccd217057e	[ie/beacon] Fix regression where subtitle languages were not lowercased	2024-05-25 18:35:53 +02:00
Deukhoofd	6491712ede	[ie/beacon] Fix error if subtitle language is not set by Beacon	2024-05-25 18:26:48 +02:00
Deukhoofd	f1ab9a3d93	Fixes for several pages, support for subtitles	2024-05-10 18:40:46 +02:00
Deukhoofd	ef0542bbd6	[ie/beacon] Add extractor for Beacon.tv	2024-05-10 13:57:41 +02:00