[tele5] Playlist downloading

2025-03-10 04:56:10 +08:00 · 2020-04-12 13:22:20 +02:00 · 2020-04-12 13:22:20 +02:00 · cba6cb6986
commit cba6cb6986
parent 444a763e50
1 changed files with 27 additions and 3 deletions
--- a/youtube_dl/extractor/tele5.py
+++ b/youtube_dl/extractor/tele5.py
@ -12,7 +12,9 @@ from ..compat import (
 )
 from ..utils import (
    NO_DEFAULT,
    smuggle_url,
    try_get,
    unsmuggle_url,
 )
@ -48,9 +50,11 @@ class Tele5IE(InfoExtractor):
            'skip_download': True,
        },
    }, {
-        # TODO: 400 Bad Request error on webpage, remove this test? (they might fix it eventually)
+        'url': 'https://www.tele5.de/timeless/',
-        'url': 'https://www.tele5.de/video-clip/?ve_id=1609440',
+        'info_dict': {
-        'only_matching': True,
+            'title': 'Timeless',
        },
        'playlist_count': 6,
    }, {
        'url': 'https://www.tele5.de/filme/making-of/avengers-endgame/',
        'only_matching': True,
@ -60,6 +64,9 @@ class Tele5IE(InfoExtractor):
    }]
    def _real_extract(self, url):
        url, smuggled_data = unsmuggle_url(url, {})
        # TODO: do we really need this?
        qs = compat_urlparse.parse_qs(compat_urlparse.urlparse(url).query)
        video_id = (qs.get('vid') or qs.get('ve_id') or [None])[0]
@ -84,6 +91,23 @@ class Tele5IE(InfoExtractor):
            display_id = self._match_id(url)
            webpage = self._download_webpage(url, display_id)
            if not smuggled_data.get('force_singlevideo', False):
                # TODO: user now has to specify --no-playlist every time (bad)
                if not self._downloader.params.get('noplaylist'):
                    # TODO: use something other than a regex?
                    urls = re.findall('href="([^"]+)"\\s+class="special-video__link(?: video-teaser__link)?"', webpage, re.MULTILINE)
                    entries = []
                    for url in urls:
                        entries.append({
                            '_type': 'url_transparent',
                            'ie_key': 'Tele5',
                            'url': smuggle_url(
                                'https://tele5.de%s' % url,
                                {'force_singlevideo': True}),
                        })
                    title = self._html_search_regex("<h1>([^<]+)</h1>", webpage, 'playlist title')
                    return self.playlist_result(entries, playlist_title=title)
            def extract_id(pattern, name, default=NO_DEFAULT):
                return self._html_search_regex(
                    (r'id\s*=\s*["\']video-player["\'][^>]+data-id\s*=\s*["\'](%s)' % pattern,