From aab6f8439c96fb14ec62cbf72c55d0fc376abab8 Mon Sep 17 00:00:00 2001 From: Jakub Wilk Date: Thu, 11 Apr 2019 17:11:57 +0200 Subject: [PATCH 01/10] [tvn24] Strip ".html" suffix from video id --- youtube_dl/extractor/tvn24.py | 2 ++ 1 file changed, 2 insertions(+) diff --git a/youtube_dl/extractor/tvn24.py b/youtube_dl/extractor/tvn24.py index 6590e1fd0..acded1662 100644 --- a/youtube_dl/extractor/tvn24.py +++ b/youtube_dl/extractor/tvn24.py @@ -4,6 +4,7 @@ from __future__ import unicode_literals from .common import InfoExtractor from ..utils import ( int_or_none, + remove_end, unescapeHTML, ) @@ -36,6 +37,7 @@ class TVN24IE(InfoExtractor): def _real_extract(self, url): video_id = self._match_id(url) + video_id = remove_end(video_id, '.html') webpage = self._download_webpage(url, video_id) From f50d1c6a65b75af6341b698908ee5a3da7585d7b Mon Sep 17 00:00:00 2001 From: Jakub Wilk Date: Fri, 12 Apr 2019 13:53:03 +0200 Subject: [PATCH 02/10] [tvn24] Update description in test video --- youtube_dl/extractor/tvn24.py | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/youtube_dl/extractor/tvn24.py b/youtube_dl/extractor/tvn24.py index acded1662..71c61ac11 100644 --- a/youtube_dl/extractor/tvn24.py +++ b/youtube_dl/extractor/tvn24.py @@ -18,7 +18,7 @@ class TVN24IE(InfoExtractor): 'id': '1584444', 'ext': 'mp4', 'title': '"Święta mają być wesołe, dlatego, ludziska, wszyscy pod jemiołę"', - 'description': 'Wyjątkowe orędzie Artura Andrusa, jednego z gości "Szkła kontaktowego".', + 'description': 'Wyjątkowe orędzie Artura Andrusa, jednego z gości Szkła kontaktowego.', 'thumbnail': 're:https?://.*[.]jpeg', } }, { From 1e2483ac0f398187f867ff225888e92a1104cb28 Mon Sep 17 00:00:00 2001 From: Jakub Wilk Date: Wed, 17 Apr 2019 18:29:10 +0200 Subject: [PATCH 03/10] [tvn24] Extract all parts of Superwizjer videos --- youtube_dl/extractor/tvn24.py | 122 ++++++++++++++++++++++++---------- 1 file changed, 87 insertions(+), 35 deletions(-) diff --git a/youtube_dl/extractor/tvn24.py b/youtube_dl/extractor/tvn24.py index 71c61ac11..a984b9c31 100644 --- a/youtube_dl/extractor/tvn24.py +++ b/youtube_dl/extractor/tvn24.py @@ -1,6 +1,9 @@ # coding: utf-8 from __future__ import unicode_literals +import itertools +import re + from .common import InfoExtractor from ..utils import ( int_or_none, @@ -21,6 +24,22 @@ class TVN24IE(InfoExtractor): 'description': 'Wyjątkowe orędzie Artura Andrusa, jednego z gości Szkła kontaktowego.', 'thumbnail': 're:https?://.*[.]jpeg', } + }, { + 'url': 'https://www.tvn24.pl/superwizjer-w-tvn24,149,m/farma-trolli-zarabiaja-na-falszywych-informacjach-i-hejcie,923108.html', + 'md5': 'fbdec753d7bc29d96036808275f2130c', + 'info_dict': { + 'title': '"Ludzie to jest, jakby nie patrzeć, też pieniądz". Farmy trolli zarabiają na fake newsach i hejcie', + 'description': 'Ponad połowa Polaków wierzy w informacje, które znajduje w mediach społecznościowych. Ten fakt wykorzystują anonimowi twórcy tak zwanych fake newsów, czyli...', + }, + 'playlist_count': 4, + 'playlist': [{ + 'md5': '8b1001e576a81e22fbb605a9e5ca9d65', + 'info_dict': { + 'id': '1831060', + 'ext': 'mp4', + 'title': 'Farma trolli. Pierwsza część reportażu', + }, + }], }, { 'url': 'http://fakty.tvn24.pl/ogladaj-online,60/53-konferencja-bezpieczenstwa-w-monachium,716431.html', 'only_matching': True, @@ -36,46 +55,79 @@ class TVN24IE(InfoExtractor): }] def _real_extract(self, url): - video_id = self._match_id(url) - video_id = remove_end(video_id, '.html') + page_id = self._match_id(url) + page_id = remove_end(page_id, '.html') - webpage = self._download_webpage(url, video_id) + webpage = self._download_webpage(url, page_id) - title = self._og_search_title(webpage) + VIDEO_ELT_REGEX = r'(?P