From 2c88df8d543297daaf5126a8b1cb3ec62434de7b Mon Sep 17 00:00:00 2001
From: motophil <phil@rrr.de>
Date: Sun, 22 Jan 2017 18:07:08 +0100
Subject: [PATCH] [gaskrank] Add new extractor - more requested fixes

---
 youtube_dl/extractor/gaskrank.py | 22 ++++++++++++----------
 1 file changed, 12 insertions(+), 10 deletions(-)
diff --git a/youtube_dl/extractor/gaskrank.py b/youtube_dl/extractor/gaskrank.py
index 3fcd56ca0..aa99f8dd0 100644
--- a/youtube_dl/extractor/gaskrank.py
+++ b/youtube_dl/extractor/gaskrank.py
@@ -7,7 +7,7 @@ from ..utils import js_to_json
 
 
 class GaskrankIE(InfoExtractor):
-    _VALID_URL = r'https?://(?:www\.)?gaskrank\.tv/tv(?:/[^/]+)+/(?P<id>[^/]+)\.htm'
+    _VALID_URL = r'https?://(?:www\.)?gaskrank\.tv/tv/(?P<categories>[^/]+)/(?P<id>[^/]+)\.html?'
     _TEST = {
         'url': 'http://www.gaskrank.tv/tv/motorrad-fun/strike-einparken-durch-anfaenger-crash-mit-groesserem-flurschaden.htm',
         'md5': '1ae88dbac97887d85ebd1157a95fc4f9',
@@ -16,6 +16,8 @@ class GaskrankIE(InfoExtractor):
             'ext': 'mp4',
             'title': 'Strike! Einparken können nur Männer - Flurschaden hält sich in Grenzen *lol*',
             'thumbnail': r're:^https?://.*\.jpg$',
+            'categories': ['motorrad-fun'],
+            'display_id': 'strike-einparken-durch-anfaenger-crash-mit-groesserem-flurschaden',
         }
     }
 
@@ -25,20 +27,20 @@ class GaskrankIE(InfoExtractor):
 
         display_id = self._match_id(url)
         webpage = self._download_webpage(url, display_id)
-        video_id = self._search_regex(r'https?://movies\.gaskrank\.tv/([^-]*?)\.mp4', webpage, 'video id')
-        categories = self._search_regex(r'https?://(?:www\.)?gaskrank\.tv/tv(?:/([^/]+))+/[^/]+\.htm', url, 'categories', default=None)
-        title = self._search_regex(r'movieName[^\']*?\'([^\']*?)\'', webpage, 'title')
-        thumbnail = self._search_regex(r'poster[^\']*?\'([^\']*?)\'', webpage, 'thumbnail', default=None)
+        categories = [re.match(self._VALID_URL, url).group('categories')]
+        title = self._search_regex(r'movieName\s*:\s*\'([^\']*)\'', webpage, 'title')
+        thumbnail = self._search_regex(r'poster\s*:\s*\'([^\']*)\'', webpage, 'thumbnail', default=None)
         playlist = self._parse_json(
-            self._search_regex(r'playlist:[\s\S]*?\[([\s\S]*?)]', webpage, 'playlist', default='{}'),
-            video_id, transform_source=fix_json, fatal=False)
+            self._search_regex(r'playlist\s*:\s*\[([^\]]*)\]', webpage, 'playlist', default='{}'),
+            display_id, transform_source=fix_json, fatal=False)
+        video_id = self._search_regex(r'https?://movies\.gaskrank\.tv/([^-]*?)(-[^\.]*)?\.mp4', playlist.get('0').get('src'), 'video id')
         formats = []
-        for key in sorted(playlist):
+        for key in playlist:
             formats.append({
                 'url': playlist[key]['src'],
                 'format_id': key,
-                'quality': playlist[key].get('quality'),
-                'resolution': playlist[key].get('quality')})
+                'quality': playlist[key].get('quality')})
+        self._sort_formats(formats, field_preference=['format_id'])
 
         return {
             'id': video_id,