l1ving_youtube-dl/youtube_dl/extractor/rtvs.py

# coding: utf-8
from __future__ import unicode_literals

from .common import InfoExtractor


class RTVSTVIE(InfoExtractor):
    _VALID_URL = r'https?://(?:www\.)?rtvs\.sk/(?:televizia)/archiv/\d+/(?P<id>\d+)'
    _TEST = {
        'url': 'http://www.rtvs.sk/televizia/archiv/8249/63118',
        'md5': '85e2c55cf988403b70cac24f5c086dc6',
        'info_dict': {
            'id': '17189',
            'ext': 'mp4',
            'title': 'Amaro Džives - Náš deň',
            'description': 'Galavečer pri príležitosti Medzinárodného dňa Rómov.'
        },
        'params': {
            'skip_download': True,
        }
    }

    def _real_extract(self, url):
        video_id = self._match_id(url)

        webpage = self._download_webpage(url, video_id)

        playlist_url = self._search_regex(
            r'url = (["\'])(?:https?:)?(?://)(?P<url>(?:(?!\1).)+)\1', webpage,
            'playlist url', group='url')

        if not playlist_url.startswith("http"):
            playlist_url = "http://" + playlist_url

        data = self._download_json(
            playlist_url, video_id, 'Downloading playlist')

        data_media = data['clip']

        media_id = data_media['mediaid']
        title = data_media['title']
        description = data_media.get('description')
        thumbnail = data_media.get('image')
        urldl = data_media['sources'][0]['src']

        formats = self._extract_m3u8_formats(
            urldl, video_id, 'mp4',
            entry_protocol='m3u8_native', m3u8_id='hls')

        return {
            'id': media_id,
            'title': title,
            'description': description,
            'thumbnail': thumbnail,
            'formats': formats
        }


class RTVSRADIOIE(InfoExtractor):
    _VALID_URL = r'https?://(?:www\.)?rtvs\.sk/(?:radio)/archiv/\d+/(?P<id>\d+)'
    _TEST = {
        'url': 'http://www.rtvs.sk/radio/archiv/11224/414872',
        'md5': '134d5d6debdeddf8a5d761cbc9edacb8',
        'info_dict': {
            'id': '135320',
            'ext': 'mp3',
            'title': 'Ostrov pokladov 1 časť.mp3'
        },
        'params': {
            'skip_download': True,
        }
    }

    def _real_extract(self, url):
        video_id = self._match_id(url)

        webpage = self._download_webpage(url, video_id)

        playlist_url = self._search_regex(
            r'url = (["\'])(?:https?:)?(?://)(?P<url>(?:(?!\1).)+)\1', webpage,
            'playlist url', group='url')

        if not playlist_url.startswith("http"):
            playlist_url = "http://" + playlist_url

        data = self._download_json(
            playlist_url, video_id, 'Downloading playlist')

        data_media = data['playlist'][0]

        media_id = data_media['mediaid']
        title = data_media['title']
        description = data_media.get('description')
        thumbnail = data_media.get('image')
        urldl = data_media['sources'][0]['src']

        return {
            'id': media_id,
            'title': title,
            'description': description,
            'thumbnail': thumbnail,
            'url': urldl
        }
[rtvs] Add extractor (closes #9242, closes #15187) 2018-01-21 17:40:00 +07:00			`# coding: utf-8`
			`from __future__ import unicode_literals`

			`from .common import InfoExtractor`


Separates tv and radio in 2 classes 2019-07-07 23:04:09 +02:00			`class RTVSTVIE(InfoExtractor):`
			`_VALID_URL = r'https?://(?:www\.)?rtvs\.sk/(?:televizia)/archiv/\d+/(?P<id>\d+)'`
			`_TEST = {`
[rtvs] Add extractor (closes #9242, closes #15187) 2018-01-21 17:40:00 +07:00			`'url': 'http://www.rtvs.sk/televizia/archiv/8249/63118',`
			`'md5': '85e2c55cf988403b70cac24f5c086dc6',`
			`'info_dict': {`
[rtvs] Fixed extractor 2019-06-29 19:10:17 +02:00			`'id': '17189',`
[rtvs] Add extractor (closes #9242, closes #15187) 2018-01-21 17:40:00 +07:00			`'ext': 'mp4',`
			`'title': 'Amaro Džives - Náš deň',`
			`'description': 'Galavečer pri príležitosti Medzinárodného dňa Rómov.'`
			`},`
			`'params': {`
			`'skip_download': True,`
			`}`
Separates tv and radio in 2 classes 2019-07-07 23:04:09 +02:00			`}`
[rtvs] Add extractor (closes #9242, closes #15187) 2018-01-21 17:40:00 +07:00
			`def _real_extract(self, url):`
			`video_id = self._match_id(url)`

			`webpage = self._download_webpage(url, video_id)`

			`playlist_url = self._search_regex(`
[rtvs] Fixed extractor 2019-06-29 19:10:17 +02:00			`r'url = (["\'])(?:https?:)?(?://)(?P<url>(?:(?!\1).)+)\1', webpage,`
[rtvs] Add extractor (closes #9242, closes #15187) 2018-01-21 17:40:00 +07:00			`'playlist url', group='url')`

[rtvs] Fixed extractor 2019-06-29 19:10:17 +02:00			`if not playlist_url.startswith("http"):`
			`playlist_url = "http://" + playlist_url`

[rtvs] Add extractor (closes #9242, closes #15187) 2018-01-21 17:40:00 +07:00			`data = self._download_json(`
[rtvs] Fixed extractor 2019-06-29 19:10:17 +02:00			`playlist_url, video_id, 'Downloading playlist')`

Separates tv and radio in 2 classes 2019-07-07 23:04:09 +02:00			`data_media = data['clip']`
[rtvs] Fixed extractor 2019-06-29 19:10:17 +02:00
			`media_id = data_media['mediaid']`
			`title = data_media['title']`
			`description = data_media.get('description')`
			`thumbnail = data_media.get('image')`
Separates tv and radio in 2 classes 2019-07-07 23:04:09 +02:00			`urldl = data_media['sources'][0]['src']`

			`formats = self._extract_m3u8_formats(`
			`urldl, video_id, 'mp4',`
			`entry_protocol='m3u8_native', m3u8_id='hls')`
[rtvs] Fixed extractor 2019-06-29 19:10:17 +02:00
Separates tv and radio in 2 classes 2019-07-07 23:04:09 +02:00			`return {`
[rtvs] Fixed extractor 2019-06-29 19:10:17 +02:00			`'id': media_id,`
			`'title': title,`
			`'description': description,`
			`'thumbnail': thumbnail,`
Separates tv and radio in 2 classes 2019-07-07 23:04:09 +02:00			`'formats': formats`
[rtvs] Fixed extractor 2019-06-29 19:10:17 +02:00			`}`


Separates tv and radio in 2 classes 2019-07-07 23:04:09 +02:00			`class RTVSRADIOIE(InfoExtractor):`
			`_VALID_URL = r'https?://(?:www\.)?rtvs\.sk/(?:radio)/archiv/\d+/(?P<id>\d+)'`
			`_TEST = {`
			`'url': 'http://www.rtvs.sk/radio/archiv/11224/414872',`
			`'md5': '134d5d6debdeddf8a5d761cbc9edacb8',`
			`'info_dict': {`
			`'id': '135320',`
			`'ext': 'mp3',`
			`'title': 'Ostrov pokladov 1 časť.mp3'`
			`},`
			`'params': {`
			`'skip_download': True,`
			`}`
			`}`

			`def _real_extract(self, url):`
			`video_id = self._match_id(url)`
[rtvs] Fixed extractor 2019-06-29 19:10:17 +02:00
Separates tv and radio in 2 classes 2019-07-07 23:04:09 +02:00			`webpage = self._download_webpage(url, video_id)`

			`playlist_url = self._search_regex(`
			`r'url = (["\'])(?:https?:)?(?://)(?P<url>(?:(?!\1).)+)\1', webpage,`
			`'playlist url', group='url')`

			`if not playlist_url.startswith("http"):`
			`playlist_url = "http://" + playlist_url`

			`data = self._download_json(`
			`playlist_url, video_id, 'Downloading playlist')`

			`data_media = data['playlist'][0]`

			`media_id = data_media['mediaid']`
			`title = data_media['title']`
			`description = data_media.get('description')`
			`thumbnail = data_media.get('image')`
			`urldl = data_media['sources'][0]['src']`

			`return {`
			`'id': media_id,`
			`'title': title,`
			`'description': description,`
			`'thumbnail': thumbnail,`
			`'url': urldl`
			`}`