yt-dlp/yt_dlp/extractor/ivi.py

import json
import re

from .common import InfoExtractor
from ..dependencies import Cryptodome
from ..utils import ExtractorError, int_or_none, qualities


class IviIE(InfoExtractor):
    IE_DESC = 'ivi.ru'
    IE_NAME = 'ivi'
    _VALID_URL = r'https?://(?:www\.)?ivi\.(?:ru|tv)/(?:watch/(?:[^/]+/)?|video/player\?.*?videoId=)(?P<id>\d+)'
    _EMBED_REGEX = [r'<embed[^>]+?src=(["\'])(?P<url>https?://(?:www\.)?ivi\.ru/video/player.+?)\1']
    _GEO_BYPASS = False
    _GEO_COUNTRIES = ['RU']
    _LIGHT_KEY = b'\xf1\x02\x32\xb7\xbc\x5c\x7a\xe8\xf7\x96\xc1\x33\x2b\x27\xa1\x8c'
    _LIGHT_URL = 'https://api.ivi.ru/light/'

    _TESTS = [
        # Single movie
        {
            'url': 'http://www.ivi.ru/watch/53141',
            'md5': '6ff5be2254e796ed346251d117196cf4',
            'info_dict': {
                'id': '53141',
                'ext': 'mp4',
                'title': 'Иван Васильевич меняет профессию',
                'description': 'md5:b924063ea1677c8fe343d8a72ac2195f',
                'duration': 5498,
                'thumbnail': r're:^https?://.*\.jpg$',
            },
            'skip': 'Only works from Russia',
        },
        # Serial's series
        {
            'url': 'http://www.ivi.ru/watch/dvoe_iz_lartsa/9549',
            'md5': '221f56b35e3ed815fde2df71032f4b3e',
            'info_dict': {
                'id': '9549',
                'ext': 'mp4',
                'title': 'Двое из ларца - Дело Гольдберга (1 часть)',
                'series': 'Двое из ларца',
                'season': 'Сезон 1',
                'season_number': 1,
                'episode': 'Дело Гольдберга (1 часть)',
                'episode_number': 1,
                'duration': 2655,
                'thumbnail': r're:^https?://.*\.jpg$',
            },
            'skip': 'Only works from Russia',
        },
        {
            # with MP4-HD720 format
            'url': 'http://www.ivi.ru/watch/146500',
            'md5': 'd63d35cdbfa1ea61a5eafec7cc523e1e',
            'info_dict': {
                'id': '146500',
                'ext': 'mp4',
                'title': 'Кукла',
                'description': 'md5:ffca9372399976a2d260a407cc74cce6',
                'duration': 5599,
                'thumbnail': r're:^https?://.*\.jpg$',
            },
            'skip': 'Only works from Russia',
        },
        {
            'url': 'https://www.ivi.tv/watch/33560/',
            'only_matching': True,
        },
    ]

    # Sorted by quality
    _KNOWN_FORMATS = (
        'MP4-low-mobile', 'MP4-mobile', 'FLV-lo', 'MP4-lo', 'FLV-hi', 'MP4-hi',
        'MP4-SHQ', 'MP4-HD720', 'MP4-HD1080')

    def _real_extract(self, url):
        video_id = self._match_id(url)

        data = json.dumps({
            'method': 'da.content.get',
            'params': [
                video_id, {
                    'site': 's%d',
                    'referrer': 'http://www.ivi.ru/watch/%s' % video_id,
                    'contentid': video_id
                }
            ]
        })

        for site in (353, 183):
            content_data = (data % site).encode()
            if site == 353:
                if not Cryptodome.CMAC:
                    continue

                timestamp = (self._download_json(
                    self._LIGHT_URL, video_id,
                    'Downloading timestamp JSON', data=json.dumps({
                        'method': 'da.timestamp.get',
                        'params': []
                    }).encode(), fatal=False) or {}).get('result')
                if not timestamp:
                    continue

                query = {
                    'ts': timestamp,
                    'sign': Cryptodome.CMAC.new(self._LIGHT_KEY, timestamp.encode() + content_data,
                                                Cryptodome.Blowfish).hexdigest(),
                }
            else:
                query = {}

            video_json = self._download_json(
                self._LIGHT_URL, video_id,
                'Downloading video JSON', data=content_data, query=query)

            error = video_json.get('error')
            if error:
                origin = error.get('origin')
                message = error.get('message') or error.get('user_message')
                extractor_msg = 'Unable to download video %s'
                if origin == 'NotAllowedForLocation':
                    self.raise_geo_restricted(message, self._GEO_COUNTRIES)
                elif origin == 'NoRedisValidData':
                    extractor_msg = 'Video %s does not exist'
                elif site == 353:
                    continue
                elif not Cryptodome.CMAC:
                    raise ExtractorError('pycryptodomex not found. Please install', expected=True)
                elif message:
                    extractor_msg += ': ' + message
                raise ExtractorError(extractor_msg % video_id, expected=True)
            else:
                break

        result = video_json['result']
        title = result['title']

        quality = qualities(self._KNOWN_FORMATS)

        formats = []
        for f in result.get('files', []):
            f_url = f.get('url')
            content_format = f.get('content_format')
            if not f_url:
                continue
            if (not self.get_param('allow_unplayable_formats')
                    and ('-MDRM-' in content_format or '-FPS-' in content_format)):
                continue
            formats.append({
                'url': f_url,
                'format_id': content_format,
                'quality': quality(content_format),
                'filesize': int_or_none(f.get('size_in_bytes')),
            })

        compilation = result.get('compilation')
        episode = title if compilation else None

        title = '%s - %s' % (compilation, title) if compilation is not None else title

        thumbnails = [{
            'url': preview['url'],
            'id': preview.get('content_format'),
        } for preview in result.get('preview', []) if preview.get('url')]

        webpage = self._download_webpage(url, video_id)

        season = self._search_regex(
            r'<li[^>]+class="season active"[^>]*><a[^>]+>([^<]+)',
            webpage, 'season', default=None)
        season_number = int_or_none(self._search_regex(
            r'<li[^>]+class="season active"[^>]*><a[^>]+data-season(?:-index)?="(\d+)"',
            webpage, 'season number', default=None))

        episode_number = int_or_none(self._search_regex(
            r'[^>]+itemprop="episode"[^>]*>\s*<meta[^>]+itemprop="episodeNumber"[^>]+content="(\d+)',
            webpage, 'episode number', default=None))

        description = self._og_search_description(webpage, default=None) or self._html_search_meta(
            'description', webpage, 'description', default=None)

        return {
            'id': video_id,
            'title': title,
            'series': compilation,
            'season': season,
            'season_number': season_number,
            'episode': episode,
            'episode_number': episode_number,
            'thumbnails': thumbnails,
            'description': description,
            'duration': int_or_none(result.get('duration')),
            'formats': formats,
        }


class IviCompilationIE(InfoExtractor):
    IE_DESC = 'ivi.ru compilations'
    IE_NAME = 'ivi:compilation'
    _VALID_URL = r'https?://(?:www\.)?ivi\.ru/watch/(?!\d+)(?P<compilationid>[a-z\d_-]+)(?:/season(?P<seasonid>\d+))?$'
    _TESTS = [{
        'url': 'http://www.ivi.ru/watch/dvoe_iz_lartsa',
        'info_dict': {
            'id': 'dvoe_iz_lartsa',
            'title': 'Двое из ларца (2006 - 2008)',
        },
        'playlist_mincount': 24,
    }, {
        'url': 'http://www.ivi.ru/watch/dvoe_iz_lartsa/season1',
        'info_dict': {
            'id': 'dvoe_iz_lartsa/season1',
            'title': 'Двое из ларца (2006 - 2008) 1 сезон',
        },
        'playlist_mincount': 12,
    }]

    def _extract_entries(self, html, compilation_id):
        return [
            self.url_result(
                'http://www.ivi.ru/watch/%s/%s' % (compilation_id, serie), IviIE.ie_key())
            for serie in re.findall(
                r'<a\b[^>]+\bhref=["\']/watch/%s/(\d+)["\']' % compilation_id, html)]

    def _real_extract(self, url):
        mobj = self._match_valid_url(url)
        compilation_id = mobj.group('compilationid')
        season_id = mobj.group('seasonid')

        if season_id is not None:  # Season link
            season_page = self._download_webpage(
                url, compilation_id, 'Downloading season %s web page' % season_id)
            playlist_id = '%s/season%s' % (compilation_id, season_id)
            playlist_title = self._html_search_meta('title', season_page, 'title')
            entries = self._extract_entries(season_page, compilation_id)
        else:  # Compilation link
            compilation_page = self._download_webpage(url, compilation_id, 'Downloading compilation web page')
            playlist_id = compilation_id
            playlist_title = self._html_search_meta('title', compilation_page, 'title')
            seasons = re.findall(
                r'<a href="/watch/%s/season(\d+)' % compilation_id, compilation_page)
            if not seasons:  # No seasons in this compilation
                entries = self._extract_entries(compilation_page, compilation_id)
            else:
                entries = []
                for season_id in seasons:
                    season_page = self._download_webpage(
                        'http://www.ivi.ru/watch/%s/season%s' % (compilation_id, season_id),
                        compilation_id, 'Downloading season %s web page' % season_id)
                    entries.extend(self._extract_entries(season_page, compilation_id))

        return self.playlist_result(entries, playlist_id, playlist_title)
[ivi] Add support for ivi.ru 2013-12-18 22:28:16 +00:00			`import json`
[ivi] Skip s353 for bundled exe See https://github.com/Legrandin/pycryptodome/issues/228 2019-11-21 18:10:24 +00:00			`import re`
[ivi] Add support for ivi.ru 2013-12-18 22:28:16 +00:00
			`from .common import InfoExtractor`
[dependencies] Standardize `Cryptodome` imports 2023-02-06 21:52:29 +00:00			`from ..dependencies import Cryptodome`
			`from ..utils import ExtractorError, int_or_none, qualities`
[ivi] Add support for ivi.ru 2013-12-18 22:28:16 +00:00

			`class IviIE(InfoExtractor):`
[ivi] Fix test and use unicode literals 2014-01-28 19:20:48 +00:00			`IE_DESC = 'ivi.ru'`
			`IE_NAME = 'ivi'`
[ivi] Add support for ivi.tv 2018-10-28 15:49:10 +00:00			`_VALID_URL = r'https?://(?:www\.)?ivi\.(?:ru\|tv)/(?:watch/(?:[^/]+/)?\|video/player\?.*?videoId=)(?P<id>\d+)'`
[extractors] Use new framework for existing embeds (#4307) `Brightcove` is difficult to migrate because it's subclasses may depend on the signature of the current functions. So it is left as-is for now Note: Tests have not been migrated 2022-08-01 01:23:25 +00:00			`_EMBED_REGEX = [r'<embed[^>]+?src=(["\'])(?P<url>https?://(?:www\.)?ivi\.ru/video/player.+?)\1']`
[ivi] Raise GeoRestrictedError 2017-02-24 03:52:41 +00:00			`_GEO_BYPASS = False`
			`_GEO_COUNTRIES = ['RU']`
[ivi] fix format extraction(closes #21991) 2019-11-15 20:17:47 +00:00			`_LIGHT_KEY = b'\xf1\x02\x32\xb7\xbc\x5c\x7a\xe8\xf7\x96\xc1\x33\x2b\x27\xa1\x8c'`
			`_LIGHT_URL = 'https://api.ivi.ru/light/'`
[ivi] Add support for ivi.ru 2013-12-18 22:28:16 +00:00
			`_TESTS = [`
			`# Single movie`
			`{`
[ivi] Fix test and use unicode literals 2014-01-28 19:20:48 +00:00			`'url': 'http://www.ivi.ru/watch/53141',`
			`'md5': '6ff5be2254e796ed346251d117196cf4',`
			`'info_dict': {`
[ivi] Simplify 2014-02-07 12:36:50 +00:00			`'id': '53141',`
			`'ext': 'mp4',`
[ivi] Fix test and use unicode literals 2014-01-28 19:20:48 +00:00			`'title': 'Иван Васильевич меняет профессию',`
			`'description': 'md5:b924063ea1677c8fe343d8a72ac2195f',`
			`'duration': 5498,`
Fix "invalid escape sequences" error on Python 3.6 2017-01-02 12:08:07 +00:00			`'thumbnail': r're:^https?://.*\.jpg$',`
[ivi] Add support for ivi.ru 2013-12-18 22:28:16 +00:00			`},`
[ivi] Fix test and use unicode literals 2014-01-28 19:20:48 +00:00			`'skip': 'Only works from Russia',`
[ivi] Add support for ivi.ru 2013-12-18 22:28:16 +00:00			`},`
Fix typos Closes #8200. 2016-01-10 15:17:47 +00:00			`# Serial's series`
[ivi] Add support for ivi.ru 2013-12-18 22:28:16 +00:00			`{`
[ivi] Replace tests 2014-05-30 12:12:55 +00:00			`'url': 'http://www.ivi.ru/watch/dvoe_iz_lartsa/9549',`
			`'md5': '221f56b35e3ed815fde2df71032f4b3e',`
[ivi] Fix test and use unicode literals 2014-01-28 19:20:48 +00:00			`'info_dict': {`
[ivi] Replace tests 2014-05-30 12:12:55 +00:00			`'id': '9549',`
[ivi] Simplify 2014-02-07 12:36:50 +00:00			`'ext': 'mp4',`
[ivi] Fix extraction and modernize 2016-01-03 21:34:15 +00:00			`'title': 'Двое из ларца - Дело Гольдберга (1 часть)',`
			`'series': 'Двое из ларца',`
[ivi] Extract season info 2016-01-03 21:54:52 +00:00			`'season': 'Сезон 1',`
			`'season_number': 1,`
[ivi] Fix extraction and modernize 2016-01-03 21:34:15 +00:00			`'episode': 'Дело Гольдберга (1 часть)',`
			`'episode_number': 1,`
[ivi] Replace tests 2014-05-30 12:12:55 +00:00			`'duration': 2655,`
Fix "invalid escape sequences" error on Python 3.6 2017-01-02 12:08:07 +00:00			`'thumbnail': r're:^https?://.*\.jpg$',`
[ivi] Add support for ivi.ru 2013-12-18 22:28:16 +00:00			`},`
[ivi] Fix test and use unicode literals 2014-01-28 19:20:48 +00:00			`'skip': 'Only works from Russia',`
[ivi] Add support for 720p and 1080p 2016-08-21 20:31:33 +00:00			`},`
			`{`
			`# with MP4-HD720 format`
			`'url': 'http://www.ivi.ru/watch/146500',`
			`'md5': 'd63d35cdbfa1ea61a5eafec7cc523e1e',`
			`'info_dict': {`
			`'id': '146500',`
			`'ext': 'mp4',`
			`'title': 'Кукла',`
			`'description': 'md5:ffca9372399976a2d260a407cc74cce6',`
			`'duration': 5599,`
Fix "invalid escape sequences" error on Python 3.6 2017-01-02 12:08:07 +00:00			`'thumbnail': r're:^https?://.*\.jpg$',`
[ivi] Add support for 720p and 1080p 2016-08-21 20:31:33 +00:00			`},`
			`'skip': 'Only works from Russia',`
[ivi] Add support for ivi.tv 2018-10-28 15:49:10 +00:00			`},`
			`{`
			`'url': 'https://www.ivi.tv/watch/33560/',`
			`'only_matching': True,`
			`},`
[ivi] Add support for ivi.ru 2013-12-18 22:28:16 +00:00			`]`
[ivi] Fix test and use unicode literals 2014-01-28 19:20:48 +00:00
[ivi] Add support for ivi.ru 2013-12-18 22:28:16 +00:00			`# Sorted by quality`
[ivi] Add support for 720p and 1080p 2016-08-21 20:31:33 +00:00			`_KNOWN_FORMATS = (`
			`'MP4-low-mobile', 'MP4-mobile', 'FLV-lo', 'MP4-lo', 'FLV-hi', 'MP4-hi',`
			`'MP4-SHQ', 'MP4-HD720', 'MP4-HD1080')`
[ivi] Add support for ivi.ru 2013-12-18 22:28:16 +00:00
			`def _real_extract(self, url):`
[ivi] Modernize 2015-01-28 17:58:14 +00:00			`video_id = self._match_id(url)`
[ivi] Add support for ivi.ru 2013-12-18 22:28:16 +00:00
[ivi] fix format extraction(closes #21991) 2019-11-15 20:17:47 +00:00			`data = json.dumps({`
[ivi] Modernize 2015-01-28 17:58:14 +00:00			`'method': 'da.content.get',`
			`'params': [`
			`video_id, {`
[ivi] sign content request only when pycryptodome is available 2019-11-15 22:46:31 +00:00			`'site': 's%d',`
[ivi] Modernize 2015-01-28 17:58:14 +00:00			`'referrer': 'http://www.ivi.ru/watch/%s' % video_id,`
			`'contentid': video_id`
[ivi] Add support for ivi.ru 2013-12-18 22:28:16 +00:00			`}`
[ivi] Modernize 2015-01-28 17:58:14 +00:00			`]`
[ivi] Fix python 3.4 support 2019-11-21 16:38:39 +00:00			`})`
[ivi] Add support for ivi.ru 2013-12-18 22:28:16 +00:00
[ivi] fallback to old extraction method for unknown error codes 2019-11-19 19:16:31 +00:00			`for site in (353, 183):`
[ivi] Fix python 3.4 support 2019-11-21 16:38:39 +00:00			`content_data = (data % site).encode()`
[ivi] fallback to old extraction method for unknown error codes 2019-11-19 19:16:31 +00:00			`if site == 353:`
[dependencies] Simplify `Cryptodome` Closes #6292, closes #6272, closes #6338 2023-02-28 17:40:54 +00:00			`if not Cryptodome.CMAC:`
[dependencies] Standardize `Cryptodome` imports 2023-02-06 21:52:29 +00:00			`continue`
[ivi] fallback to old extraction method for unknown error codes 2019-11-19 19:16:31 +00:00
			`timestamp = (self._download_json(`
			`self._LIGHT_URL, video_id,`
			`'Downloading timestamp JSON', data=json.dumps({`
			`'method': 'da.timestamp.get',`
			`'params': []`
			`}).encode(), fatal=False) or {}).get('result')`
			`if not timestamp:`
			`continue`

			`query = {`
			`'ts': timestamp,`
[dependencies] Simplify `Cryptodome` Closes #6292, closes #6272, closes #6338 2023-02-28 17:40:54 +00:00			`'sign': Cryptodome.CMAC.new(self._LIGHT_KEY, timestamp.encode() + content_data,`
			`Cryptodome.Blowfish).hexdigest(),`
[ivi] fallback to old extraction method for unknown error codes 2019-11-19 19:16:31 +00:00			`}`
			`else:`
			`query = {}`
[ivi] sign content request only when pycryptodome is available 2019-11-15 22:46:31 +00:00
[ivi] fallback to old extraction method for unknown error codes 2019-11-19 19:16:31 +00:00			`video_json = self._download_json(`
[ivi] sign content request only when pycryptodome is available 2019-11-15 22:46:31 +00:00			`self._LIGHT_URL, video_id,`
[ivi] fallback to old extraction method for unknown error codes 2019-11-19 19:16:31 +00:00			`'Downloading video JSON', data=content_data, query=query)`

			`error = video_json.get('error')`
			`if error:`
			`origin = error.get('origin')`
			`message = error.get('message') or error.get('user_message')`
			`extractor_msg = 'Unable to download video %s'`
			`if origin == 'NotAllowedForLocation':`
			`self.raise_geo_restricted(message, self._GEO_COUNTRIES)`
			`elif origin == 'NoRedisValidData':`
			`extractor_msg = 'Video %s does not exist'`
			`elif site == 353:`
			`continue`
[dependencies] Simplify `Cryptodome` Closes #6292, closes #6272, closes #6338 2023-02-28 17:40:54 +00:00			`elif not Cryptodome.CMAC:`
[docs,build] Change all pycryptodome references to pycryptodomex 2021-10-06 01:04:10 +00:00			`raise ExtractorError('pycryptodomex not found. Please install', expected=True)`
[ivi] fallback to old extraction method for unknown error codes 2019-11-19 19:16:31 +00:00			`elif message:`
			`extractor_msg += ': ' + message`
			`raise ExtractorError(extractor_msg % video_id, expected=True)`
			`else:`
			`break`
[ivi] Add support for ivi.ru 2013-12-18 22:28:16 +00:00
[ivi] Fix test and use unicode literals 2014-01-28 19:20:48 +00:00			`result = video_json['result']`
[ivi] fix format extraction(closes #21991) 2019-11-15 20:17:47 +00:00			`title = result['title']`
[ivi] Add support for ivi.ru 2013-12-18 22:28:16 +00:00
[ivi] Add support for 720p and 1080p 2016-08-21 20:31:33 +00:00			`quality = qualities(self._KNOWN_FORMATS)`

[ivi] fix format extraction(closes #21991) 2019-11-15 20:17:47 +00:00			`formats = []`
			`for f in result.get('files', []):`
			`f_url = f.get('url')`
			`content_format = f.get('content_format')`
Cleanup some code and fix typos :ci skip dl 2021-02-12 04:34:04 +00:00			`if not f_url:`
			`continue`
[extractor] Add `write_debug` and `get_param` 2021-05-17 12:23:08 +00:00			`if (not self.get_param('allow_unplayable_formats')`
Cleanup some code and fix typos :ci skip dl 2021-02-12 04:34:04 +00:00			`and ('-MDRM-' in content_format or '-FPS-' in content_format)):`
[ivi] fix format extraction(closes #21991) 2019-11-15 20:17:47 +00:00			`continue`
			`formats.append({`
			`'url': f_url,`
			`'format_id': content_format,`
			`'quality': quality(content_format),`
			`'filesize': int_or_none(f.get('size_in_bytes')),`
			`})`
[ivi] Use centralized format sorting 2013-12-26 17:40:09 +00:00
[ivi] Fix extraction and modernize 2016-01-03 21:34:15 +00:00			`compilation = result.get('compilation')`
			`episode = title if compilation else None`

PEP8 applied 2014-11-23 19:41:03 +00:00			`title = '%s - %s' % (compilation, title) if compilation is not None else title`
[ivi] Add support for ivi.ru 2013-12-18 22:28:16 +00:00
[ivi] Fix extraction and modernize 2016-01-03 21:34:15 +00:00			`thumbnails = [{`
			`'url': preview['url'],`
			`'id': preview.get('content_format'),`
			`} for preview in result.get('preview', []) if preview.get('url')]`

			`webpage = self._download_webpage(url, video_id)`

[ivi] Extract season info 2016-01-03 21:54:52 +00:00			`season = self._search_regex(`
			`r'<li[^>]+class="season active"[^>]*><a[^>]+>([^<]+)',`
			`webpage, 'season', default=None)`
			`season_number = int_or_none(self._search_regex(`
			`r'<li[^>]+class="season active"[^>]*><a[^>]+data-season(?:-index)?="(\d+)"',`
			`webpage, 'season number', default=None))`

[ivi] Fix extraction and modernize 2016-01-03 21:34:15 +00:00			`episode_number = int_or_none(self._search_regex(`
[ivi] Fix episode number extraction 2016-08-21 20:34:27 +00:00			`r'[^>]+itemprop="episode"[^>]>\s<meta[^>]+itemprop="episodeNumber"[^>]+content="(\d+)',`
[ivi] Fix extraction and modernize 2016-01-03 21:34:15 +00:00			`webpage, 'episode number', default=None))`
[ivi] Add support for ivi.ru 2013-12-18 22:28:16 +00:00
[ivi] Fix extraction and modernize 2016-01-03 21:34:15 +00:00			`description = self._og_search_description(webpage, default=None) or self._html_search_meta(`
			`'description', webpage, 'description', default=None)`
[ivi] Add support for ivi.ru 2013-12-18 22:28:16 +00:00
			`return {`
			`'id': video_id,`
			`'title': title,`
[ivi] Fix extraction and modernize 2016-01-03 21:34:15 +00:00			`'series': compilation,`
[ivi] Extract season info 2016-01-03 21:54:52 +00:00			`'season': season,`
			`'season_number': season_number,`
[ivi] Fix extraction and modernize 2016-01-03 21:34:15 +00:00			`'episode': episode,`
			`'episode_number': episode_number,`
			`'thumbnails': thumbnails,`
[ivi] Add support for ivi.ru 2013-12-18 22:28:16 +00:00			`'description': description,`
[ivi] fix format extraction(closes #21991) 2019-11-15 20:17:47 +00:00			`'duration': int_or_none(result.get('duration')),`
[ivi] Add support for ivi.ru 2013-12-18 22:28:16 +00:00			`'formats': formats,`
			`}`


			`class IviCompilationIE(InfoExtractor):`
[ivi] Fix test and use unicode literals 2014-01-28 19:20:48 +00:00			`IE_DESC = 'ivi.ru compilations'`
			`IE_NAME = 'ivi:compilation'`
[ivi] Simplify 2014-02-07 12:36:50 +00:00			`_VALID_URL = r'https?://(?:www\.)?ivi\.ru/watch/(?!\d+)(?P<compilationid>[a-z\d_-]+)(?:/season(?P<seasonid>\d+))?$'`
Move playlist tests to extractors. From now on, test_download will run these tests. That means we benefit not only from the networking setup in there, but also from the other tests (for example test_all_urls to find problems with _VALID_URLs). 2014-08-27 22:58:24 +00:00			`_TESTS = [{`
			`'url': 'http://www.ivi.ru/watch/dvoe_iz_lartsa',`
			`'info_dict': {`
			`'id': 'dvoe_iz_lartsa',`
			`'title': 'Двое из ларца (2006 - 2008)',`
			`},`
			`'playlist_mincount': 24,`
			`}, {`
			`'url': 'http://www.ivi.ru/watch/dvoe_iz_lartsa/season1',`
			`'info_dict': {`
			`'id': 'dvoe_iz_lartsa/season1',`
			`'title': 'Двое из ларца (2006 - 2008) 1 сезон',`
			`},`
			`'playlist_mincount': 12,`
			`}]`
[ivi] Add support for ivi.ru 2013-12-18 22:28:16 +00:00
			`def _extract_entries(self, html, compilation_id):`
[ivi:compilation] Fix extraction 2016-01-03 21:49:18 +00:00			`return [`
			`self.url_result(`
			`'http://www.ivi.ru/watch/%s/%s' % (compilation_id, serie), IviIE.ie_key())`
			`for serie in re.findall(`
[ivi:compilation] Fix entries extraction (closes #23770) 2020-01-18 07:46:38 +00:00			`r'<a\b[^>]+\bhref=["\']/watch/%s/(\d+)["\']' % compilation_id, html)]`
[ivi] Add support for ivi.ru 2013-12-18 22:28:16 +00:00
			`def _real_extract(self, url):`
[extractor] Common function `_match_valid_url` 2021-08-19 01:41:24 +00:00			`mobj = self._match_valid_url(url)`
[ivi] Add support for ivi.ru 2013-12-18 22:28:16 +00:00			`compilation_id = mobj.group('compilationid')`
			`season_id = mobj.group('seasonid')`

PEP8 applied 2014-11-23 19:41:03 +00:00			`if season_id is not None: # Season link`
[ivi:compilation] Fix extraction 2016-01-03 21:49:18 +00:00			`season_page = self._download_webpage(`
			`url, compilation_id, 'Downloading season %s web page' % season_id)`
[ivi] Add support for ivi.ru 2013-12-18 22:28:16 +00:00			`playlist_id = '%s/season%s' % (compilation_id, season_id)`
[ivi] Fix test and use unicode literals 2014-01-28 19:20:48 +00:00			`playlist_title = self._html_search_meta('title', season_page, 'title')`
[ivi] Add support for ivi.ru 2013-12-18 22:28:16 +00:00			`entries = self._extract_entries(season_page, compilation_id)`
PEP8 applied 2014-11-23 19:41:03 +00:00			`else: # Compilation link`
[ivi] Fix test and use unicode literals 2014-01-28 19:20:48 +00:00			`compilation_page = self._download_webpage(url, compilation_id, 'Downloading compilation web page')`
[ivi] Add support for ivi.ru 2013-12-18 22:28:16 +00:00			`playlist_id = compilation_id`
[ivi] Fix test and use unicode literals 2014-01-28 19:20:48 +00:00			`playlist_title = self._html_search_meta('title', compilation_page, 'title')`
[ivi:compilation] Fix extraction 2016-01-03 21:49:18 +00:00			`seasons = re.findall(`
			`r'<a href="/watch/%s/season(\d+)' % compilation_id, compilation_page)`
			`if not seasons: # No seasons in this compilation`
[ivi] Add support for ivi.ru 2013-12-18 22:28:16 +00:00			`entries = self._extract_entries(compilation_page, compilation_id)`
			`else:`
			`entries = []`
			`for season_id in seasons:`
[ivi] Fix test and use unicode literals 2014-01-28 19:20:48 +00:00			`season_page = self._download_webpage(`
			`'http://www.ivi.ru/watch/%s/season%s' % (compilation_id, season_id),`
			`compilation_id, 'Downloading season %s web page' % season_id)`
[ivi] Add support for ivi.ru 2013-12-18 22:28:16 +00:00			`entries.extend(self._extract_entries(season_page, compilation_id))`

PEP8 applied 2014-11-23 19:41:03 +00:00			`return self.playlist_result(entries, playlist_id, playlist_title)`