yt-dlp/youtube_dlc/extractor/globo.py

# coding: utf-8
from __future__ import unicode_literals

import base64
import hashlib
import json
import random
import re

from .common import InfoExtractor
from ..compat import (
    compat_HTTPError,
    compat_str,
)
from ..utils import (
    ExtractorError,
    float_or_none,
    int_or_none,
    orderedSet,
    str_or_none,
)


class GloboIE(InfoExtractor):
    _VALID_URL = r'(?:globo:|https?://.+?\.globo\.com/(?:[^/]+/)*(?:v/(?:[^/]+/)?|videos/))(?P<id>\d{7,})'
    _NETRC_MACHINE = 'globo'
    _TESTS = [{
        'url': 'http://g1.globo.com/carros/autoesporte/videos/t/exclusivos-do-g1/v/mercedes-benz-gla-passa-por-teste-de-colisao-na-europa/3607726/',
        'md5': 'b3ccc801f75cd04a914d51dadb83a78d',
        'info_dict': {
            'id': '3607726',
            'ext': 'mp4',
            'title': 'Mercedes-Benz GLA passa por teste de colisão na Europa',
            'duration': 103.204,
            'uploader': 'Globo.com',
            'uploader_id': '265',
        },
    }, {
        'url': 'http://globoplay.globo.com/v/4581987/',
        'md5': 'f36a1ecd6a50da1577eee6dd17f67eff',
        'info_dict': {
            'id': '4581987',
            'ext': 'mp4',
            'title': 'Acidentes de trânsito estão entre as maiores causas de queda de energia em SP',
            'duration': 137.973,
            'uploader': 'Rede Globo',
            'uploader_id': '196',
        },
    }, {
        'url': 'http://canalbrasil.globo.com/programas/sangue-latino/videos/3928201.html',
        'only_matching': True,
    }, {
        'url': 'http://globosatplay.globo.com/globonews/v/4472924/',
        'only_matching': True,
    }, {
        'url': 'http://globotv.globo.com/t/programa/v/clipe-sexo-e-as-negas-adeus/3836166/',
        'only_matching': True,
    }, {
        'url': 'http://globotv.globo.com/canal-brasil/sangue-latino/t/todos-os-videos/v/ator-e-diretor-argentino-ricado-darin-fala-sobre-utopias-e-suas-perdas/3928201/',
        'only_matching': True,
    }, {
        'url': 'http://canaloff.globo.com/programas/desejar-profundo/videos/4518560.html',
        'only_matching': True,
    }, {
        'url': 'globo:3607726',
        'only_matching': True,
    }]

    def _real_initialize(self):
        email, password = self._get_login_info()
        if email is None:
            return

        try:
            glb_id = (self._download_json(
                'https://login.globo.com/api/authentication', None, data=json.dumps({
                    'payload': {
                        'email': email,
                        'password': password,
                        'serviceId': 4654,
                    },
                }).encode(), headers={
                    'Content-Type': 'application/json; charset=utf-8',
                }) or {}).get('glbId')
            if glb_id:
                self._set_cookie('.globo.com', 'GLBID', glb_id)
        except ExtractorError as e:
            if isinstance(e.cause, compat_HTTPError) and e.cause.code == 401:
                resp = self._parse_json(e.cause.read(), None)
                raise ExtractorError(resp.get('userMessage') or resp['id'], expected=True)
            raise

    def _real_extract(self, url):
        video_id = self._match_id(url)

        video = self._download_json(
            'http://api.globovideos.com/videos/%s/playlist' % video_id,
            video_id)['videos'][0]
        if video.get('encrypted') is True:
            raise ExtractorError('This video is DRM protected.', expected=True)

        title = video['title']

        formats = []
        subtitles = {}
        for resource in video['resources']:
            resource_id = resource.get('_id')
            resource_url = resource.get('url')
            resource_type = resource.get('type')
            if not resource_url or (resource_type == 'media' and not resource_id) or resource_type not in ('subtitle', 'media'):
                continue

            if resource_type == 'subtitle':
                subtitles.setdefault(resource.get('language') or 'por', []).append({
                    'url': resource_url,
                })
                continue

            security = self._download_json(
                'http://security.video.globo.com/videos/%s/hash' % video_id,
                video_id, 'Downloading security hash for %s' % resource_id, query={
                    'player': 'desktop',
                    'version': '5.19.1',
                    'resource_id': resource_id,
                })

            security_hash = security.get('hash')
            if not security_hash:
                message = security.get('message')
                if message:
                    raise ExtractorError(
                        '%s returned error: %s' % (self.IE_NAME, message), expected=True)
                continue

            hash_code = security_hash[:2]
            padding = '%010d' % random.randint(1, 10000000000)
            if hash_code in ('04', '14'):
                received_time = security_hash[3:13]
                received_md5 = security_hash[24:]
                hash_prefix = security_hash[:23]
            elif hash_code in ('02', '12', '03', '13'):
                received_time = security_hash[2:12]
                received_md5 = security_hash[22:]
                padding += '1'
                hash_prefix = '05' + security_hash[:22]

            padded_sign_time = compat_str(int(received_time) + 86400) + padding
            md5_data = (received_md5 + padded_sign_time + '0xAC10FD').encode()
            signed_md5 = base64.urlsafe_b64encode(hashlib.md5(md5_data).digest()).decode().strip('=')
            signed_hash = hash_prefix + padded_sign_time + signed_md5
            signed_url = '%s?h=%s&k=html5&a=%s&u=%s' % (resource_url, signed_hash, 'F' if video.get('subscriber_only') else 'A', security.get('user') or '')

            if resource_id.endswith('m3u8') or resource_url.endswith('.m3u8'):
                formats.extend(self._extract_m3u8_formats(
                    signed_url, resource_id, 'mp4', entry_protocol='m3u8_native',
                    m3u8_id='hls', fatal=False))
            elif resource_id.endswith('mpd') or resource_url.endswith('.mpd'):
                formats.extend(self._extract_mpd_formats(
                    signed_url, resource_id, mpd_id='dash', fatal=False))
            elif resource_id.endswith('manifest') or resource_url.endswith('/manifest'):
                formats.extend(self._extract_ism_formats(
                    signed_url, resource_id, ism_id='mss', fatal=False))
            else:
                formats.append({
                    'url': signed_url,
                    'format_id': 'http-%s' % resource_id,
                    'height': int_or_none(resource.get('height')),
                })

        self._sort_formats(formats)

        duration = float_or_none(video.get('duration'), 1000)
        uploader = video.get('channel')
        uploader_id = str_or_none(video.get('channel_id'))

        return {
            'id': video_id,
            'title': title,
            'duration': duration,
            'uploader': uploader,
            'uploader_id': uploader_id,
            'formats': formats,
            'subtitles': subtitles,
        }


class GloboArticleIE(InfoExtractor):
    _VALID_URL = r'https?://.+?\.globo\.com/(?:[^/]+/)*(?P<id>[^/.]+)(?:\.html)?'

    _VIDEOID_REGEXES = [
        r'\bdata-video-id=["\'](\d{7,})',
        r'\bdata-player-videosids=["\'](\d{7,})',
        r'\bvideosIDs\s*:\s*["\']?(\d{7,})',
        r'\bdata-id=["\'](\d{7,})',
        r'<div[^>]+\bid=["\'](\d{7,})',
    ]

    _TESTS = [{
        'url': 'http://g1.globo.com/jornal-nacional/noticia/2014/09/novidade-na-fiscalizacao-de-bagagem-pela-receita-provoca-discussoes.html',
        'info_dict': {
            'id': 'novidade-na-fiscalizacao-de-bagagem-pela-receita-provoca-discussoes',
            'title': 'Novidade na fiscalização de bagagem pela Receita provoca discussões',
            'description': 'md5:c3c4b4d4c30c32fce460040b1ac46b12',
        },
        'playlist_count': 1,
    }, {
        'url': 'http://g1.globo.com/pr/parana/noticia/2016/09/mpf-denuncia-lula-marisa-e-mais-seis-na-operacao-lava-jato.html',
        'info_dict': {
            'id': 'mpf-denuncia-lula-marisa-e-mais-seis-na-operacao-lava-jato',
            'title': "Lula era o 'comandante máximo' do esquema da Lava Jato, diz MPF",
            'description': 'md5:8aa7cc8beda4dc71cc8553e00b77c54c',
        },
        'playlist_count': 6,
    }, {
        'url': 'http://gq.globo.com/Prazeres/Poder/noticia/2015/10/all-o-desafio-assista-ao-segundo-capitulo-da-serie.html',
        'only_matching': True,
    }, {
        'url': 'http://gshow.globo.com/programas/tv-xuxa/O-Programa/noticia/2014/01/xuxa-e-junno-namoram-muuuito-em-luau-de-zeze-di-camargo-e-luciano.html',
        'only_matching': True,
    }, {
        'url': 'http://oglobo.globo.com/rio/a-amizade-entre-um-entregador-de-farmacia-um-piano-19946271',
        'only_matching': True,
    }]

    @classmethod
    def suitable(cls, url):
        return False if GloboIE.suitable(url) else super(GloboArticleIE, cls).suitable(url)

    def _real_extract(self, url):
        display_id = self._match_id(url)
        webpage = self._download_webpage(url, display_id)
        video_ids = []
        for video_regex in self._VIDEOID_REGEXES:
            video_ids.extend(re.findall(video_regex, webpage))
        entries = [
            self.url_result('globo:%s' % video_id, GloboIE.ie_key())
            for video_id in orderedSet(video_ids)]
        title = self._og_search_title(webpage, fatal=False)
        description = self._html_search_meta('description', webpage)
        return self.playlist_result(entries, display_id, title, description)
[globo] Initial extractor implementation (Closes #3823) 2014-10-04 11:56:36 +00:00			`# coding: utf-8`
			`from __future__ import unicode_literals`

[globo] improve extraction(closes #4189) - add support for authentication - simplify url signing - extract DASH and MSS formats 2018-05-21 13:53:02 +00:00			`import base64`
			`import hashlib`
			`import json`
[globo] Initial extractor implementation (Closes #3823) 2014-10-04 11:56:36 +00:00			`import random`
[globo:article] Add support for multiple videos (Closes #10653) 2016-09-17 16:34:10 +00:00			`import re`
[globo] Initial extractor implementation (Closes #3823) 2014-10-04 11:56:36 +00:00
			`from .common import InfoExtractor`
[globo] handle login errors 2018-05-21 14:07:24 +00:00			`from ..compat import (`
			`compat_HTTPError,`
			`compat_str,`
			`)`
[util] Move compatibility functions out of util utils is large enough without these compatibility functions. Everything that is present in newer versions of Python (i.e. with dev Python it's just an import) goes into compat.py . Everything else (i.e. youtube-dl-specific helpers) goes into utils.py . 2014-11-02 10:23:40 +00:00			`from ..utils import (`
			`ExtractorError,`
			`float_or_none,`
[globo] Fix extraction and make more robust (Closes #6728) 2015-09-01 14:41:52 +00:00			`int_or_none,`
[globo:article] Add support for multiple videos (Closes #10653) 2016-09-17 16:34:10 +00:00			`orderedSet,`
[globo] Force uploader id to be string 2015-11-04 11:12:42 +00:00			`str_or_none,`
[util] Move compatibility functions out of util utils is large enough without these compatibility functions. Everything that is present in newer versions of Python (i.e. with dev Python it's just an import) goes into compat.py . Everything else (i.e. youtube-dl-specific helpers) goes into utils.py . 2014-11-02 10:23:40 +00:00			`)`
[globo] Initial extractor implementation (Closes #3823) 2014-10-04 11:56:36 +00:00

			`class GloboIE(InfoExtractor):`
Add missing r prefix for _VALID_URLs 2016-09-08 10:04:57 +00:00			`_VALID_URL = r'(?:globo:\|https?://.+?\.globo\.com/(?:[^/]+/)*(?:v/(?:[^/]+/)?\|videos/))(?P<id>\d{7,})'`
[globo] Add entry for netrc authentication 2018-05-21 14:39:02 +00:00			`_NETRC_MACHINE = 'globo'`
[globo] Separate article extractor 2015-11-04 10:46:26 +00:00			`_TESTS = [{`
			`'url': 'http://g1.globo.com/carros/autoesporte/videos/t/exclusivos-do-g1/v/mercedes-benz-gla-passa-por-teste-de-colisao-na-europa/3607726/',`
			`'md5': 'b3ccc801f75cd04a914d51dadb83a78d',`
			`'info_dict': {`
			`'id': '3607726',`
			`'ext': 'mp4',`
			`'title': 'Mercedes-Benz GLA passa por teste de colisão na Europa',`
			`'duration': 103.204,`
			`'uploader': 'Globo.com',`
[globo] Force uploader id to be string 2015-11-04 11:12:42 +00:00			`'uploader_id': '265',`
[globo] Update tests 2015-11-04 11:10:45 +00:00			`},`
[globo] Separate article extractor 2015-11-04 10:46:26 +00:00			`}, {`
[globo] Update tests 2015-11-04 11:10:45 +00:00			`'url': 'http://globoplay.globo.com/v/4581987/',`
			`'md5': 'f36a1ecd6a50da1577eee6dd17f67eff',`
[globo] Separate article extractor 2015-11-04 10:46:26 +00:00			`'info_dict': {`
[globo] Update tests 2015-11-04 11:10:45 +00:00			`'id': '4581987',`
[globo] Separate article extractor 2015-11-04 10:46:26 +00:00			`'ext': 'mp4',`
[globo] Update tests 2015-11-04 11:10:45 +00:00			`'title': 'Acidentes de trânsito estão entre as maiores causas de queda de energia em SP',`
			`'duration': 137.973,`
			`'uploader': 'Rede Globo',`
[globo] Force uploader id to be string 2015-11-04 11:12:42 +00:00			`'uploader_id': '196',`
[globo] Update tests 2015-11-04 11:10:45 +00:00			`},`
			`}, {`
			`'url': 'http://canalbrasil.globo.com/programas/sangue-latino/videos/3928201.html',`
			`'only_matching': True,`
			`}, {`
			`'url': 'http://globosatplay.globo.com/globonews/v/4472924/',`
			`'only_matching': True,`
			`}, {`
			`'url': 'http://globotv.globo.com/t/programa/v/clipe-sexo-e-as-negas-adeus/3836166/',`
			`'only_matching': True,`
			`}, {`
			`'url': 'http://globotv.globo.com/canal-brasil/sangue-latino/t/todos-os-videos/v/ator-e-diretor-argentino-ricado-darin-fala-sobre-utopias-e-suas-perdas/3928201/',`
			`'only_matching': True,`
[globo] Add more tests 2015-11-04 11:42:11 +00:00			`}, {`
			`'url': 'http://canaloff.globo.com/programas/desejar-profundo/videos/4518560.html',`
			`'only_matching': True,`
[globo:article] Add support for multiple videos (Closes #10653) 2016-09-17 16:34:10 +00:00			`}, {`
			`'url': 'globo:3607726',`
			`'only_matching': True,`
[globo] Separate article extractor 2015-11-04 10:46:26 +00:00			`}]`
[globo] Initial extractor implementation (Closes #3823) 2014-10-04 11:56:36 +00:00
[globo] improve extraction(closes #4189) - add support for authentication - simplify url signing - extract DASH and MSS formats 2018-05-21 13:53:02 +00:00			`def _real_initialize(self):`
			`email, password = self._get_login_info()`
			`if email is None:`
			`return`

[globo] handle login errors 2018-05-21 14:07:24 +00:00			`try:`
[globo] set GLBID cookie manually(closes #17346) 2019-01-09 18:17:58 +00:00			`glb_id = (self._download_json(`
[globo] handle login errors 2018-05-21 14:07:24 +00:00			`'https://login.globo.com/api/authentication', None, data=json.dumps({`
			`'payload': {`
			`'email': email,`
			`'password': password,`
			`'serviceId': 4654,`
			`},`
			`}).encode(), headers={`
			`'Content-Type': 'application/json; charset=utf-8',`
[globo] set GLBID cookie manually(closes #17346) 2019-01-09 18:17:58 +00:00			`}) or {}).get('glbId')`
			`if glb_id:`
			`self._set_cookie('.globo.com', 'GLBID', glb_id)`
[globo] handle login errors 2018-05-21 14:07:24 +00:00			`except ExtractorError as e:`
			`if isinstance(e.cause, compat_HTTPError) and e.cause.code == 401:`
			`resp = self._parse_json(e.cause.read(), None)`
			`raise ExtractorError(resp.get('userMessage') or resp['id'], expected=True)`
			`raise`
[globo] Initial extractor implementation (Closes #3823) 2014-10-04 11:56:36 +00:00
			`def _real_extract(self, url):`
			`video_id = self._match_id(url)`

			`video = self._download_json(`
[globo] improve extraction(closes #4189) - add support for authentication - simplify url signing - extract DASH and MSS formats 2018-05-21 13:53:02 +00:00			`'http://api.globovideos.com/videos/%s/playlist' % video_id,`
			`video_id)['videos'][0]`
[globo] fix format extraction(closes #20319) 2019-10-09 10:07:46 +00:00			`if video.get('encrypted') is True:`
			`raise ExtractorError('This video is DRM protected.', expected=True)`
[globo] Initial extractor implementation (Closes #3823) 2014-10-04 11:56:36 +00:00
			`title = video['title']`

			`formats = []`
[globo] extract subtitles(closes #22713) 2019-10-15 18:54:53 +00:00			`subtitles = {}`
[globo] Initial extractor implementation (Closes #3823) 2014-10-04 11:56:36 +00:00			`for resource in video['resources']:`
			`resource_id = resource.get('_id')`
[globo] improve extraction(closes #4189) - add support for authentication - simplify url signing - extract DASH and MSS formats 2018-05-21 13:53:02 +00:00			`resource_url = resource.get('url')`
[globo] extract subtitles(closes #22713) 2019-10-15 18:54:53 +00:00			`resource_type = resource.get('type')`
			`if not resource_url or (resource_type == 'media' and not resource_id) or resource_type not in ('subtitle', 'media'):`
			`continue`

			`if resource_type == 'subtitle':`
			`subtitles.setdefault(resource.get('language') or 'por', []).append({`
			`'url': resource_url,`
			`})`
[globo] Initial extractor implementation (Closes #3823) 2014-10-04 11:56:36 +00:00			`continue`

			`security = self._download_json(`
[globo] improve extraction(closes #4189) - add support for authentication - simplify url signing - extract DASH and MSS formats 2018-05-21 13:53:02 +00:00			`'http://security.video.globo.com/videos/%s/hash' % video_id,`
			`video_id, 'Downloading security hash for %s' % resource_id, query={`
[globo] fix format extraction(closes #20319) 2019-10-09 10:07:46 +00:00			`'player': 'desktop',`
			`'version': '5.19.1',`
[globo] improve extraction(closes #4189) - add support for authentication - simplify url signing - extract DASH and MSS formats 2018-05-21 13:53:02 +00:00			`'resource_id': resource_id,`
			`})`
[globo] Initial extractor implementation (Closes #3823) 2014-10-04 11:56:36 +00:00
			`security_hash = security.get('hash')`
			`if not security_hash:`
			`message = security.get('message')`
			`if message:`
			`raise ExtractorError(`
			`'%s returned error: %s' % (self.IE_NAME, message), expected=True)`
			`continue`

[globo] handle alternative hash signing method 2019-10-22 16:49:50 +00:00			`hash_code = security_hash[:2]`
[globo] Initial extractor implementation (Closes #3823) 2014-10-04 11:56:36 +00:00			`padding = '%010d' % random.randint(1, 10000000000)`
[globo] handle alternative hash signing method 2019-10-22 16:49:50 +00:00			`if hash_code in ('04', '14'):`
			`received_time = security_hash[3:13]`
			`received_md5 = security_hash[24:]`
			`hash_prefix = security_hash[:23]`
			`elif hash_code in ('02', '12', '03', '13'):`
			`received_time = security_hash[2:12]`
			`received_md5 = security_hash[22:]`
			`padding += '1'`
			`hash_prefix = '05' + security_hash[:22]`

			`padded_sign_time = compat_str(int(received_time) + 86400) + padding`
			`md5_data = (received_md5 + padded_sign_time + '0xAC10FD').encode()`
[globo] improve extraction(closes #4189) - add support for authentication - simplify url signing - extract DASH and MSS formats 2018-05-21 13:53:02 +00:00			`signed_md5 = base64.urlsafe_b64encode(hashlib.md5(md5_data).digest()).decode().strip('=')`
[globo] handle alternative hash signing method 2019-10-22 16:49:50 +00:00			`signed_hash = hash_prefix + padded_sign_time + signed_md5`
[globo] fix format extraction(closes #20319) 2019-10-09 10:07:46 +00:00			`signed_url = '%s?h=%s&k=html5&a=%s&u=%s' % (resource_url, signed_hash, 'F' if video.get('subscriber_only') else 'A', security.get('user') or '')`
[globo] handle alternative hash signing method 2019-10-22 16:49:50 +00:00
[globo] Properly extract m3u8 formats (#4346 #4832) 2015-01-31 22:36:24 +00:00			`if resource_id.endswith('m3u8') or resource_url.endswith('.m3u8'):`
Simplify formats accumulation for f4m/m3u8/smil formats Now all _extract_*_formats routines return a list 2015-12-28 18:58:24 +00:00			`formats.extend(self._extract_m3u8_formats(`
[globo] Prefer native m3u8 2015-11-04 10:55:39 +00:00			`signed_url, resource_id, 'mp4', entry_protocol='m3u8_native',`
Simplify formats accumulation for f4m/m3u8/smil formats Now all _extract_*_formats routines return a list 2015-12-28 18:58:24 +00:00			`m3u8_id='hls', fatal=False))`
[globo] improve extraction(closes #4189) - add support for authentication - simplify url signing - extract DASH and MSS formats 2018-05-21 13:53:02 +00:00			`elif resource_id.endswith('mpd') or resource_url.endswith('.mpd'):`
			`formats.extend(self._extract_mpd_formats(`
			`signed_url, resource_id, mpd_id='dash', fatal=False))`
			`elif resource_id.endswith('manifest') or resource_url.endswith('/manifest'):`
			`formats.extend(self._extract_ism_formats(`
			`signed_url, resource_id, ism_id='mss', fatal=False))`
[globo] Properly extract m3u8 formats (#4346 #4832) 2015-01-31 22:36:24 +00:00			`else:`
			`formats.append({`
			`'url': signed_url,`
[globo] Improve http formats 2015-11-04 11:03:45 +00:00			`'format_id': 'http-%s' % resource_id,`
			`'height': int_or_none(resource.get('height')),`
[globo] Properly extract m3u8 formats (#4346 #4832) 2015-01-31 22:36:24 +00:00			`})`
[globo] Initial extractor implementation (Closes #3823) 2014-10-04 11:56:36 +00:00
			`self._sort_formats(formats)`

[globo] Fix extraction and make more robust (Closes #6728) 2015-09-01 14:41:52 +00:00			`duration = float_or_none(video.get('duration'), 1000)`
			`uploader = video.get('channel')`
[globo] Force uploader id to be string 2015-11-04 11:12:42 +00:00			`uploader_id = str_or_none(video.get('channel_id'))`
[globo] Fix extraction and make more robust (Closes #6728) 2015-09-01 14:41:52 +00:00
[globo] Initial extractor implementation (Closes #3823) 2014-10-04 11:56:36 +00:00			`return {`
			`'id': video_id,`
			`'title': title,`
			`'duration': duration,`
			`'uploader': uploader,`
			`'uploader_id': uploader_id,`
[globo] extract subtitles(closes #22713) 2019-10-15 18:54:53 +00:00			`'formats': formats,`
			`'subtitles': subtitles,`
PEP8 applied 2014-11-23 19:41:03 +00:00			`}`
[globo] Separate article extractor 2015-11-04 10:46:26 +00:00

			`class GloboArticleIE(InfoExtractor):`
[globo:article] Add support for multiple videos (Closes #10653) 2016-09-17 16:34:10 +00:00			`_VALID_URL = r'https?://.+?\.globo\.com/(?:[^/]+/)*(?P<id>[^/.]+)(?:\.html)?'`
[globo] Separate article extractor 2015-11-04 10:46:26 +00:00
			`_VIDEOID_REGEXES = [`
			`r'\bdata-video-id=["\'](\d{7,})',`
			`r'\bdata-player-videosids=["\'](\d{7,})',`
[globo:article] Relax _VALID_URL and video id regex (Closes #10379) 2016-08-18 18:13:45 +00:00			`r'\bvideosIDs\s:\s["\']?(\d{7,})',`
[globo] Separate article extractor 2015-11-04 10:46:26 +00:00			`r'\bdata-id=["\'](\d{7,})',`
			`r'<div[^>]+\bid=["\'](\d{7,})',`
			`]`

[globo] Add more tests 2015-11-04 11:42:11 +00:00			`_TESTS = [{`
[globo] Separate article extractor 2015-11-04 10:46:26 +00:00			`'url': 'http://g1.globo.com/jornal-nacional/noticia/2014/09/novidade-na-fiscalizacao-de-bagagem-pela-receita-provoca-discussoes.html',`
			`'info_dict': {`
[globo:article] Add support for multiple videos (Closes #10653) 2016-09-17 16:34:10 +00:00			`'id': 'novidade-na-fiscalizacao-de-bagagem-pela-receita-provoca-discussoes',`
			`'title': 'Novidade na fiscalização de bagagem pela Receita provoca discussões',`
			`'description': 'md5:c3c4b4d4c30c32fce460040b1ac46b12',`
			`},`
			`'playlist_count': 1,`
			`}, {`
			`'url': 'http://g1.globo.com/pr/parana/noticia/2016/09/mpf-denuncia-lula-marisa-e-mais-seis-na-operacao-lava-jato.html',`
			`'info_dict': {`
			`'id': 'mpf-denuncia-lula-marisa-e-mais-seis-na-operacao-lava-jato',`
			`'title': "Lula era o 'comandante máximo' do esquema da Lava Jato, diz MPF",`
			`'description': 'md5:8aa7cc8beda4dc71cc8553e00b77c54c',`
			`},`
			`'playlist_count': 6,`
[globo] Add more tests 2015-11-04 11:42:11 +00:00			`}, {`
			`'url': 'http://gq.globo.com/Prazeres/Poder/noticia/2015/10/all-o-desafio-assista-ao-segundo-capitulo-da-serie.html',`
			`'only_matching': True,`
			`}, {`
			`'url': 'http://gshow.globo.com/programas/tv-xuxa/O-Programa/noticia/2014/01/xuxa-e-junno-namoram-muuuito-em-luau-de-zeze-di-camargo-e-luciano.html',`
			`'only_matching': True,`
[globo:article] Relax _VALID_URL and video id regex (Closes #10379) 2016-08-18 18:13:45 +00:00			`}, {`
			`'url': 'http://oglobo.globo.com/rio/a-amizade-entre-um-entregador-de-farmacia-um-piano-19946271',`
			`'only_matching': True,`
[globo] Add more tests 2015-11-04 11:42:11 +00:00			`}]`
[globo] Separate article extractor 2015-11-04 10:46:26 +00:00
			`@classmethod`
			`def suitable(cls, url):`
			`return False if GloboIE.suitable(url) else super(GloboArticleIE, cls).suitable(url)`

			`def _real_extract(self, url):`
			`display_id = self._match_id(url)`
			`webpage = self._download_webpage(url, display_id)`
[globo:article] Add support for multiple videos (Closes #10653) 2016-09-17 16:34:10 +00:00			`video_ids = []`
			`for video_regex in self._VIDEOID_REGEXES:`
			`video_ids.extend(re.findall(video_regex, webpage))`
			`entries = [`
			`self.url_result('globo:%s' % video_id, GloboIE.ie_key())`
			`for video_id in orderedSet(video_ids)]`
			`title = self._og_search_title(webpage, fatal=False)`
			`description = self._html_search_meta('description', webpage)`
			`return self.playlist_result(entries, display_id, title, description)`