ail-framework/bin/lib/objects/abstract_daterange_object.py

# -*-coding:UTF-8 -*
"""
Base Class for AIL Objects
"""

##################################
# Import External packages
##################################
import os
import re
import sys
from abc import abstractmethod, ABC

# from flask import url_for

sys.path.append(os.environ['AIL_BIN'])
##################################
# Import Project packages
##################################
from lib.objects.abstract_object import AbstractObject
from lib.ConfigLoader import ConfigLoader
from lib.item_basic import is_crawled, get_item_domain
from lib.data_retention_engine import update_obj_date

from packages import Date

# LOAD CONFIG
config_loader = ConfigLoader()
r_object = config_loader.get_db_conn("Kvrocks_Objects")
config_loader = None

class AbstractDaterangeObject(AbstractObject, ABC):
    """
    Abstract Subtype Object
    """

    def __init__(self, obj_type, id):
        """ Abstract for all the AIL object

        :param obj_type: object type (item, ...)
        :param id: Object ID
        """
        super().__init__(obj_type, id)

    def exists(self):
        return r_object.exists(f'meta:{self.type}:{self.id}')

    def _get_field(self, field): # TODO remove me (NEW in abstract)
        return r_object.hget(f'meta:{self.type}:{self.id}', field)

    def _set_field(self, field, value): # TODO remove me (NEW in abstract)
        return r_object.hset(f'meta:{self.type}:{self.id}', field, value)

    def get_first_seen(self, r_int=False):
        first_seen = self._get_field('first_seen')
        if r_int:
            if first_seen:
                return int(first_seen)
            else:
                return 99999999
        else:
            return first_seen

    def get_last_seen(self, r_int=False):
        last_seen = self._get_field('last_seen')
        if r_int:
            if last_seen:
                return int(last_seen)
            else:
                return 0
        else:
            return last_seen

    def get_nb_seen(self): # TODO REPLACE ME -> correlation image chats
        return self.get_nb_correlation('item') + self.get_nb_correlation('message')

    def get_nb_seen_by_date(self, date):
        nb = r_object.zscore(f'{self.type}:date:{date}', self.id)
        if nb is None:
            return 0
        else:
            return int(nb)

    def _get_meta(self, options=[]):
        meta_dict = self.get_default_meta()
        meta_dict['first_seen'] = self.get_first_seen()
        meta_dict['last_seen'] = self.get_last_seen()
        meta_dict['nb_seen'] = self.get_nb_seen()
        if 'sparkline' in options:
            meta_dict['sparkline'] = self.get_sparkline()
        if 'last_full_date'in options:
            meta_dict['last_full_date'] = self.get_last_full_date()
        return meta_dict

    def set_first_seen(self, first_seen):
        self._set_field('first_seen', first_seen)

    def set_last_seen(self, last_seen):
        self._set_field('last_seen', last_seen)

    def update_daterange(self, date):
        date = int(date)
        # obj don't exit
        if not self.exists():
            self.set_first_seen(date)
            self.set_last_seen(date)
        else:
            first_seen = self.get_first_seen(r_int=True)
            last_seen = self.get_last_seen(r_int=True)
            if date < first_seen:
                self.set_first_seen(date)
            if date > last_seen:
                self.set_last_seen(date)

    def get_sparkline(self):
        sparkline = []
        for date in Date.get_previous_date_list(6):
            sparkline.append(self.get_nb_seen_by_date(date))
        return sparkline

    def get_content(self, r_type='str'):
        if r_type == 'str':
            return self.id
        elif r_type == 'bytes':
            return self.id.encode()

    def _add_create(self):
        r_object.sadd(f'{self.type}:all', self.id)

    def _copy_from(self, obj_type, obj_id):
        first_seen = r_object.hget(f'meta:{obj_type}:{obj_id}', 'first_seen')
        last_seen = r_object.hget(f'meta:{obj_type}:{obj_id}', 'last_seen')
        if first_seen and last_seen:
            for date in Date.get_daterange(first_seen, last_seen):
                nb = r_object.zscore(f'{obj_type}:date:{date}', self.id)
                r_object.zincrby(f'{self.type}:date:{date}', nb, self.id)
            update_obj_date(first_seen, self.type)
            update_obj_date(last_seen, self.type)
            self._add_create()
            self.set_first_seen(first_seen)
            self.set_last_seen(last_seen)

    def _add(self, date, obj): # TODO OBJ=None
        if not self.exists():
            self._add_create()
            self.set_first_seen(date)
            self.set_last_seen(date)
        else:
            self.update_daterange(date)
        update_obj_date(date, self.type)

        r_object.zincrby(f'{self.type}:date:{date}', 1, self.id)

        if obj:
            # Correlations
            self.add_correlation(obj.type, obj.get_subtype(r_str=True), obj.get_id())

            if obj.type == 'item':
                item_id = obj.get_id()
                # domain
                if is_crawled(item_id):
                    domain = get_item_domain(item_id)
                    self.add_correlation('domain', '', domain)

    def add(self, date, obj):
        self._add(date, obj)

    # TODO:ADD objects + Stats
    def _create(self, first_seen=None, last_seen=None):
        if first_seen:
            self.set_first_seen(first_seen)
        if last_seen:
            self.set_last_seen(last_seen)
        r_object.sadd(f'{self.type}:all', self.id)

    # TODO
    def _delete(self):
        pass


class AbstractDaterangeObjects(ABC):
    """
    Abstract Daterange Objects
    """

    def __init__(self, obj_type, obj_class):
        """ Abstract for Daterange Objects

        :param obj_type: object type (item, ...)
        :param obj_class: object python class (Item, ...)
        """
        self.type = obj_type
        self.obj_class = obj_class

    def get_ids(self):
        return r_object.smembers(f'{self.type}:all')

    # def get_ids_iterator(self):
    #     return r_object.sscan_iter(r_object, f'{self.type}:all')

    def get_by_date(self, date):
        return r_object.zrange(f'{self.type}:date:{date}', 0, -1)

    def get_nb_by_date(self, date):
        return r_object.zcard(f'{self.type}:date:{date}')

    def get_by_daterange(self, date_from, date_to):
        obj_ids = set()
        for date in Date.substract_date(date_from, date_to):
            obj_ids = obj_ids | set(self.get_by_date(date))
        return obj_ids

    def get_metas(self, obj_ids, options=set()):
        dict_obj = {}
        for obj_id in obj_ids:
            obj = self.obj_class(obj_id)
            dict_obj[obj_id] = obj.get_meta(options=options)
        return dict_obj

    @abstractmethod
    def sanitize_id_to_search(self, id_to_search):
        return id_to_search

    def search_by_id(self, name_to_search, r_pos=False, case_sensitive=True):
        objs = {}
        if case_sensitive:
            flags = 0
        else:
            flags = re.IGNORECASE
        # for subtype in subtypes:
        r_name = self.sanitize_id_to_search(name_to_search)
        if not name_to_search or isinstance(r_name, dict):
            return objs
        r_name = re.compile(r_name, flags=flags)
        for obj_id in self.get_ids():   # TODO REPLACE ME WITH AN ITERATOR
            res = re.search(r_name, obj_id)
            if res:
                objs[obj_id] = {}
                if r_pos:
                    objs[obj_id]['hl-start'] = res.start()
                    objs[obj_id]['hl-end'] = res.end()
        return objs

    def sanitize_content_to_search(self, content_to_search):
        return content_to_search

    def get_contents_ids(self):
        titles = {}
        for obj_id in self.get_ids():
            obj = self.obj_class(obj_id)
            content = obj.get_content()
            if content not in titles:
                titles[content] = []
            for domain in obj.get_correlation('domain').get('domain', []):
                titles[content].append(domain[1:])
        return titles

    def search_by_content(self, content_to_search, r_pos=False, case_sensitive=True):
        objs = {}
        if case_sensitive:
            flags = 0
        else:
            flags = re.IGNORECASE
        # for subtype in subtypes:
        r_search = self.sanitize_content_to_search(content_to_search)
        if not r_search or isinstance(r_search, dict):
            return objs
        r_search = re.compile(r_search, flags=flags)
        for obj_id in self.get_ids():  # TODO REPLACE ME WITH AN ITERATOR
            obj = self.obj_class(obj_id)
            content = obj.get_content()
            res = re.search(r_search, content)
            if res:
                objs[obj_id] = {}
                if r_pos:  # TODO ADD CONTENT ????
                    objs[obj_id]['hl-start'] = res.start()
                    objs[obj_id]['hl-end'] = res.end()
                    objs[obj_id]['content'] = content
        return objs

    def api_get_chart_nb_by_daterange(self, date_from, date_to):
        date_type = []
        for date in Date.substract_date(date_from, date_to):
            d = {'date': f'{date[0:4]}-{date[4:6]}-{date[6:8]}',
                 self.type: self.get_nb_by_date(date)}
            date_type.append(d)
        return date_type

    def api_get_meta_by_daterange(self, date_from, date_to):
        date = Date.sanitise_date_range(date_from, date_to)
        return self.get_metas(self.get_by_daterange(date['date_from'], date['date_to']), options={'sparkline'})
chg: [crawler + core + cve] migrate crawler to lacus + add new CVE object and correlation + migrate core 2022-10-25 14:25:19 +00:00			`# --coding:UTF-8 -`
			`"""`
			`Base Class for AIL Objects`
			`"""`

			`##################################`
			`# Import External packages`
			`##################################`
			`import os`
chg: [new title object] add new title object + correlation on page title 2023-05-25 12:33:12 +00:00			`import re`
chg: [crawler + core + cve] migrate crawler to lacus + add new CVE object and correlation + migrate core 2022-10-25 14:25:19 +00:00			`import sys`
			`from abc import abstractmethod, ABC`

chg: [migration] migrate Screenshots + Trackers + Duplicates + fix zadd zincrby 2022-11-29 15:01:01 +00:00			`# from flask import url_for`
chg: [crawler + core + cve] migrate crawler to lacus + add new CVE object and correlation + migrate core 2022-10-25 14:25:19 +00:00
			`sys.path.append(os.environ['AIL_BIN'])`
			`##################################`
			`# Import Project packages`
			`##################################`
			`from lib.objects.abstract_object import AbstractObject`
			`from lib.ConfigLoader import ConfigLoader`
			`from lib.item_basic import is_crawled, get_item_domain`
chg: [DB Migration] UI: Extract + highlight leaks and trackers match, Data Retention save object first/last date, Refactor Tools 2022-12-19 15:38:20 +00:00			`from lib.data_retention_engine import update_obj_date`
chg: [crawler + core + cve] migrate crawler to lacus + add new CVE object and correlation + migrate core 2022-10-25 14:25:19 +00:00
			`from packages import Date`

			`# LOAD CONFIG`
			`config_loader = ConfigLoader()`
			`r_object = config_loader.get_db_conn("Kvrocks_Objects")`
			`config_loader = None`

			`class AbstractDaterangeObject(AbstractObject, ABC):`
			`"""`
			`Abstract Subtype Object`
			`"""`

			`def __init__(self, obj_type, id):`
			`""" Abstract for all the AIL object`

			`:param obj_type: object type (item, ...)`
			`:param id: Object ID`
			`"""`
			`super().__init__(obj_type, id)`

			`def exists(self):`
chg: [DB Migration] UI: Extract + highlight leaks and trackers match, Data Retention save object first/last date, Refactor Tools 2022-12-19 15:38:20 +00:00			`return r_object.exists(f'meta:{self.type}:{self.id}')`
chg: [crawler + core + cve] migrate crawler to lacus + add new CVE object and correlation + migrate core 2022-10-25 14:25:19 +00:00
chg: [core] add telegram importer + Chat object + message Object + add timeline engine 2023-08-18 09:05:21 +00:00			`def _get_field(self, field): # TODO remove me (NEW in abstract)`
chg: [new title object] add new title object + correlation on page title 2023-05-25 12:33:12 +00:00			`return r_object.hget(f'meta:{self.type}:{self.id}', field)`

chg: [core] add telegram importer + Chat object + message Object + add timeline engine 2023-08-18 09:05:21 +00:00			`def _set_field(self, field, value): # TODO remove me (NEW in abstract)`
chg: [new title object] add new title object + correlation on page title 2023-05-25 12:33:12 +00:00			`return r_object.hset(f'meta:{self.type}:{self.id}', field, value)`

chg: [crawler + core + cve] migrate crawler to lacus + add new CVE object and correlation + migrate core 2022-10-25 14:25:19 +00:00			`def get_first_seen(self, r_int=False):`
chg: [new title object] add new title object + correlation on page title 2023-05-25 12:33:12 +00:00			`first_seen = self._get_field('first_seen')`
chg: [crawler + core + cve] migrate crawler to lacus + add new CVE object and correlation + migrate core 2022-10-25 14:25:19 +00:00			`if r_int:`
			`if first_seen:`
			`return int(first_seen)`
			`else:`
			`return 99999999`
			`else:`
			`return first_seen`

			`def get_last_seen(self, r_int=False):`
chg: [new title object] add new title object + correlation on page title 2023-05-25 12:33:12 +00:00			`last_seen = self._get_field('last_seen')`
chg: [crawler + core + cve] migrate crawler to lacus + add new CVE object and correlation + migrate core 2022-10-25 14:25:19 +00:00			`if r_int:`
			`if last_seen:`
			`return int(last_seen)`
			`else:`
			`return 0`
			`else:`
			`return last_seen`

chg: [ocr] ocr daterange object, get ocrs by daterange + fixs 2024-04-25 12:18:22 +00:00			`def get_nb_seen(self): # TODO REPLACE ME -> correlation image chats`
chg: [chats] add image object + show message image 2023-11-15 13:12:50 +00:00			`return self.get_nb_correlation('item') + self.get_nb_correlation('message')`
chg: [crawler + core + cve] migrate crawler to lacus + add new CVE object and correlation + migrate core 2022-10-25 14:25:19 +00:00
			`def get_nb_seen_by_date(self, date):`
chg: [CVE] migrate CVE + get CVEs by daterange 2022-12-21 13:20:13 +00:00			`nb = r_object.zscore(f'{self.type}:date:{date}', self.id)`
chg: [crawler + core + cve] migrate crawler to lacus + add new CVE object and correlation + migrate core 2022-10-25 14:25:19 +00:00			`if nb is None:`
			`return 0`
			`else:`
			`return int(nb)`

			`def _get_meta(self, options=[]):`
chg: [investigation] add object comment 2023-06-26 14:28:31 +00:00			`meta_dict = self.get_default_meta()`
			`meta_dict['first_seen'] = self.get_first_seen()`
			`meta_dict['last_seen'] = self.get_last_seen()`
			`meta_dict['nb_seen'] = self.get_nb_seen()`
chg: [crawler + core + cve] migrate crawler to lacus + add new CVE object and correlation + migrate core 2022-10-25 14:25:19 +00:00			`if 'sparkline' in options:`
			`meta_dict['sparkline'] = self.get_sparkline()`
chg: [trackers match] show objects date 2024-03-22 10:37:35 +00:00			`if 'last_full_date'in options:`
			`meta_dict['last_full_date'] = self.get_last_full_date()`
chg: [crawler + core + cve] migrate crawler to lacus + add new CVE object and correlation + migrate core 2022-10-25 14:25:19 +00:00			`return meta_dict`

			`def set_first_seen(self, first_seen):`
chg: [new title object] add new title object + correlation on page title 2023-05-25 12:33:12 +00:00			`self._set_field('first_seen', first_seen)`
chg: [crawler + core + cve] migrate crawler to lacus + add new CVE object and correlation + migrate core 2022-10-25 14:25:19 +00:00
			`def set_last_seen(self, last_seen):`
chg: [new title object] add new title object + correlation on page title 2023-05-25 12:33:12 +00:00			`self._set_field('last_seen', last_seen)`
chg: [crawler + core + cve] migrate crawler to lacus + add new CVE object and correlation + migrate core 2022-10-25 14:25:19 +00:00
			`def update_daterange(self, date):`
			`date = int(date)`
			`# obj don't exit`
			`if not self.exists():`
			`self.set_first_seen(date)`
			`self.set_last_seen(date)`
			`else:`
			`first_seen = self.get_first_seen(r_int=True)`
			`last_seen = self.get_last_seen(r_int=True)`
			`if date < first_seen:`
			`self.set_first_seen(date)`
			`if date > last_seen:`
			`self.set_last_seen(date)`

			`def get_sparkline(self):`
			`sparkline = []`
			`for date in Date.get_previous_date_list(6):`
			`sparkline.append(self.get_nb_seen_by_date(date))`
			`return sparkline`

fix: [trackers] fix pgp yara tracker 2023-05-12 13:43:41 +00:00			`def get_content(self, r_type='str'):`
			`if r_type == 'str':`
			`return self.id`
			`elif r_type == 'bytes':`
			`return self.id.encode()`
chg: [trackers] refactor trackers: track objects + filter by object types/sources/subtypes 2023-05-04 14:35:56 +00:00
chg: [decoded migration] migrate Decoded Objects 2023-01-09 15:03:06 +00:00			`def _add_create(self):`
			`r_object.sadd(f'{self.type}:all', self.id)`

chg: [ocr] ocr daterange object, get ocrs by daterange + fixs 2024-04-25 12:18:22 +00:00			`def _copy_from(self, obj_type, obj_id):`
			`first_seen = r_object.hget(f'meta:{obj_type}:{obj_id}', 'first_seen')`
			`last_seen = r_object.hget(f'meta:{obj_type}:{obj_id}', 'last_seen')`
			`if first_seen and last_seen:`
			`for date in Date.get_daterange(first_seen, last_seen):`
			`nb = r_object.zscore(f'{obj_type}:date:{date}', self.id)`
			`r_object.zincrby(f'{self.type}:date:{date}', nb, self.id)`
			`update_obj_date(first_seen, self.type)`
			`update_obj_date(last_seen, self.type)`
			`self._add_create()`
			`self.set_first_seen(first_seen)`
			`self.set_last_seen(last_seen)`

chg: [chats] add image object + show message image 2023-11-15 13:12:50 +00:00			`def _add(self, date, obj): # TODO OBJ=None`
chg: [crawler + core + cve] migrate crawler to lacus + add new CVE object and correlation + migrate core 2022-10-25 14:25:19 +00:00			`if not self.exists():`
fix: [cve + crawler] fix crawler lacus client refresh + typo 2023-04-05 07:51:42 +00:00			`self._add_create()`
chg: [crawler + core + cve] migrate crawler to lacus + add new CVE object and correlation + migrate core 2022-10-25 14:25:19 +00:00			`self.set_first_seen(date)`
			`self.set_last_seen(date)`
			`else:`
			`self.update_daterange(date)`
chg: [DB Migration] UI: Extract + highlight leaks and trackers match, Data Retention save object first/last date, Refactor Tools 2022-12-19 15:38:20 +00:00			`update_obj_date(date, self.type)`
chg: [crawler + core + cve] migrate crawler to lacus + add new CVE object and correlation + migrate core 2022-10-25 14:25:19 +00:00
chg: [chats] add image object + show message image 2023-11-15 13:12:50 +00:00			`r_object.zincrby(f'{self.type}:date:{date}', 1, self.id)`

chg: [core] merge master + fix object subtype correlation stats 2023-10-12 11:53:00 +00:00			`if obj:`
fix: [daterange object] fix objects by date 2023-06-19 06:55:56 +00:00			`# Correlations`
chg: [core] merge master + fix object subtype correlation stats 2023-10-12 11:53:00 +00:00			`self.add_correlation(obj.type, obj.get_subtype(r_str=True), obj.get_id())`
fix: [daterange object] fix objects by date 2023-06-19 06:55:56 +00:00
chg: [core] merge master + fix object subtype correlation stats 2023-10-12 11:53:00 +00:00			`if obj.type == 'item':`
			`item_id = obj.get_id()`
			`# domain`
			`if is_crawled(item_id):`
			`domain = get_item_domain(item_id)`
			`self.add_correlation('domain', '', domain)`

			`def add(self, date, obj):`
			`self._add(date, obj)`
chg: [crawler + core + cve] migrate crawler to lacus + add new CVE object and correlation + migrate core 2022-10-25 14:25:19 +00:00
			`# TODO:ADD objects + Stats`
chg: [new title object] add new title object + correlation on page title 2023-05-25 12:33:12 +00:00			`def _create(self, first_seen=None, last_seen=None):`
			`if first_seen:`
			`self.set_first_seen(first_seen)`
			`if last_seen:`
			`self.set_last_seen(last_seen)`
chg: [crawler + core + cve] migrate crawler to lacus + add new CVE object and correlation + migrate core 2022-10-25 14:25:19 +00:00			`r_object.sadd(f'{self.type}:all', self.id)`

			`# TODO`
			`def _delete(self):`
			`pass`
chg: [new title object] add new title object + correlation on page title 2023-05-25 12:33:12 +00:00

			`class AbstractDaterangeObjects(ABC):`
			`"""`
			`Abstract Daterange Objects`
			`"""`

chg: [titles] add title IDs and contents search 2023-06-13 13:29:11 +00:00			`def __init__(self, obj_type, obj_class):`
chg: [new title object] add new title object + correlation on page title 2023-05-25 12:33:12 +00:00			`""" Abstract for Daterange Objects`

			`:param obj_type: object type (item, ...)`
chg: [titles] add title IDs and contents search 2023-06-13 13:29:11 +00:00			`:param obj_class: object python class (Item, ...)`
chg: [new title object] add new title object + correlation on page title 2023-05-25 12:33:12 +00:00			`"""`
			`self.type = obj_type`
chg: [titles] add title IDs and contents search 2023-06-13 13:29:11 +00:00			`self.obj_class = obj_class`
chg: [new title object] add new title object + correlation on page title 2023-05-25 12:33:12 +00:00
chg: [titles] add title IDs and contents search 2023-06-13 13:29:11 +00:00			`def get_ids(self):`
chg: [new title object] add new title object + correlation on page title 2023-05-25 12:33:12 +00:00			`return r_object.smembers(f'{self.type}:all')`

chg: [titles] add title IDs and contents search 2023-06-13 13:29:11 +00:00			`# def get_ids_iterator(self):`
			`# return r_object.sscan_iter(r_object, f'{self.type}:all')`

chg: [new title object] add new title object + correlation on page title 2023-05-25 12:33:12 +00:00			`def get_by_date(self, date):`
			`return r_object.zrange(f'{self.type}:date:{date}', 0, -1)`

			`def get_nb_by_date(self, date):`
			`return r_object.zcard(f'{self.type}:date:{date}')`

			`def get_by_daterange(self, date_from, date_to):`
			`obj_ids = set()`
			`for date in Date.substract_date(date_from, date_to):`
			`obj_ids = obj_ids \| set(self.get_by_date(date))`
			`return obj_ids`

			`def get_metas(self, obj_ids, options=set()):`
			`dict_obj = {}`
			`for obj_id in obj_ids:`
chg: [titles] add title IDs and contents search 2023-06-13 13:29:11 +00:00			`obj = self.obj_class(obj_id)`
chg: [new title object] add new title object + correlation on page title 2023-05-25 12:33:12 +00:00			`dict_obj[obj_id] = obj.get_meta(options=options)`
			`return dict_obj`

			`@abstractmethod`
chg: [titles] add title IDs and contents search 2023-06-13 13:29:11 +00:00			`def sanitize_id_to_search(self, id_to_search):`
			`return id_to_search`
chg: [new title object] add new title object + correlation on page title 2023-05-25 12:33:12 +00:00
chg: [titles] add title IDs and contents search 2023-06-13 13:29:11 +00:00			`def search_by_id(self, name_to_search, r_pos=False, case_sensitive=True):`
chg: [new title object] add new title object + correlation on page title 2023-05-25 12:33:12 +00:00			`objs = {}`
chg: [titles] add title IDs and contents search 2023-06-13 13:29:11 +00:00			`if case_sensitive:`
			`flags = 0`
			`else:`
			`flags = re.IGNORECASE`
chg: [new title object] add new title object + correlation on page title 2023-05-25 12:33:12 +00:00			`# for subtype in subtypes:`
chg: [titles] add title IDs and contents search 2023-06-13 13:29:11 +00:00			`r_name = self.sanitize_id_to_search(name_to_search)`
chg: [new title object] add new title object + correlation on page title 2023-05-25 12:33:12 +00:00			`if not name_to_search or isinstance(r_name, dict):`
			`return objs`
chg: [titles] add title IDs and contents search 2023-06-13 13:29:11 +00:00			`r_name = re.compile(r_name, flags=flags)`
			`for obj_id in self.get_ids(): # TODO REPLACE ME WITH AN ITERATOR`
			`res = re.search(r_name, obj_id)`
chg: [new title object] add new title object + correlation on page title 2023-05-25 12:33:12 +00:00			`if res:`
chg: [titles] add title IDs and contents search 2023-06-13 13:29:11 +00:00			`objs[obj_id] = {}`
chg: [new title object] add new title object + correlation on page title 2023-05-25 12:33:12 +00:00			`if r_pos:`
chg: [titles] add title IDs and contents search 2023-06-13 13:29:11 +00:00			`objs[obj_id]['hl-start'] = res.start()`
			`objs[obj_id]['hl-end'] = res.end()`
			`return objs`

			`def sanitize_content_to_search(self, content_to_search):`
			`return content_to_search`

chg: [titles] add endpoints to get all titles 2024-02-15 09:13:06 +00:00			`def get_contents_ids(self):`
			`titles = {}`
			`for obj_id in self.get_ids():`
			`obj = self.obj_class(obj_id)`
			`content = obj.get_content()`
			`if content not in titles:`
			`titles[content] = []`
fix: [api] get titles domain 2024-02-16 10:56:48 +00:00			`for domain in obj.get_correlation('domain').get('domain', []):`
			`titles[content].append(domain[1:])`
chg: [titles] add endpoints to get all titles 2024-02-15 09:13:06 +00:00			`return titles`

chg: [titles] add title IDs and contents search 2023-06-13 13:29:11 +00:00			`def search_by_content(self, content_to_search, r_pos=False, case_sensitive=True):`
			`objs = {}`
			`if case_sensitive:`
			`flags = 0`
			`else:`
			`flags = re.IGNORECASE`
			`# for subtype in subtypes:`
			`r_search = self.sanitize_content_to_search(content_to_search)`
			`if not r_search or isinstance(r_search, dict):`
			`return objs`
			`r_search = re.compile(r_search, flags=flags)`
			`for obj_id in self.get_ids(): # TODO REPLACE ME WITH AN ITERATOR`
			`obj = self.obj_class(obj_id)`
			`content = obj.get_content()`
			`res = re.search(r_search, content)`
			`if res:`
			`objs[obj_id] = {}`
			`if r_pos: # TODO ADD CONTENT ????`
			`objs[obj_id]['hl-start'] = res.start()`
			`objs[obj_id]['hl-end'] = res.end()`
			`objs[obj_id]['content'] = content`
chg: [new title object] add new title object + correlation on page title 2023-05-25 12:33:12 +00:00			`return objs`

			`def api_get_chart_nb_by_daterange(self, date_from, date_to):`
			`date_type = []`
			`for date in Date.substract_date(date_from, date_to):`
			`d = {'date': f'{date[0:4]}-{date[4:6]}-{date[6:8]}',`
			`self.type: self.get_nb_by_date(date)}`
			`date_type.append(d)`
			`return date_type`

			`def api_get_meta_by_daterange(self, date_from, date_to):`
			`date = Date.sanitise_date_range(date_from, date_to)`
chg: [titles] add title IDs and contents search 2023-06-13 13:29:11 +00:00			`return self.get_metas(self.get_by_daterange(date['date_from'], date['date_to']), options={'sparkline'})`