Publication detail

Distribuované zpracování a analýza dat ze sociálních sítí - Návrh a implementace distribuované architektury

BURGET, R.

Original Title

Distribuované zpracování a analýza dat ze sociálních sítí - Návrh a implementace distribuované architektury

English Title

Distributed Processing and Analysis of the Social Network Data - Design and Implementation of a Distributed Architecture

Type

report

Language

Czech

Original Abstract

Současné metody rekonstrukce a forenzní analýzy aktivity uživatelů se zaměřují prakticky výhradně na analýzu lokáních počítačů. Stále rostoucí popularita sociálních sítí ale způsobuje, že se stále více aktivit přesouvá právě na sociální sítě. Je proto nezbytné rozšířit analyzovanou časovou osu i o informace o aktivitách na sociálních sítích. V takovém případě je však nutné analyzovat velké množství zdrojů (např. profilů na sociálních sítích) a tedy získat a dále zpracovat velké množství dat. Je tedy nutné navrhnout škálovatelné řešení jak pro získávání, tak pro další analýzu dat ze sociálních sítí. V této technické zprávě se zaměřujeme na analýzu existujících modelů časové osy, existujících souvisejících softwarových řešení pro distribuované zpracování velkého množství dat a zejména na návrh architektury nástroje pro rekonstrukci a analýzu časové osy v distribuovaném prostředí. Rovněž se zabýváme implementací navrženého nástroje na platformě Apache Hadoop.

English abstract

Current methods of reconstruction and forensic analysis of user activity focus almost exclusively on local computer analysis. However, the increasing popularity of social networks causes more and more activities to be transferred to social networks. It is therefore necessary to extend the analyzed timeline to include information on activities on social networks. In such a case, however, it is necessary to analyze a large amount of resources (e.g. social network profiles) and thus obtain and further process a large amount of data. It is therefore necessary to propose a scalable solution for both acquiring and further analyzing social network data. In this technical report, we focus on analyzing existing timeline models, existing related software solutions for distributed large amounts of data processing, and in particular the design of a tool for reconstructing and analyzing timeline in a distributed environment. We also deal with the implementation of the proposed tool on the Apache Hadoop platform.

Keywords

forenzní analýza, analýza událostí, Apache Hadoop

Key words in English

forensic analysis, timeline analysis, Apache Hadoop

Authors

BURGET, R.

Released

10. 12. 2018

Publisher

Fakulta informačních technologií VUT v Brně

Location

FIT-TR-2018-07, Brno

Pages count

22

URL

BibTex

@techreport{BUT161936,
  author="Radek {Burget}",
  title="Distribuované zpracování a analýza dat ze sociálních sítí - Návrh a implementace distribuované architektury",
  year="2018",
  publisher="Fakulta informačních technologií VUT v Brně",
  address="FIT-TR-2018-07, Brno",
  pages="22",
  url="https://www.fit.vut.cz/research/publication/11883/"
}