Publication detail

Klasifikace prvků dokumentu na základě vizuálních rysů

KUNC, M. BURGET, R.

Original Title

Klasifikace prvků dokumentu na základě vizuálních rysů

English Title

Document Element Classification Based on Visual Features

Type

article in a collection out of WoS and Scopus

Language

Czech

Original Abstract

Příspěvek se zabývá vizuální segmentací webových stránek a následnou klasifikací detekovaných oblastí na základě jejich vizuálních vlastností. Segmentace, tedy detekce vizuálního členění stránky, je založena na bottom-up analýze stránky společně s analýzou vizuálně významných prvků a jejím výsledkem je model vizuálního členění zpracovávaného dokumentu. Samotná klasifikace potom využívá informace o vzájemné poloze oblastí a jejich vizuálních vlastnostech, které jsou v tomto modelu obsaženy. Příspěvek se dále zbývá experimentálním porovnáním dvou klasifikačních algoritmů pro daný účel na různých množinách dat.

English abstract

This paper deals with the visual segmentation of web documents and subsequent classification of the detected areas based on their visual attributes such as the mutual area positions, font properties and colors. We present an experimental evaluation of two classification algorithm for different data sets.

Keywords

klasifikace dokumentů, vizuální informace, segmentace

Key words in English

document classification, visual information, segmentation

Authors

KUNC, M.; BURGET, R.

RIV year

2008

Released

13. 2. 2008

Publisher

Vydavateľstvo STU

Location

Bratislava

ISBN

978-80-227-2827-0

Book

Znalosti 2008

Pages from

347

Pages to

350

Pages count

4

URL

BibTex

@inproceedings{BUT27763,
  author="Michael {Kunc} and Radek {Burget}",
  title="Klasifikace prvků dokumentu na základě vizuálních rysů",
  booktitle="Znalosti 2008",
  year="2008",
  pages="347--350",
  publisher="Vydavateľstvo STU",
  address="Bratislava",
  isbn="978-80-227-2827-0",
  url="https://www.fit.vut.cz/research/publication/8564/"
}

Documents