Knihovna dlib: Cesta do světa zpracování obrazu

V tomto článku se dozvíte, jak knihovna dlib, známá svými schopnostmi rozpoznávání obličejů a detekce objektů, využívá metodu HOG (Histogram of Oriented Gradients) a SVM (Support Vector Machines) k transformaci obrázků na vektory pro pokročilou analýzu. Zjistěte jak knihovna dlib zvládá určit, které obrazy jsou podobné a které nikoliv.

Ladislav Husty

Research Scientist and AI Engineer at Moravio

September 16, 2024

min read

Knihovna dlib: Cesta do světa zpracování obrazu

Úvod do dlib

V oblasti počítačového vidění a zpracování obrazu vyniká dlib jako výkonná a všestranná knihovna. Je známá pro svou efektivitou při rozpoznávání obličejů, detekci objektů a porozumění obrazu. Jednou z příčin její efektivity je využití metody HOG (Histogram of Oriented Gradients) - výkonného nástroje pro popis obrázků.

Porozumění metodě HOG

Orientované gradienty a jejich význam

Představte si, že se pohybujete v kopcovitém terénu. Svahy, na které narazíte, se podobají gradientům intenzity v obraze - čím jsou strmější, tím je změna intenzivnější. Orientované gradienty? Představte si tyto změny nejen v intenzitě, ale také ve směru. Tyto orientace nám pomáhají zachytit jedinečné rysy, které činí krajinu nebo obraz výraznými.

Histogramy

Histogramy je možno si představit jako mapu toho, jak často se s těmito sklony v různých směrech setkáváte. Je to jako označit si, kolik strmých kopců najdete směrem na sever, jih, východ nebo západ. Z hlediska obrázků pomáhá dlib pochopit, kde se vyskytují "vzestupy a pády".

Proč orientovaný gradient pro popis obrázku?

Použití orientovaných gradientů umožňuje jemnější zobrazení obrázků. Umožňuje identifikovat vzory a hrany, takže je obzvláště efektivní v úlohách, jako je detekce objektů a rozpoznávání obličejů. Metoda HOG vyniká při zachycování charakteristických rysů, které definují objekty nebo obličeje v obraze.

Metoda podpůrných vektorů

V angličtině Support Vector Machines(SVM) je metoda strojového učení, sloužící pro klasifikaci. Představte si SVM jako porotce v soutěži talentů. Učí se na základě pozorování výkonů (vzorů) zjištěných metodou HOG a stává se profesionálem v rozlišování různých výkonů (objektů nebo tváří). Díky SVM je dlib například schopno lépe určit, zda se na obrázku vyskytuje člověk nebo pes. Je to mozek, díky němuž je rozpoznávání obrazu v dlib chytřejší.

Porovnávání obrázků pomocí vektorové vzdálenosti

K určení podobnosti nebo nepodobnosti mezi obrazy využívá dlib výpočet vzdáleností mezi jejich vektorovými reprezentacemi. Jak ale spočítat vzdálenost mezi dvěma úsečkami (což vektory v podstatě jsou)?

V oblasti vektorů zahrnuje měření vzdálenosti trochu matematiky. Představte si, že máte dva vektory představující obrazy a chcete zachytit prostor mezi nimi. Dlib toho dosáhne tak, že odečte jeden vektor od druhého a vytvoří nový vektor, který obsahuje "rozdíl" mezi oběma. Pak se vezme norma tohoto výsledného vektoru, což je jako měření délky šipky směřující od jednoho obrázku k druhému. Čím je šipka kratší, tím jsou si obrázky podobnější; čím je šipka delší, tím jsou odlišnější. Tato metrika vzdálenosti, často využívající techniky jako Euklidovská vzdálenost, kvantifikuje nepodobnost v rozsáhlém prostoru obrazových prvků.

Příklad porovnání podobnosti dvou vektorů pomocí euklidovské vzdálenosti. V prvním případě (vektory v) vidíme, že norma (což je v podstatě délka) výsledného vektoru je mnohem větší než výsledný vektor z druhého případu (vektory u). Počáteční vektory v₁ a v₂ jsou si tedy podobnější než vektory u₁ a u₂.

Od obrazu k vektorové reprezentaci

Shrneme-li celý proces, dlib vezme obrázek, rozdělí jej na orientované gradienty pomocí metody HOG, vytvoří histogramy pro reprezentaci těchto gradientů a použije SVM pro klasifikaci. Konečným výstupem je vektorová reprezentace, kompaktní forma, která obsahuje základní vlastnosti obrázku.

Využití dlib v praxi

Zajímají vás reálné aplikace dlib? Přečtěte si naši případovou studii, kde jsme dlib použili ke značnému urychlení procesu castingu herců. Je to ukázka toho, jak dlib v reálném světě mění pixely v praktické poznatky.
Ať už se touláte po kopcích, nebo hodnotíte talentovou soutěž, dlib vám bude přátelským průvodcem, který odhalí příběhy skryté v obrázcích a učiní složitý svět zpracování obrazu o něco přívětivějším pro člověka.

Proměna webových zážitků pomocí MediaPipe a JavaScriptu: Komplexní hluboký ponor do problematiky

minut na čtení

September 5, 2023

Tento článek se zabývá bezproblémovým spojením JavaScriptu a frameworku MediaPipe společnosti Google a ukazuje jejich společný potenciál na praktických příkladech kódu, reálných případech použití a návodech krok za krokem pro vytváření inovativních webových aplikací, zejména v oblasti rozšířené reality (AR), s rozšířenými interaktivními funkcemi.

Přečtěte si více

Moravio se stalo členem České asociace pro umělou inteligenci

minut na čtení

January 17, 2025

Pro nás v Moravio je to velký krok vpřed. Být součástí této komunity nám pomůže učit se od ostatních odborníků, sdílet naše zkušenosti a vytvářet ještě lepší řešení na bázi umělé inteligence pro naše klienty.

Přečtěte si více

Proč outsourcovat vývoj v České republice

minut na čtení

January 27, 2021

Vývojáři v České republice jsou považování za jedny z nejlepších na světě, a proto řada společností stále častěji směřuje vývoj svých velkých i malých projektů právě do naší země.

Přečtěte si více

New articles

New blog posts you may be interested in

Postřehy a možnosti v automatizaci náboru od Jiřího Kostova

minut na čtení

November 26, 2024

Náš HR Manager sdílí poznatky o tom, jak jsme automatizovali náborové procesy ve společnosti Moravio. Vysvětluje, jak jsme optimalizovali naše interní pracovní postupy a pomohli klientům implementovat efektivní automatizovaná řešení pro jejich podnikání. Objevte přístupy, které fungují, a příležitosti, které může automatizace náboru odemknout.

Přečtěte si více

Jak jsme centralizovali naše data pro chytřejší rozhodování pomocí BI

minut na čtení

October 21, 2024

Pavel Janko, Head of Delivery v Moravu, se s vámi podělí o to, jak jsme díky centralizaci dat pomocí BI zlepšili rozhodování a zefektivnili naši práci.

Přečtěte si více

Projektové řízení: Mezi flexibilitou a omezenými zdroji

minut na čtení

October 10, 2024

Hsinyu Ko sdílí své postřehy k hledání rovnováhy mezi požadavky na flexibilní řízení projektů a efektivní využití zdrojů

Přečtěte si více

Knihovna dlib: Cesta do světa zpracování obrazu

Ladislav Husty

Table of contents

Úvod do dlib

Porozumění metodě HOG

Orientované gradienty a jejich význam

Histogramy

Proč orientovaný gradient pro popis obrázku?

Metoda podpůrných vektorů

Porovnávání obrázků pomocí vektorové vzdálenosti

Od obrazu k vektorové reprezentaci

Využití dlib v praxi

Proměna webových zážitků pomocí MediaPipe a JavaScriptu: Komplexní hluboký ponor do problematiky

Moravio se stalo členem České asociace pro umělou inteligenci

Proč outsourcovat vývoj v České republice

Postřehy a možnosti v automatizaci náboru od Jiřího Kostova

Jak jsme centralizovali naše data pro chytřejší rozhodování pomocí BI

Projektové řízení: Mezi flexibilitou a omezenými zdroji

Přemýšlíte o projektu? Napište nám.

Napsat zprávu

Zarezervujte si schůzku

Jakub Bílý