Project R-10429

Titel

Diep-Leren ondersteunde algoritmen en architecturen voor het efficiënt opzoeken van beelden in inhoudsgebaseerde productdatabanken aan de hand van een of enkele voorbeeldopnamen. (Onderzoek)

Abstract

Met de ontwikkeling van beeldverwerking en computer visie technologie zijn inhoud-gebaseerde product zoekopdrachten op grote schaal toegepast in ons leven, voorbeelden zijn online winkelen, automatische kassasystemen, en intelligente logistiek. Gegeven een gevraagde productafbeelding voeren huidige product zoeksystemen hoofdzakelijk het ophaalproces uit op vooraf getrainde gegevensbanken die een vast aantal productklassen hebben. In recent CNN-gebaseerde studies gebruiken veel onderzoekers vooraf getrainde modellen, fijn afgestelde modellen en hybride modellen voor het verkrijgen van robuuste kenmerken in het proces van de afbeelding zoekopdracht. Echter, als we niet genoeg gelabelde gegevens hebben, hoe moeten we dan een robuuste CNN voor afbeeldingen verkrijging, trainen en hoge prestaties bekomen? Om dit probleem op te lossen, delen we het probleem op in 4 kleinere problemen. 1. Het eerste is afbeelding gegevensverwerving. Voor dit probleem verkennen we een gecombineerde methode van fysieke polarisatie en het Fresnel verblindingsreductie algortime. 2. Het tweede is de CNN kenmerk extractie en afbeeldingsvoorstelling. Voor dit probleem, om een goede afbeeldingsvoorstelling te bekomen, extraheren we de kenmerken van meerdere diepe modellen en van meerdere lagen van individuele modellen en integreren we deze om de afbeeldingsvoorstelling te verkrijgen. 3. Het derde probleem is few-shot afbeelding verkrijgend leren. Voor dit probleem nemen we een few-shot toenemend product zoek kader over met meta-leren, welke heel weinig geannoteerde afbeeldingen nodig heeft en een aanvaardbare trainingstijd heeft. 4. Het vierde probleem is twee dimensionale afbeeldingsvoorstelling. Om dit probleem op te lossen gebruiken we een matrix factorisatie principe om zo de matrix te vereenvoudigen via coëfficiënten correlatie. Globaal kunnen we few-shot lerende methoden gebruiken om het gebrek aan voldoende trainingsgegevens van een sterk CNN model te overkomen. Few-shot leren is het bekomen van kennis uitgaande van heel weinig gelabelde voorbeelden waarbij in huidig onderzoek voornamelijk gefocust wordt op afbeeldingsclassificatie en niet op afbeelding verkrijging. Verder zullen we meta leren (betekent leren leren) gebruiken voor het verkennen van few-shot afbeelding verkrijging voor een onderscheidende afbeeldingsvoorstelling. Daarom zullen we few-shot leren toepassen op een nieuw domein namelijk 'DDiep-Leren ondersteunde algorithmen en architecturen voor het efficient opzoeken van beelden in inhoudsgebaseerde productdatabanken aan de hand van een of enkele voorbeeldopnamen'.

Periode

01 januari 2020 - 31 december 2020