Alle Artikelen
Data-analyse6 min lezen

Uw AI faalt bij wazige foto's. Hier is hoe u het kunt oplossen.

Greg (Zvi) Uretzky

Founder & Full-Stack Developer

Delen
Figure 2: Retrieval performance (Recall@5) degradation in MRAG systems under various imperfect query conditions

Uw AI faalt bij wazige foto's. Hier is hoe u het kunt oplossen.

Uw klant uploadt een wazige foto van een kapotte apparatuur. Uw AI-assistent beveelt met vertrouwen het verkeerde vervangingsonderdeel aan. De klant wordt gefrustreerd. U verliest de verkoop.

Dit gebeurt elke dag. Bedrijven die AI gebruiken voor visuele zoekopdrachten, foto-gebaseerde ondersteuning of documentanalyse verliezen geld. Hun systemen werken perfect met schone, studio-kwaliteit afbeeldingen. Maar ze falen met de rommelige, echte wereldbeelden die klanten daadwerkelijk verzenden.

Wat onderzoekers ontdekten

Onderzoekers van meerdere universiteiten hebben onderzocht waarom AI-systemen falen met onvolmaakte afbeeldingen. Ze publiceerden hun bevindingen in Fix Before Search: Benchmarking Agentic Query Visual Pre-processing in Multimodal Retrieval-augmented Generation.

Ze ontdekten dat huidige AI-zoeksysteem alle afbeeldingen als perfect behandelen. Echte wereldafbeeldingen zijn vaak wazig, scheef of onduidelijk. Denk hierbij aan het geven van een verfrommelde, scheve aanvraagbrief aan een bibliothecaris. Ze zullen waarschijnlijk het verkeerde boek terugbrengen.

Uw AI-gebaseerde visuele zoekopdracht faalt stilzwijgend bij echte klantinteracties. Dit leidt tot verkeerde antwoorden, gemiste verkoop en een slechte gebruikerservaring.

!Figuur 2: Degradatie van de ophalingprestaties (Recall@5) in MRAG-systemen onder verschillende onvolmaakte queryvoorwaarden

Het onderzoek toont aan dat deze "onvolmaakte" visuele queries catastrofale fouten veroorzaken. Een enkele typo in een webzoekopdracht kan minder relevante resultaten opleveren. Een wazige of scheve afbeelding kan ertoe leiden dat de AI volledig ongerelateerde informatie ophaalt. Dit is geen kleine daling in nauwkeurigheid - het is een complete systeemuitval.

De oplossing is simpel: fix de visuele query voordat u zoekt. De onderzoekers noemen dit "agentic visuele pre-processing". Voordat u de verfrommelde brief aan de bibliothecaris geeft, maakt u hem schoon, recht en vult u ontbrekende woorden in. Nu kan de bibliothecaris het juiste boek vinden.

Dit vertegenwoordigt een krachtige verschuiving in het opbouwen van AI-pijplijnen. Voeg een "kwaliteitscontrole en reparatie" stap toe voor afbeeldingen. Deze fix kan uw bestaande AI-investeringen robuuster en waardevoller maken.

Hoe u dit vandaag kunt toepassen

U hoeft niet te wachten op perfecte AI. U kunt visuele pre-processing nu implementeren. Hier zijn vijf concrete stappen om deze week te starten.

Stap 1: Audit uw visuele foutpunten

Eerst moet u begrijpen waar uw AI faalt. Bekijk uw klantinteractielogboeken. Identificeer patronen in mislukte visuele queries.

  • Bekijk mislukte ondersteuningsaanvragen waar klanten afbeeldingen hebben geüpload
  • Analyseer verlaten visuele zoekopdrachten in uw e-commerceplatform
  • Controleer documentverwerkingsfouten waar scanafbeeldingen of -foto's niet leesbaar waren

Bijvoorbeeld kan een retailer in huishoudelijke artikelen ontdekken dat 40% van de "identificeer dit onderdeel" queries faalt wanneer foto's 's nachts met slechte verlichting worden gemaakt. Een bank kan ontdekken dat documentverificatie faalt wanneer ID's onder een hoek worden gefotografeerd.

Stap 2: Kies uw pre-processing tools

Selecteer tools op basis van uw meest voorkomende afbeeldingsproblemen. U heeft geen enkel model nodig voor alles. Begin met wat uw grootste pijn punten oplost.

Voor wazige afbeeldingen: Gebruik super-resolutiemodellen zoals Real-ESRGAN of SwinIR. Voor scheve documenten: Gebruik deskewing-algoritmen of perspectiefcorrectie. Voor slechte verlichting: Gebruik contrastversterking of versterking van lage lichtmodellen. Voor algemene kwaliteit: Begin met basisoperaties van OpenCV (scherpstellen, ruisreductie, rotatie).

De meeste tools zijn beschikbaar als open-source bibliotheken of commerciële API's. Voor snelle tests kunt u Hugging Face's Transformers-bibliotheek met vooraf getrainde modellen proberen.

Stap 3: Integreer de fix-voor-zoekpijplijn

Wijzig uw bestaande AI-werkstroom. Voeg de pre-processing stap toe tussen het ontvangen van de afbeelding en het verzenden ervan naar uw AI-model.

Hier is een eenvoudige architectuur:
```
Klantupload → Afbeeldingspre-processing → Uw AI-systeem → Antwoord
```

Voor een klantenservicechatbot die plantenziektes foto's afhandelt:

  1. Klant uploadt wazige bladfoto
  2. Uw systeem scherpt de afbeelding en corrigeert de kleurenschaal
  3. De verbeterde foto gaat naar uw plantidentificatie-AI
  4. AI retourneert een nauwkeurige diagnose

Begin met één probleemtype. Als wazigheid uw grootste probleem is, implementeert u alleen super-resolutie eerst. Meet de verbetering voordat u meer complexiteit toevoegt.

Stap 4: Train uw team (of uw AI-agent)

Het onderzoek toont aan dat AI-agents kunnen leren om de juiste pre-processing tools te selecteren. U kunt een kleine visuele taalmodel fine-tunen om te herkennen welke fix moet worden toegepast.

!Figuur 3: Toolselectie nauwkeurigheid en parameterscores over modellen. Het rode punt geeft Qwen3-VL-4B-Instruct aan na SFT, terwijl vaste lijnen off-the-shelf modellen vertegenwoordigen.

Bijvoorbeeld verbeterde Qwen3-VL-4B-Instruct aanzienlijk na fine-tuning. Het leerde om te herkennen wanneer een afbeelding rotatie nodig had versus wanneer het helderheidscorrectie nodig had.

U kunt deze aanpak toepassen:

  1. Verzamel voorbeelden van uw problematische afbeeldingen
  2. Label welke pre-processing bewerking elke afbeelding nodig heeft
  3. Fine-tune een open-source model zoals Qwen3-VL of LLaVA
  4. Implementeer het als uw "afbeeldingskwaliteitsrouter"

Dit creëert een intelligent systeem dat afbeeldingen fixt voordat het zoekt.

Stap 5: Meet en iterateer

Volg specifieke metrics voordat en na implementatie. Meet niet alleen de algehele nauwkeurigheid. Meet nauwkeurigheid op eerder falende gevallen.

Sleutelmetrics om te volgen:

  • Visuele query succespercentage: Percentage van afbeeldingsgebaseerde queries die correcte resultaten retourneren
  • Eerste contactoplossing: Voor ondersteuning, hoe vaak de AI het goed krijgt bij de eerste poging
  • Conversiepercentage: Voor e-commerce, hoe vaak visuele zoekopdrachten leiden tot aankopen
  • Verwerkingstijd: Toegevoegde latentie van pre-processing (streef naar <500ms)

Stel A/B-testing in. Routeer 50% van de queries door uw nieuwe pijplijn. Vergelijk resultaten met de oude aanpak. Als u significante verbetering ziet, implementeert u het volledig.

Waar u op moet letten

Deze aanpak heeft beperkingen. Wees zich bewust van deze drie risico's.

1. Geen universele fix-all model. Het onderzoek benchmarkt de noodzaak van pre-processing. Het biedt geen enkel model dat elk probleem oplost. U moet modellen kiezen of trainen voor uw specifieke imperfecties. Document scanafbeeldingen hebben andere fixes nodig dan gebruikersgeüploade foto's.

2. Toegevoegde latentie en kosten. Elke pre-processing stap voegt tijd toe. Sommige verbeteringsmodellen zijn computationeel duur. Test uw pijplijnssnelheid met realistische verkeer. Overweeg het gebruik van geoptimaliseerde modellen of hardwareversnelling.

3. Potentieel voor over-processing. Soms kan het "fixen" van een afbeelding belangrijke details verwijderen. Een model kan te veel scherpstellen of kleuren onjuist wijzigen. Valideer altijd of uw verbeteringen daadwerkelijk de downstream nauwkeurigheid verbeteren, niet alleen om afbeeldingen er beter uit te laten zien voor mensen.

!Figuur 9: Flip-geval: Verticale flipping keert spatiale semantiek om en verstoort feature-alignering. De SFT-agent past correct 𝒯flip met richting "verticaal" toe om de oorspronkelijke oriëntatie te herstellen.

De figuur hierboven toont een geslaagde correctie. Een verticaal geflipde afbeelding verstoort de AI's begrip. De fine-getunede agent past correct een verticale flipcorrectie toe om de oorspronkelijke oriëntatie te herstellen.

Uw volgende stap

Begin klein. Deze week identificeert u één visueel falenpatroon in uw bedrijf.

Is het wazige productfoto's? Scheve document scanafbeeldingen? Slecht verlichte ondersteuningsafbeeldingen? Kies één probleemtype dat de meeste klantfrustratie of verloren verkoop veroorzaakt.

Implementeer een enkele pre-processing fix voor dat probleem. Gebruik een open-source model of eenvoudige afbeeldingsverwerkingsbibliotheek. Test het op 100 echte voorbeelden. Meet of het uw AI's nauwkeurigheid verbetert.

Dit gaat niet over het bouwen van perfecte AI. Het gaat over het maken van uw bestaande AI betrouwbaar met echte wereldgegevens. De fix is eenvoudiger dan u denkt: maak de afbeelding schoon voordat u zoekt.

Vraag voor uw team: Wat percentage van uw visuele queries faalt momenteel vanwege afbeeldingskwaliteitsproblemen? Vind dat nummer deze week - het zal u schokken.

AI image processing failsfix blurry photo AIvisual pre-processing pipelineAI accuracy improvementmultimodal AI solutions

Reacties

Loading...

Van Onderzoek Naar Resultaat

Bij Klevox Studio helpen we bedrijven om baanbrekend onderzoek om te zetten in praktische oplossingen. Of u nu AI-strategie, automatisering of maatwerksoftware nodig heeft — wij maken complexiteit tot concurrentievoordeel.

Klaar om te beginnen?