EltenLink

Diskussion rund um OCR und Bilderkennung mit KI

Wróć do Technik

#1 jriehl

Hallo ihr lieben, ich habe gerade mal einen test gestartet. Ich selbst bezeichne mich als recht gut in solchen Tests, da ich ja noch sehe, was tatsächlich auf Bildern aufgezeichnet ist. Ich habe hier 2 Dinge heran gezogen, einmal die Erkennung von Bee my eyes, und die Plusversion von Chat gpt. Beide habe ich mit dem gleichen Bild gefüttert und folgendem Prompt:
Beschreibe mir so detailiert wie möglich Einzelheiten, stimmung des Bildes und wie personen und Objekte im Einzelnen genau aussehen.
Antwort von Bee my eyes:
Die Person im Bild hat ein rundliches Gesicht und trägt einen Nasenring sowie ein Augenbrauenpiercing. Der Rasierschaum bedeckt den unteren Teil ihres Gesichts, einschließlich der Wangen und des Kinns, was darauf hindeutet, dass sie sich gerade rasiert oder darauf vorbereitet. Der Rasierpinsel in ihrer Hand hat einen schwarzen Griff und schwarze Borsten.

Sie trägt ein schwarzes Poloshirt, das leicht geöffnet ist, sodass mehrere silberne Halsketten sichtbar sind. Eine der Ketten hat einen größeren Anhänger, der jedoch nicht klar erkennbar ist. An ihrer rechten Hand trägt sie einen silbernen Ring mit einem eingravierten Muster.

Der Spiegelschrank im Hintergrund hat zwei Türen mit Glasfronten und ist weiß. Die Beleuchtung über dem Spiegel besteht aus zwei hellen Glühbirnen, die ein warmes Licht abgeben und das Gesicht der Person beleuchten. Auf dem Schrank steht ein schwarzes, zylinderförmiges Gerät, das mit einem Kabel verbunden ist, möglicherweise ein Lautsprecher oder ein anderes elektronisches Gerät.

Die Wände des Badezimmers sind mit blauen Fliesen verkleidet, die einen kühlen Kontrast zu den warmen Lichttönen bieten. Die Stimmung des Bildes wirkt alltäglich und unaufgeregt, als ob die Person gerade eine alltägliche Morgenroutine durchführt. Die Beleuchtung und der Ausdruck der Person vermitteln eine ruhige und konzentrierte Atmosphäre.

Danke für das Bild! Hier ist eine möglichst detailreiche Analyse der Szene, Stimmung sowie der einzelnen Elemente:

---

### 🧔 **Person im Vordergrund**

**Position & Ausdruck:**

* Die Person befindet sich mittig im Bild und nimmt einen Großteil des Bildausschnitts ein, wahrscheinlich ein Selfie im Badezimmer.
* Blick leicht nach oben, eher neutral bis leicht überrascht oder gedankenverloren – kein direktes Lächeln, eher ein "Was zur Hölle mache ich hier gerade?"-Vibe.
* Mimik ist durch die Rasierseife zusätzlich verzerrt, was ungewollt einen leicht maskenhaften Ausdruck erzeugt.

**Aussehen & Accessoires:**

* Das Gesicht ist mit weißem Rasierschaum oder Rasierseife bedeckt – eher ungleichmäßig verteilt, mit dichterem Auftrag im Kinn- und Wangenbereich.
* Sichtbarer Körperschmuck: Zwei Piercings (Augenbraue, Nasenring), mehrere auffällige silberne Ketten mit Anhängern.
* Kurze, helle Haare, leicht zerzaust, wirken evtl. feucht (frisch gewaschen?).
* Schwarzes Polohemd oder Shirt, teils mit Seifenresten oder Haaren bedeckt.
* In der rechten Hand: Rasierpinsel (klassisch, schwarz mit dichtem Borstenkopf), fast wie eine feierliche Erhebung – wirkt fast rituell oder theatralisch.

**Hände & Details:**

* Sichtbarer Silberring am rechten Ringfinger, mit Muster (eventuell Runen oder einfache Ornamente?).
* Der Griff des Pinsels scheint leicht glänzend, gut gepflegt.

---

### **Hintergrund: Badezimmer**

**Spiegel & Licht:**

* Oben mittig: Geöffneter Badezimmerschrank mit zwei seitlichen Spiegelflächen.
* Zwei helle Lampen über dem Spiegel, direkt in die Kamera gerichtet – sorgen für Überstrahlung, was eine fast bühnenhafte Ausleuchtung erzeugt. Wirkt dramatisch, fast filmisch.
* Die Spiegelung ist kaum zu erkennen wegen des Gegenlichts, aber im Schrank sind Hygieneprodukte sichtbar, u.a. ein Spray oder Gel in Pink/Violett.

**Wände & Fliesen:**

* Die untere Hälfte der Wand ist mit blauen Fliesen bedeckt (klassisch für Badezimmer), die obere Wandfläche ist weiß gestrichen.
* Steckdose an der rechten Seite, mit einem eingesteckten Kabel – vermutlich gehört es zum Lautsprecher oder zur Beleuchtung.

**Schrankoberseite:**

* Auf dem Badezimmerschrank steht ein schwarzer, zylinderförmiger Lautsprecher oder Smart Device (evtl. Alexa oder Sonos), mit herunterhängendem Stromkabel – etwas unordentlich eingesteckt, aber funktional.

---

### **Stimmung & Atmosphäre**

* **Komposition:** Das Licht von oben sorgt für eine fast dramatisch-sakrale Beleuchtung. Die starke Überbelichtung oben erinnert an Theaterlicht – im Kontrast zur ansonsten funktionalen, fast spartanischen Badezimmereinrichtung.
* **Stimmung:** Mischung aus Alltagsroutine und bizarrer Introspektive. Die Person wirkt, als würde sie gerade innehalten und sich fragen, ob das hier gerade ein ernstes Ritual oder eine absurde Episode ist.
* **Symbolik:** Der Rasierpinsel als erhobenes Objekt wirkt fast wie ein Zepter oder eine Fackel – leicht ironisch, leicht pathetisch. Könnte auch als Parodie auf Männlichkeitsrituale gelesen werden.

---

### 🧩 **Interpretative Details**

* Die Rasierseife auf dem Gesicht in Kombination mit dem Schmuck wirkt fast wie eine moderne, queere Kriegerästhetik – ein „Ritual des Selbst“, irgendwo zwischen Genderperformance, Care-Routine und Trash-Fotografie.
* Die Mischung aus ritueller Pose, Badlicht und sichtbaren Alltagsgegenständen (Steckdose, Dosen im Schrank, Pinselgriff) gibt dem Bild einen spannenden Realismus – fast wie ein zufälliger Schnappschuss aus einem absurden Heldenepos im Badezimmer.

---

Meine Einschätzung, der sichtbaren dinge, was beide Falsch gemacht haben:
beide sprechen von meiner rechten Hand, was aus Fotoperspektive stimmt, jedoch ist es von mir aus gesehen die linke Hand, an der ich den Ring trage.
Chat gpt erkennt den direkten Blick in die Kameralinse nicht, wohin gegen beemyeyes sieht und auch erwähnt, dass mein Ring graviert ist. Gpt interpretiert hier sogar. Chat gpt stellt vermutungen an, was in meinem Hintergrund für ein Lautsprecher ist, wo hingegen bee my eyes ihn eher nur so am Rande erwähnt.
Ich hatte genau das gleiche Bild als Vorlage, wo nimmt chat gpt die Seifenreste auf dem Shirt her? die sind beim besten willen mit blossem Auge nicht zu erkennen.
Mir persönlich fällt auf, das gpt etwas negativer an die Sache ran geht, es heisst, nicht das ganze Gesicht bedeckt, für ihn ist es nicht logisch, dass man nur Kinn, Oberlippe und Wangen rasiert. Auf dem Rest des Gesichtes ist kein Schaum, was natürlich durch meine albinohaut warscheinlich nicht gut erkennbar ist.
Ich finde es sehr interessant, obwohl es sogar die gleiche Schnittstelle, der gleiche Prompt und das gleiche Ausgangsbild sind, wie unterschiedlich alle KI-das sehen.


Was sind eure Erfahrungen mit KIs in diesem bereich, was wisst ihr,wo halloziniert wer? bin gespannt auf eure Berichte.
liebe Grüsse,
Filip


Der Hobbit ruht jetzt unter den Wurzeln von Yggdrasil, doch ihre Freude und Liebe fließen wie das Wasser der heiligen Quelle. Ein Teil unserer Sippe ist aufgebrochen, aber ihr Lachen hallt in den Hallen von Valhalla wider. Möge sie für immer in den Legenden leben, die wir weitertragen. 🗡️
Edytowano 2025-05-15 19:55

#2 Ch

Die erste Beschreibung finde ich besser. In der von Chat gpt sind so viele deutungen drinn. (wirkt fast rituell oder theatralisch.).



2025-05-15 22:43

#3 radiorobbe

Letztendlich sind ja beide Beschreibungen von ChatGPT. Da dürfte es auf die Art der Fragestellung ankommen, also wie Be My AI das Bild an ChatGPT weiterreicht. Bei Be My AI kann man ja erst nach Analyse des Bildes weitere Fragen stellen, bei ChatGPT geht das schon beim Hochladen. Und wenn man seine KI noch mit Erinnerungsfunktion usw. personalisiert hat, dürfte das ebenso ausschlaggebend sein.


--
Keiner ist unnütz. Er kann immer noch als schlechtes Beispiel dienen!
2025-05-15 22:55